2018年5月4日金曜日

Rでオイラー法を解く


#one reaction
step_num <- 10000
dt <- 0.001
S_initial <- 100
P_initial <- 0
k1 <- 1
S <- numeric(step_num+1)
P <- numeric(step_num+1)
t <- numeric(step_num+1)
S[1] <- S_initial
P[1] <- P_initial
t[1] <- 0
for (i in 1:step_num){
  S[i+1] <- S[i] - k1 * S[i] *dt
  P[i+1] <- P[i] + k1 * S[i] *dt
  t[i+1] <- t[i] + dt
}
plot(t, S, ylim =c(0,120))
points(t, P, col="red")

2018年4月8日日曜日

ZWF

グルコース6リン酸を酸化して6-ホスホグルコン酸に変換する酵素タンパク質(グルコース6リン酸脱水素酵素, glucose 6-phosphate dehydrogenase, G6PDH)をコードする遺伝子記号は、伝統的にZWFあるいはzwfなどと表記されます。他の酵素遺伝子の記号は、pgi = phosphoglucoisomerase, hxk = Hexokinaseのように反応名の略称の場合が多いのでふしぎだなと思っていたのですが、とある総説が答えを教えてくれました。

Stincone et al. The return of metabolism: biochemistry and physiology of the pentose phosphate pathway.Biol Rev Camb Philos Soc. 2015 Aug;90(3):927-63.

がん代謝のワールブルグ効果で有名なドイツのOtto Warburgが1935年ころの一連の論文で電子運搬体としてNADH, NADPHが存在すること、グルコース6リン酸を酸化して6-ホスホグルコン酸に変換する酵素はNADP+を電子受容体として要求すること、酵母からこの酵素を精製してZwischenferment ('intermediate enzyme'という意味らしい)と名付けたことが由来だそうです。
あと、この論文のタイトルかっこいいですな。。スターウォーズの初期3部作の最後ジェダイの帰還”Return of the Jedi”の引用なのかしらと思って調べてみたら、そもそもがトールキンの指輪物語3部作の最後”The Return of the King”の引用で(中学校で読んだぞ、懐かしい)、たぶんこれも何かの引用なんでしょうか、、あとこの総説が3部作になっているの??

2018年3月29日木曜日

林業的バイオプロダクション

バイオプロダクション、というのは植物が光合成で固定した炭素(バイオマス)を微生物の代謝能力で有用な化合物、例えば燃料やプラスチック原料に変換しよう。というものです。工学的な発想だと、でかい石油化学コンビナートの原料を石油からバイオマスに、触媒を微生物に変換したらいいじゃん。と考えます。この工業的バイオプロダクションがバイオプロダクション技術の背景にある基本思想といっていいでしょう。地下から湧き出て輸送効率がいい石油が原料なら、一か所にでかい設備を作るのが正解ですが、問題は、バイオマスというのは地理的に薄く広がった資源である。ということと、再生可能とはいえ、再生には時間がかかるということ、軽くて運搬するエネルギーがもったいないということと、バイオマスの運搬=土地から栄養素を奪うことにつながることだと思います。
工業的なバイオプロダクションがあるなら、農業的なバイオプロダクションというのもありじゃんと思います。けど、特に食料自給率の低い日本のような国では食べ物を作れる土地があるなら食べ物を作ったほうがいいですよね。
となると、残るは林業的バイオプロダクションです。そもそも、石炭石油の時代が来るまでは、山から切って来た木で燃料をまかない、いまならプラスチックで作るようなものもみな、木や竹を加工して作っていたのです。植物が光合成で固定した炭素(バイオマス)を微生物変換抜きで直接使っていたといえるでしょう。ただ、木を資源として復活させるには、切ってきて山の下まで運ぶのがとっても大変だというむつかしい問題があります。植物の光合成とは、光エネルギーを還元力(電気)あるいは化学エネルギーに変換し(光反応)、ついでそれらを利用して炭素を固定します。炭素として固定されちゃうと運ぶのが大変なので、
・林道沿いの木の樹冠に安価な太陽電池パネル(シート)をかぶせる感じでドローンで敷設する。太陽電池パネルからは電線で電気を集める(できれば太陽電池パネル(シート)と電線は生分解性のものがよい。10年くらいでだめになり、そのうち土に返ってほしい)。木が光合成に使う光エネルギーを一部電気として使わせてもらう。
・それから植物で発電ができる可能性があるらしい。山全体でやればいいじゃん。
・発電した電気は中山間地のエネルギーとして利用する。
・あまった電気は、エコひーぽんみたいな小型プラントに送りこむ。その中では電極から受けとった電子で炭素固定ができる微生物が炭素固定を行い、プラスチック原料へと変換する=微生物蓄電とする。
・固定したプラスチック原料がある程度たまったら、回収して地方中核都市にある工業的バイオプロダクション施設に売り払う。
・山の中に住んでるやつが、最後は勝つ。
という林業的なバイオプロダクションは、ありえませんかね。

2018年1月14日日曜日

データベース検索はヌル分布

たとえば、万引き犯を捕まえる役になったとしましょう。
万引き集団100人がお店にやってきて被害を受けました。ブラックリストを作りたいので防犯カメラに犯人のそれぞれの写った特徴から、お店の顧客リストと照合して犯人を特定すればいいじゃんと考えます。

そこで、ある基準で万引き集団100人と全顧客の特徴の類似度をすべて計算して、ある閾値以上の類似度だったら、あたりとして探索してみました。

そうすると、
x 該当する顧客が1名当てはまった犯人 x人
y 該当する顧客が1名以上当てはまった犯人 y人
z 該当する顧客が1人も当てはまらなかった犯人 z = 100-x-y人
の結果が得られます。

この結果を基に、お店の顧客をブラックリストに載せていいものでしょうか?

ここで考えるべき点は、間違っていたらおおごとだという点です。どうしても防犯カメラの特徴からだけでは、特定は難しいので

1.本当は犯人ではない顧客(シロ)を、誤ってクロとしてしまった可能性(偽陽性)

はあり得ます。そもそも y のように該当する顧客が二名以上当てはまったということは偽陽性がおきていたということです。

じゃあ、閾値を厳しくすると、

2.本当は犯人の顧客(クロ)を、誤って見逃す(シロ)する可能性(偽陰性)

がふえてしまいます。

そこで、とある識者に相談してみました。識者は、
お店の顧客リストに載っている100人を仮想的に犯人と見なし、このお客さんの防犯カメラ画像をつかって、同じ作業をしたところ、類似度トップ3に90%の割合で正解が入っているから、類似度を調べる方法としてはこれでいいのではないだろうか?
ということを教えてくれました。

この識者からの情報は一見意味ありげですが、すぐあまり役に立たないことがわかります。最大の問題点は、
3.お店の顧客リストに犯人がふくまれているのかそもそもわからない点にあります(カバー率)。従って、実際は、類似度トップ3に90%の割合で正解が入っていることはまったく保証されません。

4.こうなると、類似度の閾値の相対的な大小(トップ3)とかではなく、類似度の絶対値で判定するしかありません。

こういう不思議なことをいう識者はあまりいないとおもいますが、だまされないようにしなくてはならないですね、、、、自分で自分が何を言っているのかわかってない、、んですかね、、

そこで、別に相談してみました。するとこういうことをしてみよう。と言っています。

5.お店の顧客リストに"載っていない"ことがわかっている10000人の、防犯カメラ画像をつかって、同じ作業をしてみます。そうすると、10000個のデータの他人との偶然の類似度の分布を知ることができます(ヌル分布)。このヌル分布がわかっていれば、たとえばヌル分布の上位1パーセンタイル点(例えば10000個のデータの大きい方から100番目)の類似度値もわかります。これを閾値として、万引き集団100人と全顧客の特徴の類似度をすべて計算したとき、シロの人が偶然、閾値以上となる可能性は1%(誤ってヒットする確率γ = 0.01)なので、誤ってシロをクロとする偽陽性だと推定する期待値は1人と推定できます。(いろいろ簡略化してます)

6.お店の顧客リストに載っていることがわかっている10000人の、防犯カメラ画像をつかって、同じ作業をしてみます。そうすると、自分に一致するときの類似度がどのくらいになるのかの10000個のデータで分布を作ることができます。先ほどの閾値を使ったとき、この分布があるとクロを正しくクロと判定する確率(β)もわかりますよね。

で、最後までわからないのは、お店の顧客リストに犯人が何%含まれているのかのカバー率(α)です。

何を言っているのか、だれにもよくわかんないらしいのですが、どうやらここまでの話をまとめてみると、

・お店の顧客リストに犯人含まれるカバー率 α
・犯人がお店の顧客リストに含まれているときに正しくヒットする確率 β(1-偽陰性率)
・他のお客が誤ってヒットする確率 γ(おおよそ偽陽性率)

のうち、βとγは調べられるのだけど、αはわからないというのです。

そこで、先ほどの

x 該当する顧客が一名当てはまった犯人 x人
y 該当する顧客が二名以上当てはまった犯人 y人
z 該当する顧客が一人も当てはまらなかった犯人 z = 100-x-y人

という区分で該当する顧客が一人も当てはまらなかった犯人zの数の期待値は

z = 100 * ((1-α)*(1-γ) + α*(1-β)*(1-γ))

という式で書くことができます。
(1-α)*(1-γ) は顧客リストに載っていない犯人(1-α)が、他のお客が誤ってヒットしない(1-γ)確率
α*(1-β)*(1-γ)は顧客リストに載っている犯人が(α)、自分自身にヒットせずに(1-β)、他のお客が誤ってヒットしない(1-γ)確率
です。

実際にこのとき、γ とβがわかっているので、実際に万引き集団100人と全顧客の特徴の類似度をすべて計算してある閾値以上の類似度ヒットとしたときの、zからαが推定できますよね。

さらに一名以上のヒットがあった万引き犯 x+y 人の中の誤りの期待値は、100*γ人というところまで推定できます(偽陽性率 = 100*γ/(x+y))。

偽陽性が推定できると、こういう結論を出すことができます。

万引き犯100人について、全顧客データベースを照合したところ40人がヒットしました。このうち、シロをクロと誤った偽陽性の期待値は1人なので、かなりの確信を持ってこの顧客がクロであるといえます。

とか、

万引き犯100人について、全顧客データベースを照合したところ80人が、ヒットしました。このうち、シロをクロと誤った偽陽性の期待値は40人なので、あまり確信がありません。何らかの別の方法で犯人を絞りこむ必要があります。

といった、建設的な議論が可能になります。

要するにヌル分布(だけ)が大事なのです。ヌル分布がないデータベース検索の話にはご注意を。





2018年1月11日木曜日

いい湯加減の第9

昨年の年末から新年にかけて、ベートーベン第9交響曲、いわゆる第9を聞いていたーーとくに第4楽章で一回合唱でがーっと盛り上がったあと、トライアングルのリズムとピッコロによるトルコ風行進曲のなんかちょっと軽い感じの伴奏をバックにしてテノールが歌いまくった後に急に始まる、やや切迫感のある弦楽のスケルツォ風フゲッタがお気に入りで、このパートの後、あの有名な大合唱が始まるあの部分であるーー、というのもそもそもは、チェリビダッケのテンポが遅い録音を聞いたことにはじまっていて、このスケルツォ風フゲッタのパートに関していうと、この遅さがドンピシャであり、さらにチェリビダッケ+ミュンヘン・フィルハーモニー管弦楽団の異様に純度の高い演奏のせいで、なんだかとても感動してしまったのであるが(ときどきこうなる)、同じパートをたとえば、カラヤンとか、ヴァントとか、フルトウェングラーなどで聞くと、かっとぶかのような高速テンポですいすいとすすむため、感動している暇がないのはなぜだとばかりにいろいろ聴いてみると、そもそも第9交響曲の正しい姿というのはもはや誰も知らないわけで、指揮者が結構勝手にテンポを設定して好きに演奏していたらしく、90年代ころの古楽器ブームの中で、極力元の姿、楽譜に忠実にといういい子ちゃんな観点から、ガーディナーの録音が高く評価されたりして、これはこれで大変素晴らしい演奏で愛聴しているのだけど、ただ、肝心のスケルツォ風フゲッタ部分は楽譜の指示通りに弾くと、アナタ、速い、速すぎるあるよ、というテンポになってしまうようでおいおいと思っていたところ、異同を整理したベーレンライター版の楽譜が出た1996年に以降は原典というアイデアも怪しくなってきたという話にふーんと思って聴いてみた2010年のティレーマンの録音の快速っぷりに、もうこれはこれでありかなぁとも納得させられてしまった年末年始なのであった。で、昨日Youtubeでムーティ+シカゴ交響楽団の演奏を発見し、いい湯加減のテンポの遅さに、癒やされたのでした。問題の場所は1時間5分目くらいから始まります。

2017年12月12日火曜日

第160回 質量分析関西談話会


第160回 質量分析関西談話会を下記の概要で実施する計画です。今回は

「代謝物ビッグデータを取得する方法とバイオマーカー探索への効果的な使い方」

をテーマに実施いたします。定量をきちんとするにはどうすれば
いいのか皆様の間で情報と意見交換を行えればとおもいます。
お誘いあわせの上、ご参加のほどどうぞよろしくお願いします。

世話人代表松田史生@阪大

*************************
第160回 質量分析関西談話会プログラム
「代謝物ビッグデータを取得する方法とバイオマーカー探索への効果的な使い方」

2018年2月10日(土) 13時30分~16時50分
京都・嵐山 ご清遊の宿 らんざん
京都市右京区嵯峨天竜寺(嵐山渡月橋北岸を河に沿って上流(西)へ)
電話075-864-0088
交通アクセス:http://www.kyoto-ranzan.jp/access/index.html

質量分析法の最大の用途の一つは、薬物動態研究やバイオマーカー探索における、薬物、薬物代謝物、内因性代謝物等の定量です。正確なデータを多く取得するのが分析の使命であり、近年では取りためた定量値をまとめて「ビッグデータ」として活用したい社会的要請があります。しかし、互換性のないスモールなデータセットがビッグにあるのが実情です。そこで第160回 質量分析関西談話会では、正しい検量線の引き方や信頼できる定量値を得るための考え方について、産総研バイオメディカル標準研究グループの絹見 朋也様よりご紹介いただきます。また、網羅的なメタボローム分析からバイオマーカーを同定する方法は、標準化合物なしでの相対定量が試みられていますが、定量値の信頼度評価法が課題となっております。東北大学東北メガバンクプロジェクトにおける大規模コホートメタボローム研究において、実際に大量のデータ取得を担っておられる三枝 大輔様にデータ解析方法を含めた現状をご紹介頂き、得られた代謝物ビッグデータをバイオマーカー探索にどの様に活用するべきかを議論したいと思います。ぜひこの機会に日頃から抱いておられる疑問等をお持ちいただき、当会を十分に活用していただければと思います。

講演プログラム:
「ペプチド・タンパク質の標準物質開発と標準化」
絹見 朋也(産総研)
「標準化合物なしで正確な相対定量を行うための考え方」
三枝 大輔(東北大学)
「総合討論」
バイオマーカー探索、メタボローム分析等で取り扱う、標準化合物がない内因性代謝物の相対定量データと、どのように統合し、活用していくのかについてパネリストのみなさまからの話題提供をもとに討論を行います。

参加費:
無料

参加申込み:
参加希望の方は、(1)氏名、(2)所属、(3)メールアドレス、(4)日本質量分析学会
会員/非会員の別を添えて、下記メールアドレスにお申し込みください。
kansai17_%_mssj.jp (送信の際は、_%_を@に変えてください)
関西談話会世話人代表 松田史生(大阪大学)


懇親会:
懇親会は、関西質量分析関係者の集う「鮟鱇を食べる会」として開催します(17時30分開始、会費8,000円、当日参加はできません)。懇親会への参加をご希望の方は、談話会参加申込みとは別に1月末までに下記にご連絡下さい。
問い合わせ先:宮下正弘(京都大学)e-mail: miyamasa[at]kais.kyoto-u.ac.jp([at] は @ に置き換えて下さい)


世話人:楠本 雅典(大日本住友製薬)、宮下 正弘(京都大学)、黒野 定 (和光純薬工業)、松田 史生 (世話人代表、大阪大学)


風邪ひき読書

風邪を引いたので積ん読本をよみました。読まないと書けない質なのでまずは読むわけです。
ローカリズム宣言(内田樹、デコ)
読んだら効くひとりは内田樹です。180ページの日本の学術的発信力の劇的な低下に関するForeign Affairsの記事というのはこれ、でNatureの記事はこれでしょうか。必読ですな。

辞令(高杉良、文春文庫)
会社勤めはしたことないけど、この本を読んでいると、仕事するヒマないくらい根回しとかにいそがしそうでした。

兼好法師(小川剛生、中公新書)
高校の授業で習った、兼好法師に関する記述はほとんどが誤りであるというおそるべき事実を検証した本。吉田兼好っていう名前がそもそもねつ造とのこと。歴史学、というか文献史学は最高に面白くて、黒田 日出男の「国宝神護寺三像とは何か (角川選書) 」とか、「謎解き洛中洛外図 (岩波新書)」の、通説の矛盾点を見つけ、広大な文献から参考となる資料を渉猟し、資料の行間を縦横無尽に組み合わせつつ読み解いて、これまで見えてこなかった事実が浮かび上がってくる様子は、いいミステリーを読んでいるようで最高に楽しいです。本書においても、始まって3ページ目からの「この通説は完璧に見えるが、疑問を禁じ得ない。」に始まるこれでもかと続く問題提起と、紙背文書の裏読みからめくるめく明らかにされるプロセスは、名探偵の推理を聞いている少年探偵団の隊員のごとく、わくわくものであります。兼好法師像というのは、読解にも関わってくるので、高校の古文の先生はさぞ困るでしょうなぁ。あと、システム生物学の論文でこういうのが書きたいな。とおもいました。

深読み日本文学(島田雅彦、集英社インターナショナル新書)
本書の狙いが今ひとつはっきりしないので、なんともいいようがないのでありますが、日本文学史を整理する新たな切り口を提示しました。というのであれば、あくまでも文学関係その筋向けの業界内文書にとどまってしまうのであり、もう少し好意的に、一般向けに書かれたんだと見てみると、これを読んで島田雅彦はあたまいいなぁとか感じる人が出る可能性は万が一にでもあるかもしれないが、じゃあ日本文学を読みたくなるかと言われると、まったくそうではないようなので、「競争相手は馬鹿ばかり」の世界へようこそというガイドブックだと思えば、ま、そんなもんか、と納得はするのでした。


奇巌城(モーリス・ルブラン、南洋一郎訳、ポプラ文庫クラシック)
むかし、「奇巌城」「シャーロックホームズの冒険」「ドリトル先生アフリカ行き」を買ってもらって、まずはドリトル先生にはまり、それからホームズにいったので、ルパンには疎いのです。「奇巌城」にはホームズが出演するのですが(しかも因縁ありげだがあまり活躍しない)、こう言うのって事前になにか相談したり、版権のやりとりとかあったんでしょうか。。。などが気になってしまいました。研究プロジェクトで世知辛い知財の話ばっかり聞かされていると、人間がセコくなる、、、

未必のマクベス(早瀬耕、早川文庫JA)
「グリフォンズ・ガーデン」は確かOhX!に荻窪圭が書評を載せていて、放課後に姫路の本屋で立ち読みで読破したはずなんだが、どんな話だったかと言われると、数字あるいは数式に色がある。という女の子が出て着る話だったような気がする(また、そういう女の子に出会いたいという数学者の愚痴をその数年後に飲み屋で聞かされたこと)以外、とくに何も覚えていないのだが、その作者の20何年ぶりの新作の文庫化ということで本屋で山積みだったし、梅田のブックファーストのランキングでも6位だったので読んでみた。東南アジアアジア+ハードボイルド+初恋以降+理想の女+謎+カクテル飲みまくりということで、矢作俊彦の「ロング・グッドバイ」の気の抜けたやつ。という感じではある。ダイキリも甘いが、キューバリブレはもっと甘いのだ。さらに、オチとかはあんまりにも情けない願望がそのままなので、もうちょっとどうにかならんものか、、。この作品が好きな方は矢作の「ロング・グッドバイ」をぜひ。

勁草(黒川博行、徳間文庫)
年に一度のお年玉、とかクリスマスプレゼントって感じでよむとこの安定感と大阪弁がたまらない。今回は、オレオレ詐欺グループとそれを追う警察グループの視点が交互に入れ替わりつつ進むので一粒で2度おいしい感じである。

☆Motor Fan illustrated 134号(三栄書房)
特集は水平対向エンジンである。水平対向エンジンの利点は低重心、バランスがいい。の2点だが、フロントに置くと排気系の取り回しが苦しく、うんぬん、などとおしえてもらい、なるほどなあと図面をながめているだけで結構楽しい。