そもそもこのツールを知ることになったきっかけは、理研の平野さんのホストで開催された熊本大学の斉藤典子さんのセミナーでした。でも、斉藤さんといえば核内構造。つい最近では昨年の分子生物学会でも話題になったlncRNA、Eleanorの話など、バキバキのベンチのベテラン若手研究者という印象が強かったのですが、機械学習やらフーリエ変換やらユークリッド空間やらおよそ馴染みのない術語が次から次へと飛び出てきて、一瞬、えっ??この方斉藤さん??斉藤さんのぬいぐるみを被った理論屋さん?とか思ってしまいましたが(微妙に失言)、無知とは怖いもので、機械学習を用いた細胞核形態の定量化の論文、実は斉藤さんの最近のヒット作だったのですね。オープンアクセスのSciRepの論文ですので、ぜひ。
そう言えばそういう論文があったなあ、と記憶の片隅にはあったのですが、それがまさか斉藤さんのお仕事だったとはとても想像が至らず(またまた微妙に失言)、これがまた驚愕のセミナーでありました。かいつまんで言うと、品質の良いiPS細胞とそうでないiPS細胞を、位相差顕微鏡の画像だけから見分けてしまうということなのですが、その精度はもしかすると熟練した研究者よりも良いのではないか、とのこと。最近、人工知能の進化で人間の仕事が奪われるというような話題がちらほら聞かれますが、将棋界同様、人類とコンピュータ、共存共栄の道はあるはずで、人間が苦手とするバイアスのかからないな定量化を機械の助けを借りて行うというのは極めてスマートなやり方であると思います。
wndchrmの原理や詳しい使い方は羊土社の「バイオ画像解析手取り足取りガイド」という単行本に斉藤さんご自身がご執筆されているのでそちらを参照していただければと思うのですが、基本的にはいろいろな染色画像をたくさんとって、それぞれの属性ごとに複数のフォルダーにまとめて、それらのフォルダーが入っている親フォルダーの場所を指定してやれば、あとはwndchrmが画像中の様々な要素を抽出してフォルダーに入っている画像を特徴付ける評価関数を作ってくれます。それが一旦できてしまえば、属性がわからない画像もwndchrmに食わせればたちどころに属性を判断してくれますし、どれぐらい似ているのかも弾き出してくれる、という仕組みです。
では早速MyMacにインストールして使ってやろう!!と思ったのですが、NGSデータの解析でもまずベンチ屋がつまづく壁。そう、インストールができない。。。そうなんです。解析難しいですよね、じゃなくてLinux使えないだけ、というお粗末な状態。でも、今やGoogle先生がいますので、えっちらおっちらやっていたらなんとか動いたので、インストールの手順と簡単な使い方をおいおい紹介していきたいと思います。