ゲノムシーケンシング、マイクロアレイ、種々のNGS手法など、遺伝子全部をいっぺんに測定するやり方で、網羅性の高いデータが得られるようになって久しい。一方近年は、網羅性に加えて、データの解像度が著しく向上しているように感じられる。PARIS以外にも、例えば一細胞RNAシーケンシングでは、一度の実験で数万細胞のそれぞれについて遺伝子発現プロファイルを得られるようになっている。卒研テーマに出そうと論文をリサーチすると、この1年で論文数は、土砂降りの様相となっており、サンプルを手当たり次第に一細胞シーケンシングしているような印象さえ受ける。
生命の基本単位は細胞なので、一細胞シーケンシングデータは、生物に関するより基本的な情報をもつと考えるのは自然だろう。現在の一細胞シーケンシング研究の爆発的増加は、過去にマイクロアレイからNGSへと世の中のシフトが起こったように、バルクNGSから一細胞シーケンシングへのシフトが起こっているのだ、と個人的には解釈している。
バイオインフォマティクスの研究では、データのサンプル数が多いか少ないかで、できることが全然変わってくる。その点、一細胞シーケンシングでは、いろんな問題設定において、細胞数をサンプル数とおくことができるため、サンプル数が少ない時に比べ、格段に複雑な生命過程を推定できるようになる。また、分化誘導をかけた細胞群を一細胞RNA-seqすることにより、細胞分化過程(擬時間)に沿った高密度の時系列データが得られ、これにより遺伝子発現制御の因果関係がより高精度で推定できると予測される。実際、理化学研究所の松本拡高氏との共同研究における解析データを見る限り、分化の際の遺伝子発現の機序などがバルクRNA-seqより大分クリアにみえるようになったと感じられる。一細胞シーケンシング技術を開発されている研究者・技術者の方々に敬意を表したい。
私の研究室では最近はこのような高解像度かつ網羅的な時系列データを解析する手法の開発が主要課題になっている。また、動植物の表現型の時系列データのモデリングを微分方程式により行い、それと細胞レベルのデータとの相関を見つける数理的手法の開発を進めている。アルゴリズム的には、もうかなり進んでいるのだが、世の中に存在するデータが十分でない部分もあり、試しに簡単なデータをとってみようと計画しているところである。