中川 真一

中川 真一

北海道大学 薬学研究院 教授
▶ プロフィールはこちら

ENCODEのshRNA-RNAseqはこりゃ便利だということでここのところENCODEコンソーシアムから頼まれたわけでもないのにウルトラ超絶宣伝していますが、このデータをよくよく見てみると、実験群ごとにだいぶ様子が違うのに気付きます。例えば、下の図はとあるふたつのコントロール実験(control shRNAでノックダウンした実験)におけるACTBのリードの張り付き方を見たものですが、、、

リードの張り付き方のパターンがえらく違います。

 恥ずかしながら、僕自身、ウェットの研究者がピンセットとピペットマンだけ握っていれば良い時代はとうの昔に終わったことに気づいたのは、実はつい最近。今更データサイエンティストを目指すのもなんだしなあ、、、と半ば諦めてたところはあるのですが、ちょろっと触ってみるとこれが意外と楽しいんですね。HelloとShitとGreatだけの英会話みたいなレベルでも、意思疎通できるというのはそれだけで喜びを与えてくれるものです。それに加えてI love youだけ覚えれば人生の90%のミュニケーションは事足ります。というわけで、I love you R!

もう10年ほど前になりますが、Gomafuの核内局在因子やXistの染色体極在化因子を探そうとして僕らがとったアプローチは、RNA結合蛋白質に対してデザインしたカスタムsiRNAライブラリーを用いて片っ端からノックダウンしていって、その効果を調べて真打を探す、というものでした。HGWさんのたぐいまれなる強運もあり、このアプローチは大成功を収めたわけですが、ENCODEのshRNA-RNAseqのデータが使える今日だったら、実験を始める前からデータは手許にある!ということで、かなりの部分をショートカットすることができるわけです。というわけで、R初心者によるR講座第ウン段。今回は、自分の興味のある遺伝子の転写産物が、特定のRNA結合蛋白質をノックダウンした時にどのような変化をするのか、ということを可視化する方法を紹介します。まあ、そのうちUCSC Genome Browserでもすぐに見れるようになるんでしょうが、ちょっとだけ先を行こうということで、、、

 


ベンチ屋がやるなんちゃってバイオインフォにとって欠かせないのは手軽に解析環境をインストールすることのできるMacOSとhomebrewなわけですが、homebrewでカバーできないツールも結構あります。ENCODEのデータがリリースされたのをきっかけにどりゃどりゃGomafuちゃんでも見てみようかと思った時に、一つあたり計算に数時間かかるCufflinksに多数のデータを突っ込むのは、ラボのMacProレベルでは小錦を自転車に乗せるようなものでとても無理。もっと手軽なカウントツールとしてHT-seqやらSubreadのfeatureCountやらあるわけですが、brew install HTseqやbrew install subreadではまだサポートされてないのでインストールできません。

タイトルの通りですが、Gene YeoさんやBrenton Graveleyさんが中心となって進めているENCODEのRNA結合蛋白質関連のプロジェクト論文がbioRxivにアップされました。

とにかくこれだけのデータが公共データベースで誰でも使えるようになっているというのがすごい!なんせ、200近いRNA結合蛋白質についてshRNAを用いたノックダウンのRNAseqのデータが手に入り、しかも半分ぐらいのものに関してはeCLIPのデータがセットになってるんですよ。これって一つのRNA結合蛋白質についてやるだけでも、普通に一つのラボが何年もかけてやる実験じゃないですか。多くのものについては免疫染色のデータもついてます。本当に一昔前なら信じられない状態です。今風に言うなら、やばい、やばい、やばい状態です。細胞はK562とHepG2と限られていますし、必ずしも自分の興味あるRNA結合蛋白質が全て含まれているわけではありませんが、特定のRNA結合蛋白質をノックダウンして発現量が変わるのかな、スプライシングのパターンが変わるのかな、転写開始位置やpoly-A付加位置が変わるのかな。これら全ての疑問は、ベンチで実験しなくても、データを解析するだけで答えが出る!!このデータを元にした再解析をするだけで、立派な論文が書けそうです。やってみようかな。いや、是非やってみましょうよ!

というわけで、eCLIPとshRNA-RNAseqのbamファイルを遺伝子の名前と細胞の名前つきでダウンロートできる簡単すぎる恥さらしでもちょっと役にたつかもしれないシェルスクリプト用意しました。ENCODEのサイトにも一括ダウンロードできるファイルがあるのですが、前記事でも触れた通り、Accession#しかファイル名がないので、直感的に使いにくいんですね。とりあえずダウンロードしておけば、好きな時にいくらでもデータにアクセスできます。そのうちUCSC Genome Browserにリンクがつくのでしょうが、それまで待てない!という感じですね。

しかし全部ダウンロードすると10TBぐらいにはなりそう。HDDをまず買いに行かなければ、、、

2017年08月02日(水)

ガンとNeat1の不思議な関係

アガサクリスティの「蒼ざめた馬」の冒頭シーン。一人の男をめぐって二人の女性が掴み合いの喧嘩をする強烈なシーンがありますが、そういうシーンはドラマではよくある展開ですが、現実世界ではほとんど見たことはありません。都市伝説みたいなものだと思っていたら、30年ほど前、某旧友をめぐって某女子校で似たようなシーンが展開されていたとかいう話をつい最近友人より聞きまして、そうか、そういう世界もあるんだなあと非モテ系の僕としてはちょっぴりというかだいぶ羨ましい、とかなんとか言っていると奥さんにキッと睨まれそうですが、プライベートではともかく、仕事で使っているモデルマウスが引っ張りだこというのは文句なしに嬉しいものです。そう。国内外からリクエスト来まくりの引っ張りだこのモテ男くん、Neat1 KOマウスの話です。昨年、今年と、このモテ男くんを使ったガン研究の論文がChris MarineさんとLaura Attardiさんのところから発表されました。これがややこしいことに一見すると正反対の結論。片や、Neat1がなくなるとガンになりにくい。片や、Neat1がなくなるとガンになりやすい。一体どっちなの?ということなのですが、両グループの共同研究者として、僕なりの理解をちょっとまとめてみようと思います。

札幌はガトーキングダムで開かれた内藤カンファレンス。自宅から車で40分ほどにもかかわらず3泊4日もすることになり家族が悲しむかと思いきやむしろ喜んでいるようだったのでちょっぴり悲しくなりつつも、今回のテーマはずばり、"Noncoding RNA: Biology, Chemistry, & Diseases"。GordonやKeystoneに引けを取らない豪華な海外ゲスト。超ウルトラスーパーデラックスエキサイティングでグレートでプロジーヂャスなミーティングは非常に熱気に満ちていて、興味のある話はいくら聞いていても飽きないということを本当に実感した4日間でした。

2017年05月30日(火)

Spheroid10年いまむかし

Pink Floyd繋がりというわけでもないですが、同じく英国のバンドThe Policeが1983年にリリースしたシンクロニシティという有名なアルバムがありまして、これを初めて耳にしたのは厨二病真っ盛りのころ。しょっぱなのSynchronicity IのA connecting principleから美しく韻を踏んだサビの部分の難解な歌詞は中坊にとってはまさに猫にマタタビで、意味は良くわからないけれども世の中の真理に触れたようなプチ悟り状態、ヤクザ映画を見た後に肩で風を切って歩きたくなる症候群にかかってしまったのはちょっと恥ずかしい遠い思い出です。

ピペットマンとピンセットばかり握っていたベンチ屋がMoistureを目指す時、越えなければいけない最初の壁がTerminalのコマンドライン、次の壁がRでしょうか。最近、海の向こうでは壁を作るのがはやってるみたいですが、壁はピンクフロイドだけにしておいて、目指せMoiture、サルでもできるRの続きです。

ここ数年で、コテコテのベンチ屋でもある程度の次世代シークエンサーのデータ解析ができる環境がどんどん整ってきました。なんのセットアップも必要なくNCBIのBLAST感覚で手軽に利用できるのがクラウドベースの解析環境で、老舗のGalaxyに加え、最近はセルイノベーションプログラムで整備された遺伝研のMaserなどがきめ細やかなサービスを提供してくれています。さすが遺伝研。また、とっても素人friendlyな「次世代シークエンサーDRY解析教本」などのスグレモノ書籍も出版され、my Macに各種ツールをインストールして自前でなんちゃってNGS解析しているwetな学生さん(性格がwetなわけではない)も数多くおられると思います。そう。もう、仕事をDryとWetなんて分ける時代ではない。今や時代は、理研CDBの工樂さんがおっしゃるところの、"Moisture"で行こう!です。(2/8追記:ったくこれだから素人は、、、というミスがありましたので訂正入れました

1 / 6

ブログアーカイブ

ログイン

サイト内検索