北海道大学 薬学研究院 教授
▶ プロフィールはこちら
今年も分子生物学会(今年はConBio2017)の季節がやってきました。これだけ大きな学会になると、アポ無しにディスカッションするのは至難の技。ディスカッションを深めて研究のアイデアを練るというよりは一方通行で情報を流すだけ、単に発表したという事実を作るだけの学会なんていらない、といった極論もあるようですが、個人的にはとても大好きな学会の一つです。そもそも、RNAに興味を持ち始めたのは2004年の年会のワークショップで大野さんや稲田さんの発表を聞いたのがきっかけ。2007年の年会休憩時間にパシフィコ横浜の3階の廊下ですれ違った当時入江研の長谷川さんに最近どうしてるの?と話かけてなかったらXistの染色体局在を調べることはなかった、論文も出ることはなかった、すなわち今頃一家路頭に迷っていたでしょうし、昨年は大塚さんのGONADトークにハンマーヘッドリボザイムで頭を殴られたかのような刺激を受け、今年一年その系の導入にてんやわんや、配属さればかりの学生のような新鮮な気分で過ごすことができました。学会に行くのは、Amazonで本が買えるのに、本屋にぶらり寄りたくなるのと似ているかもしれません。目的があっていくのではなく、偶然の出会いを求めて。
パラスペックル研究の生みの母、Archa FoxさんとCharlie Bondさん企画のプチシンポジウムに参加するため、オーストラリアはパース、University of Western Australiaに行ってまいりました。
ENCODEのshRNA-RNAseqはこりゃ便利だということでここのところENCODEコンソーシアムから頼まれたわけでもないのにウルトラ超絶宣伝していますが、このデータをよくよく見てみると、実験群ごとにだいぶ様子が違うのに気付きます。例えば、下の図はとあるふたつのコントロール実験(control shRNAでノックダウンした実験)におけるACTBのリードの張り付き方を見たものですが、、、
リードの張り付き方のパターンがえらく違います。
恥ずかしながら、僕自身、ウェットの研究者がピンセットとピペットマンだけ握っていれば良い時代はとうの昔に終わったことに気づいたのは、実はつい最近。今更データサイエンティストを目指すのもなんだしなあ、、、と半ば諦めてたところはあるのですが、ちょろっと触ってみるとこれが意外と楽しいんですね。HelloとShitとGreatだけの英会話みたいなレベルでも、意思疎通できるというのはそれだけで喜びを与えてくれるものです。それに加えてI love youだけ覚えれば人生の90%のミュニケーションは事足ります。というわけで、I love you R!
もう10年ほど前になりますが、Gomafuの核内局在因子やXistの染色体極在化因子を探そうとして僕らがとったアプローチは、RNA結合蛋白質に対してデザインしたカスタムsiRNAライブラリーを用いて片っ端からノックダウンしていって、その効果を調べて真打を探す、というものでした。HGWさんのたぐいまれなる強運もあり、このアプローチは大成功を収めたわけですが、ENCODEのshRNA-RNAseqのデータが使える今日だったら、実験を始める前からデータは手許にある!ということで、かなりの部分をショートカットすることができるわけです。というわけで、R初心者によるR講座第ウン段。今回は、自分の興味のある遺伝子の転写産物が、特定のRNA結合蛋白質をノックダウンした時にどのような変化をするのか、ということを可視化する方法を紹介します。まあ、そのうちUCSC Genome Browserでもすぐに見れるようになるんでしょうが、ちょっとだけ先を行こうということで、、、
ベンチ屋がやるなんちゃってバイオインフォにとって欠かせないのは手軽に解析環境をインストールすることのできるMacOSとhomebrewなわけですが、homebrewでカバーできないツールも結構あります。ENCODEのデータがリリースされたのをきっかけにどりゃどりゃGomafuちゃんでも見てみようかと思った時に、一つあたり計算に数時間かかるCufflinksに多数のデータを突っ込むのは、ラボのMacProレベルでは小錦を自転車に乗せるようなものでとても無理。もっと手軽なカウントツールとしてHT-seqやらSubreadのfeatureCountやらあるわけですが、brew install HTseqやbrew install subreadではまだサポートされてないのでインストールできません。
タイトルの通りですが、Gene YeoさんやBrenton Graveleyさんが中心となって進めているENCODEのRNA結合蛋白質関連のプロジェクト論文がbioRxivにアップされました。
とにかくこれだけのデータが公共データベースで誰でも使えるようになっているというのがすごい!なんせ、200近いRNA結合蛋白質についてshRNAを用いたノックダウンのRNAseqのデータが手に入り、しかも半分ぐらいのものに関してはeCLIPのデータがセットになってるんですよ。これって一つのRNA結合蛋白質についてやるだけでも、普通に一つのラボが何年もかけてやる実験じゃないですか。多くのものについては免疫染色のデータもついてます。本当に一昔前なら信じられない状態です。今風に言うなら、やばい、やばい、やばい状態です。細胞はK562とHepG2と限られていますし、必ずしも自分の興味あるRNA結合蛋白質が全て含まれているわけではありませんが、特定のRNA結合蛋白質をノックダウンして発現量が変わるのかな、スプライシングのパターンが変わるのかな、転写開始位置やpoly-A付加位置が変わるのかな。これら全ての疑問は、ベンチで実験しなくても、データを解析するだけで答えが出る!!このデータを元にした再解析をするだけで、立派な論文が書けそうです。やってみようかな。いや、是非やってみましょうよ!
というわけで、eCLIPとshRNA-RNAseqのbamファイルを遺伝子の名前と細胞の名前つきでダウンロートできる簡単すぎる恥さらしでもちょっと役にたつかもしれないシェルスクリプト用意しました。ENCODEのサイトにも一括ダウンロードできるファイルがあるのですが、前記事でも触れた通り、Accession#しかファイル名がないので、直感的に使いにくいんですね。とりあえずダウンロードしておけば、好きな時にいくらでもデータにアクセスできます。そのうちUCSC Genome Browserにリンクがつくのでしょうが、それまで待てない!という感じですね。
しかし全部ダウンロードすると10TBぐらいにはなりそう。HDDをまず買いに行かなければ、、、
アガサクリスティの「蒼ざめた馬」の冒頭シーン。一人の男をめぐって二人の女性が掴み合いの喧嘩をする強烈なシーンがありますが、そういうシーンはドラマではよくある展開ですが、現実世界ではほとんど見たことはありません。都市伝説みたいなものだと思っていたら、30年ほど前、某旧友をめぐって某女子校で似たようなシーンが展開されていたとかいう話をつい最近友人より聞きまして、そうか、そういう世界もあるんだなあと非モテ系の僕としてはちょっぴりというかだいぶ羨ましい、とかなんとか言っていると奥さんにキッと睨まれそうですが、プライベートではともかく、仕事で使っているモデルマウスが引っ張りだこというのは文句なしに嬉しいものです。そう。国内外からリクエスト来まくりの引っ張りだこのモテ男くん、Neat1 KOマウスの話です。昨年、今年と、このモテ男くんを使ったガン研究の論文がChris MarineさんとLaura Attardiさんのところから発表されました。これがややこしいことに一見すると正反対の結論。片や、Neat1がなくなるとガンになりにくい。片や、Neat1がなくなるとガンになりやすい。一体どっちなの?ということなのですが、両グループの共同研究者として、僕なりの理解をちょっとまとめてみようと思います。
札幌はガトーキングダムで開かれた内藤カンファレンス。自宅から車で40分ほどにもかかわらず3泊4日もすることになり家族が悲しむかと思いきやむしろ喜んでいるようだったのでちょっぴり悲しくなりつつも、今回のテーマはずばり、"Noncoding RNA: Biology, Chemistry, & Diseases"。GordonやKeystoneに引けを取らない豪華な海外ゲスト。超ウルトラスーパーデラックスエキサイティングでグレートでプロジーヂャスなミーティングは非常に熱気に満ちていて、興味のある話はいくら聞いていても飽きないということを本当に実感した4日間でした。
Pink Floyd繋がりというわけでもないですが、同じく英国のバンドThe Policeが1983年にリリースしたシンクロニシティという有名なアルバムがありまして、これを初めて耳にしたのは厨二病真っ盛りのころ。しょっぱなのSynchronicity IのA connecting principleから美しく韻を踏んだサビの部分の難解な歌詞は中坊にとってはまさに猫にマタタビで、意味は良くわからないけれども世の中の真理に触れたようなプチ悟り状態、ヤクザ映画を見た後に肩で風を切って歩きたくなる症候群にかかってしまったのはちょっと恥ずかしい遠い思い出です。