論文を読まなくても想像できちゃう？？

2016年10月03日（月）

投稿者: 谷上賢瑞

投稿が遅れてすみません。。。東大の谷上です。。。

今まで転写制御をメインに研究してきたので、遺伝子の発現変動を見ている時間が三度の飯より多い気がします。

ChIP-seq, RNA-seqのデータから面白そうな遺伝子を見つけてはRNAiでつぶす、、、という実験を良く行うのですが、いつも実験する前に（楽して）結果知りたいなぁと思っています。

なるべく実験しない方が、安あがりですし。

世の中には便利なデータベースや有用なデータセットが多数存在していて、皆さん解析結果をどんどん載せていってくれます。

今回は、僕が良く使うデータベースを紹介します。

ポチポチインフォマティシャンになれば、実験する前に、なんなら論文を見る前に、機能や制御因子、メカニズムが想像できるようになるかも、、、？

１．ENCODE ChIP-seq Experiment Matrix

皆さんご存知のENCODEデータです。

ヒストン修飾や有名な転写因子のChIP-seq結果がUSCS Browser上で見れます。

どの遺伝子座にどんなヒストン修飾が入ってるん？細胞ごとに違うん？とかが、誘導されるがままにポチポチと押すだけで得られます。

転写因子のデータも大半が入っているので、ターゲット遺伝子群の結合確認が出来て、自分のアイデアに対する妄想が膨らみます。

２．RefExA

組織・細胞ごとの発現データをまとめたデータベースです。

このデータベースは非常に有用で、がんで発現亢進があるか？ある遺伝子を解析したいけど、どの細胞を選択すれば良いか？そもそも脳で発現してるのか？等の情報が、遺伝子名を入れて”Search”ボタンを押すだけでサクッと出て来ます。

培養細胞を使用した実験デザインを考える際に、良く使用しています。

３．GEO Profiles

こちらも発現データを確認出来ます。GEOには元データを保管しているDataset (https://www.ncbi.nlm.nih.gov/gds) もあるのですが、Profileでは解析結果が見ることが出来ます。

遺伝子名を入れれば、様々な刺激に対する目的の遺伝子のリアクションが確認出来ます。

マイクロアレイの解析が出来れば、気になるデータのリンクされたDataset ページに飛んで、生データをダウンロードすることも出来ます。

僕は、新しい遺伝子の実験を始める前に二・三日このデータセットを眺めていたりします。たまに何かしら閃きますよ。

４．Cancer Browser

このデータベースは、TCGA (The Cancer Genome Atlas, http://cancergenome.nih.gov/) のデータを解析し、視覚的に分かりやすく見ることが出来るようにしてくれています。

各組織ごと、正常か癌か、Gradeごと、遺伝子ごと、はたまたカプランマイヤーまで、デスクでコーヒーを飲みながらポチポチすれば確認出来ます。

さらに、気になるデータセットがあれば、ノーマライズされたデータをダウンロードして、独自に解析することも可能です。

こちらはデータセットが膨大すぎて、僕も使いこなせておりません・・・。逆に誰かチュートリアルして欲しいくらいです。

以上です。

若干癌や培養細胞に偏った感もありますが、転写制御研究をされる際は、ご参考にして頂ければ嬉しいです！

東京大学分子細胞生物学研究所助教
▶ プロフィールはこちら

このカテゴリをもっと見る « 加速する情報社会

ブログ記事カテゴリ