2016年10月03日(月)

論文を読まなくても想像できちゃう??

投稿者:

投稿が遅れてすみません。。。東大の谷上です。。。

 

今まで転写制御をメインに研究してきたので、遺伝子の発現変動を見ている時間が三度の飯より多い気がします。

ChIP-seq, RNA-seqのデータから面白そうな遺伝子を見つけてはRNAiでつぶす、、、という実験を良く行うのですが、いつも実験する前に(楽して)結果知りたいなぁと思っています。

なるべく実験しない方が、安あがりですし。

世の中には便利なデータベースや有用なデータセットが多数存在していて、皆さん解析結果をどんどん載せていってくれます。

今回は、僕が良く使うデータベースを紹介します。

ポチポチインフォマティシャンになれば、実験する前に、なんなら論文を見る前に、機能や制御因子、メカニズムが想像できるようになるかも、、、?

1.ENCODE ChIP-seq Experiment Matrix

URL: https://genome.ucsc.edu/ENCODE/dataMatrix/encodeChipMatrixHuman.html

 

皆さんご存知のENCODEデータです。

ヒストン修飾や有名な転写因子のChIP-seq結果がUSCS Browser上で見れます。

どの遺伝子座にどんなヒストン修飾が入ってるん?細胞ごとに違うん?とかが、誘導されるがままにポチポチと押すだけで得られます。

転写因子のデータも大半が入っているので、ターゲット遺伝子群の結合確認が出来て、自分のアイデアに対する妄想が膨らみます。

 

2.RefExA

URL: http://157.82.78.238/refexa/advanced_search.jsp

 

組織・細胞ごとの発現データをまとめたデータベースです。

このデータベースは非常に有用で、がんで発現亢進があるか?ある遺伝子を解析したいけど、どの細胞を選択すれば良いか?そもそも脳で発現してるのか?等の情報が、遺伝子名を入れて”Search”ボタンを押すだけでサクッと出て来ます。

培養細胞を使用した実験デザインを考える際に、良く使用しています。

 

3.GEO Profiles

URL: https://www.ncbi.nlm.nih.gov/geoprofiles

 

こちらも発現データを確認出来ます。GEOには元データを保管しているDataset (https://www.ncbi.nlm.nih.gov/gds) もあるのですが、Profileでは解析結果が見ることが出来ます。

遺伝子名を入れれば、様々な刺激に対する目的の遺伝子のリアクションが確認出来ます。

マイクロアレイの解析が出来れば、気になるデータのリンクされたDataset ページに飛んで、生データをダウンロードすることも出来ます。

僕は、新しい遺伝子の実験を始める前に二・三日このデータセットを眺めていたりします。たまに何かしら閃きますよ。

 

4.Cancer Browser

URL: https://genome-cancer.ucsc.edu/proj/site/hgHeatmap/

 

このデータベースは、TCGA (The Cancer Genome Atlas, http://cancergenome.nih.gov/) のデータを解析し、視覚的に分かりやすく見ることが出来るようにしてくれています。

各組織ごと、正常か癌か、Gradeごと、遺伝子ごと、はたまたカプランマイヤーまで、デスクでコーヒーを飲みながらポチポチすれば確認出来ます。

さらに、気になるデータセットがあれば、ノーマライズされたデータをダウンロードして、独自に解析することも可能です。

こちらはデータセットが膨大すぎて、僕も使いこなせておりません・・・。逆に誰かチュートリアルして欲しいくらいです。

 

 

以上です。

若干癌や培養細胞に偏った感もありますが、転写制御研究をされる際は、ご参考にして頂ければ嬉しいです!

谷上 賢瑞

東京大学 分子細胞生物学研究所 助教
▶ プロフィールはこちら

このカテゴリをもっと見る « 加速する情報社会

ブログアーカイブ

ログイン

サイト内検索