1.ENCODE ChIP-seq Experiment Matrix
URL: https://genome.ucsc.edu/ENCODE/dataMatrix/encodeChipMatrixHuman.html
皆さんご存知のENCODEデータです。
ヒストン修飾や有名な転写因子のChIP-seq結果がUSCS Browser上で見れます。
どの遺伝子座にどんなヒストン修飾が入ってるん?細胞ごとに違うん?とかが、誘導されるがままにポチポチと押すだけで得られます。
転写因子のデータも大半が入っているので、ターゲット遺伝子群の結合確認が出来て、自分のアイデアに対する妄想が膨らみます。
2.RefExA
URL: http://157.82.78.238/refexa/advanced_search.jsp
組織・細胞ごとの発現データをまとめたデータベースです。
このデータベースは非常に有用で、がんで発現亢進があるか?ある遺伝子を解析したいけど、どの細胞を選択すれば良いか?そもそも脳で発現してるのか?等の情報が、遺伝子名を入れて”Search”ボタンを押すだけでサクッと出て来ます。
培養細胞を使用した実験デザインを考える際に、良く使用しています。
3.GEO Profiles
URL: https://www.ncbi.nlm.nih.gov/geoprofiles
こちらも発現データを確認出来ます。GEOには元データを保管しているDataset (https://www.ncbi.nlm.nih.gov/gds) もあるのですが、Profileでは解析結果が見ることが出来ます。
遺伝子名を入れれば、様々な刺激に対する目的の遺伝子のリアクションが確認出来ます。
マイクロアレイの解析が出来れば、気になるデータのリンクされたDataset ページに飛んで、生データをダウンロードすることも出来ます。
僕は、新しい遺伝子の実験を始める前に二・三日このデータセットを眺めていたりします。たまに何かしら閃きますよ。
4.Cancer Browser
URL: https://genome-cancer.ucsc.edu/proj/site/hgHeatmap/
このデータベースは、TCGA (The Cancer Genome Atlas, http://cancergenome.nih.gov/) のデータを解析し、視覚的に分かりやすく見ることが出来るようにしてくれています。
各組織ごと、正常か癌か、Gradeごと、遺伝子ごと、はたまたカプランマイヤーまで、デスクでコーヒーを飲みながらポチポチすれば確認出来ます。
さらに、気になるデータセットがあれば、ノーマライズされたデータをダウンロードして、独自に解析することも可能です。
こちらはデータセットが膨大すぎて、僕も使いこなせておりません・・・。逆に誰かチュートリアルして欲しいくらいです。
以上です。
若干癌や培養細胞に偏った感もありますが、転写制御研究をされる際は、ご参考にして頂ければ嬉しいです!