October 3, 2014

ブログ移転

ncRNAblog+は、新学術非コードRNAの終了に伴い、今後は下記のブログに引き継がれます。その名も、新学術ncRNAネオタクソノミ公式ブログ


アシベ探しの続きは新しいネオブログにて。
ncRNAblog+NeOではRNA研究者のちょっと意外な一面が見られるエッセーシリーズ、
【私の最初の研究テーマ】の連載を皮切りに、この業界の最新動向、過去の動向、秘密の情報、どんどん発信していきます。

皆さん長らくご愛読(?)ありがとうございました。


中川

August 30, 2014

アシベを求めて(3)

複合体が可溶化出来れば精製なんてオチャノコサイサイと思っていたのが大間違いで、結果として、単に我々の腕が悪かっただけなのでしょうが、MS2、PP7などのタグをつけて複合体を引っ張ってくるというアプローチはうまくいきませんでした。うまくいかないというのは要するに、関係のないRNAで引っ張ってきたコントロールとほとんど銀染のパターンが変わらない、ということです。

ーncRNAのモル数がタンパク質のモル数に比べて圧倒的に少ないために、バックグラウンドに隠れてしまう。
ーncRNAが非特異的にタンパク質に結合してしまうので、特異性が出ない。

という2つのことが大いに考えられるわけですが、実際の所どうなのでしょう?PBSで溶かしたらうまくいった!!という話が今後出てきてきてくれたら、むふふ、、、電車の中で思い出し笑いして人に見られて眠ったふりしてしまいます(ふ、古い)。

ともあれ、普通に溶かして精製してというアプローチに関しては勇気ある撤退をする事にして、でもそのまま撤退するのもあまりにも悔しいので、せっかくncRNA複合体を分画できたのだから、それをバンドでなく顕微鏡で見てやろうと思いました。そう。僕は顕微鏡マニアなのです。X線フィルムではなかなか見た気にならない。やはりレンズの向こうの像を見ないと、、、

ということで、SDGの分画をPLLコートしたスライドグラスにのせて、そのままin situ hybridization! 見えるかどうか半信半疑でしたが、GomafuとMalat1の複合体らしき着物が見えた時にはちょっぴり感動しました。I君、ナイスです。精製しているわけではないのでほかの複合体もたくさん基板上に乗っているでしょうからこのままAFMで観察、とかいうことは出来ないとは思いますが、生化学的な分画を顕微鏡で見る、というのは意外と簡単で、今後、生化学が得意な方々が試されればいろいろ面白い事が分かってくるかもしれません。というか、一分子観察とかは、基本的にはそういう発想なのかもしれませんが。

ともあれ、アシベ探しは振り出しに戻ってしまったわけですが、(1)でちょっと触れた通り、siRNAライブラリースクリーニングが、意外にも、うまくいっている感触がありました。発想は単純。ncRNAと複合体を作っているタンパク質がもしあるのであれば、それをノックダウンすれば、ncRNAの細胞内局在が変わったり、ncRNAの安定性が変化したりするのではないか、ということです。で、ncRNAと複合体を作っているのであれば、きっとそのタンパク質には既知のRNA結合ドメインを持っているだろうという事で、既知のRNA結合タンパク質のうち発現量の多いものから片っ端から購入したsiRNAのライブラリーをHさんが気合いでスクリーニングして、Celf3なるタンパク質が取れてきたわけです。Celf3をノックダウンすると、Gomafuが著しく減少する。これはCelf3がGomafuの安定化に関わっていることを示唆しています。しかも、Celf3は神経系の組織にしか発現していない。Gomafuも神経系でしか発現していない。実は、Gomafuを体全体で発現するトランスジェニックマウスを作っていたのですが、神経系の組織以外では発現が意外と少なく、これも神経系特異的に発現するCelf3がGomafuを安定化しているという仮説で説明できるかもしれない!!

 というわけで、Celf3を発現していないL-cellにGomafuを発現させ、さらにCelf3を発現させたらどうなるのか、というこれまた単純な発想で見てみたらツモ一発か!!L-cell ではGomafuはあまり核に蓄積しないのですが、Celf3を発現させると、それが奇麗に見られるようになる???実はこれは僕自身がやった実験で、にわかには信じがたかったのですが、結果は奇麗!!


と、これは自慢のデータだったのですが、ラボのメンバーには再現できないと却下されてしまいました。。うーん。難しい。トランスフェクションされやすい細胞がGomafuが蓄積しやすいとか、そのほかいろいろこの手のデータが出る可能性は考えられますね。Celf3を発現していてもGomafuが蓄積しない細胞はこの視野以外ではたくさんみられましたし、たぶん、Celf3だけあればよいというわけではないのだろう、ということで、これはお蔵入り。

でも、Celf3が本当にGomafuと相互作用しているのか?と聞かれると、心もとないところはあります。そもそもCelf3がGomafuの発現を制御しているだけかもしれません。やはりここは(直接)結合しているかどうかを確かめないと、ということでUV-cross link免疫沈降をすると、UVを当てた時だけ共沈してきます。しめしめ。ちなみに、当初ネガコンとしてとったMalat1やら7SKともCelf3は結合しているようです。


ともあれ、かなり直接に、GomafuとCelf3は結合している、ということが予想されました。しかし、Gomafuのin situ hybridizationとCelf3の二重染色をすると、


どう見ても重ならない。。。免疫沈降で共沈するけれども染色では共局在しない。これは経験上ncRNAと「結合」タンパク質との間では良くあるパターンで、レフリーの半分は、じゃあ結合事態がうそなんだろう、という反応を示し、レフリーの半分は、もう少し違う条件で染色をしたら?と言ってくれるのですが、どれだけ色々な条件を試しても、染色でCelf3がGomafuと共局在することはありませんでした。

というわけで、この、最初はグー!の実験は、さらに迷走に迷走を重ねる事になってしまいました。

中川



August 28, 2014

アシベを求めて(2)

まずはアシベ探しのそもそもから。

いまや定年間近の感もありますが??、Gomafuにも期待の新人、新規ノンコーディングRNAと呼ばれていた時期もありまして、そのGomafuの相棒、アシベ探しは僕のラボでは優先順位第一のテーマでした。2007年ぐらいの頃でしょうか。いろいろ関連文献をサーチして、その時は、Xistを始めとした長鎖ノンコーディングRNAの複合体精製になんでみんなそんなに手間取っているんだろう?と、素人目にはとても不思議に思っていました。タグ付き分子免疫沈降一発&マス解析で転写因子複合体を始めとした各種複合体が次々と同定されていた時代でしたから、RNAにも「タグ」がつけられるMS2やらPP7やら最新のツールを使えばすぐ出来るだろう、と軽く考えていたのですが、RNA業界に出入りするようになって、色々な方々の話を聞くにつれ、その事情がだんだん飲み込めてきました。つまり、

長鎖ノンコーディングRNAの複合体は溶けん!!

と、いう事のようなのです。確かに、全部ペレットに行ってしまったら、アフィニティー精製もヘッタクリもあったものではありません。イオン交換カラムで精製しようとしてカラムを通したらいきなり全部voidに行ってしまったぐらいのショックです。逆転の発想で徹底的に溶けないものを精製してタイトジャンクションの接着分子を突き止めた月田承一郎さんを見習えとばかりに一攫千金を夢見て核分画をひたすらグアニジンとかUreaで洗って残ったのは老舗のhnRNPAやらCとかでしたし、Gomafuのノックアウトマウスは実は結構早い段階で出来ていたので、野生型の脳のlysateをGomafuノックアウトに免疫して複合体に対する抗体が出来ないかなとかいう「あったらいいな」実験をやったりしてみましたが当然何も成果は得られず、やはりここは正攻法で可溶化条件を探すしか無いか、ということでいくつか条件を試したのですが、確かに、確かに、溶けません。いやというほど溶けない。いったんスネだしたら駄々をこねてその場を動かない子供のように、最初の非イオン性界面活性剤のマイルドな処理で不溶性ペレットにいったGomafuは、8M Ureaで懸濁しようが、グアニジンを突っ込もうが、何をしても溶けてきません。ちなみに、奇妙な事に、細胞をいきなりグアニジンに溶かせば、溶けます。ある意味当然ですね。TrizolとかIsogenには溶ける(そもそもtotal RNA回収の時はそうしている)わけですから。このあたり生化学詳しい方がおられたら原理を教えていただければと思いますが、変性条件をだんだん上げていって溶かそうとすると不溶性になってしまうけれども、いきなり超ド級の変性条件に突っ込むと可溶化する(ただし複合体が解離してしまうので使い物にならない)。これは難溶性RNA複合体に共通の性質のような気がします。

 そのころ、I君がラボにjoinしてくれて、アシベの生化学的な同定というチャレンジングな課題に取り組んでくれる事になりました。で、いきなり、実験始めて2週間。

「Gomafu、溶けました。」

ん???あれだけ溶けない溶けないと言っていたGomafuが可溶化出来た、、、だと。
にわかには信じがたかったのですが、たしかに、奇麗に溶けています。

Isizuka et al., Gene Cells (2014) 19, 704- より

どうやらトリックはPBSで、細胞質と核の分画等にはHEPESやPIPESでバッファをとるものが多いのですが(上図のCSKはCytoskelton BufferでPIPESベースの緩衝液です)、リン酸バッファーを使うと、つまり高濃度のリン酸が入っていると、RNAータンパク質複合体は可溶化しやすい、かもしれない、、という狐につままれたようなデータが出てきました(PBS-TXとは単にTritonX100を入れたPBSです)。信じられない事に、Neat1やらXistやらも可溶化されています。これって凄い事なのではなかろうか!しかも、可溶化分画をショ糖密度勾配遠心にかけると、それらのRNA-タンパク質複合体がなんとなくそう思っていた重さのところに分画されてきます。Gomafu複合体とMalat1複合体が同じぐらいの大きさ。Xistがそれより重くて、Neat1が含まれているパラスペックルの複合体が最長不倒距離の重さ。

Isizuka et al., Gene Cells (2014) 19, 704- より

なんだ、この問題、解けたようなものだと軽率に思ってしまった事が、アシベ探しという意味ではドツボの始まりになってしまいました。

中川

August 22, 2014

アシベを求めて(1)

リニューアルオープンするする言いながら、なかなかしない、するする詐欺になりつつありますが(まだ全然原稿依頼が出来ていない、、、)、新学術非コードRNA公式ブログ(書いててなんだか悲しくなってきますが)の最後はやはりこのネタでしめてみたいとおもいます。

じゃじゃーん(pdfリンク付き。クリックしても課金はされません)。

Formation of nuclear bodies by the lncRNA Gomafu-associating proteins Celf3 and SF1


この公式ブログ(…)を長らくご覧になっていた方は覚えておられますでしょうか。今を去る事約4年前。2010年10月。こんな記事を書きました。

そのほかにもいろいろエピソードはあるのですが、長くなるのでこのあたりでやめておきます。ちなみに、例のライブラリー、他にも当たりがあるかとYHさんは残りのすべてを丁寧に見てくれたのですが、結局Xistが散るのはhnRNP U、たった一つでした。一発ツモで親マンひいたみたいなもんですから、そうそう幸運が続くわけもありません。とはいえ、実は他にもいろいろ面白い事が分かってきまして、続きは後日。この新学術が続いているうちにまた論文にまとめられればよいのですが。。。」

話を簡単にまとめますと、
↓新規ncRNAであるGomafuの相互作用タンパク質を取りたかった。
↓Gomafuの相互作用因子がとれたらアシベだね、とRNA学会の飲み会でK山氏の提案。
↓アシベをKDしたらGomafuの局在や発現量が変わるかも!
 2006年RNA若手の会の帰りのバスでK村宏さんからのアドバイス。
 (覚えておられないんだろうなあ、、、)
↓アシベ探しのためのカスタムsiRNAライブラリ発注。
 (僕とS根で発現量の多いRNA結合タンパク質を選び、siRNAを買えるだけ買った)
↓GomafuばっかりやっとったらあかんのちゃうというO野さんのアドバイス!
 (さきがけの領域会議かなんかのこれも帰りのバスだったような、、、)
↓アシベライブラリーをXist染色体局在化因子スクリーニングに転用することを決意。
 (はい。目的外使用です。文科省さんゴメンナサイ。)
↓Candidate molecule approach、筒井さんと筒井さんのアドバイスもあって
 hnRNP Uノックダウンで一発ツモ。
 (百年分の運とツキをここで使い果たす。)
↓で、このライブラリーはアシベライブラリーなんですけど、ということでHGWさん怒濤
 のスクリーニング(KD > RNA回収 > qPCR)。
↓ん!!Tnrc4/Celf3をノックダウンするとGomafuの量がめちゃくちゃ減る!!

2010年の3月のプログレスレポートの、qPCRの結果を確認したノザンブロット。きれいですね。



それまで、Gomafu相互作用因子としてスプライシング因子であるブランチ部位結合タンパク質SF1は同定されていたものの、アシベと名付けるのはさすがにはばかられていましたが、Tnrc4とかCelf3とかだったら、あんまり人口に膾炙しているわけではないし、Ashibe1とか名前つけちゃっても良いかも、、、などという不遜な考えに神の鉄槌が下ったのでしょうか。この発見はこの後、迷走に迷走を重ねる事になりました。

中川

ーー
そう。RNA若手の会の帰りのバスで、何か良いことが起きるかも。今年は南紀白浜です。
http://www.phar.kindai.ac.jp/genome/RNAFrontierMeeting/


August 18, 2014

Rでいこう!!〜その3

前回は棒グラフと箱ヒゲ図、beeswarm plotを書くための簡単な例を出しましたが、今回は折れ線グラフです。繰り返しになりますが、Rは作図の命令をいちいちコマンドで書かなければいけないので直感的でなく、従ってハードルが高くなってしまうのですが、命令文さえ一度作ってしまえば、コピペ一発で図が出来るので、むしろ簡単!毎回同じ図を作るのには最適です。

またここでエア実験。ノックアウトマウスと野生型マウスの産仔数の増加数のデータのファイルを用意します。
weeks WT KO
1 0 0
2 0 0
3 50 6
4 52 6
5 53 10
6 67 10
7 88 10
8 88 15
9 104 15
10 104 23
11 110 30
12 131 34
13 131 35
14 131 34
これをCummulative_pups.csvという名前で保存しておきます。あとは命令文一発。
紫のファイル名と項目名を変更すればどんな時にも使えます。

data<-read.csv("Cummulative_pups.csv")
postscript("Cummulative_pups.eps", horizontal = FALSE, onefile = FALSE,paper = "special", height = 4, width = 4)
plot(data$WT,xlab="",ylab="",type="s",lwd="2",col="blue")
points(data$KO,type="s",lwd="2",col="magenta")
dev.off()


いやあ。実に簡単ですね。また、普通の折れ線グラフはともかく、こういう階段状のグラフをエクセルで書くのはとても大変です。縦軸の数値がちょっとぎこちないですが、この場合ならplotのコマンドのところにyaxp=c(0,120,3)と入れてやればすぐに直ります。普通の折れ線グラフにしたければ、上の命令文をコピペして、lty="l"にすれば良いだけ。p, l, b, c, o, h, s,など色々入れて遊べます。たとえばlty="l"ならこんな感じ。紫のところが変更点です。

data<-read.csv("Cummulative_pups.csv")
postscript("Cummulative_pups.eps", horizontal = FALSE, onefile = FALSE,paper = "special", height = 4, width = 4)
plot(data$WT,xlab="",ylab="",type="l",lwd="2",col="blue",yaxp=c(0,120,3))
points(data$KO,type="l",lwd="2",col="magenta")
dev.off()

細かい説明ですが、
折れ線グラフを書くための基本コマンドは
data<-read.csv("読み込むファイル名.csv")
postscript("出力ファイル名.eps",horizontal=FALSE,onefile=FALSE,paper="special",height=縦のサイズ,width=横のサイズ)
plot(data$最初の項目名,xlab="横軸ラベル",ylab="縦軸ラベル",type="折れ線グラフの種類",lty="線の種類",lwd="線の太さ",col="線の色")
points(data$次の項目名,type="折れ線グラフの種類",lty="線の種類",lwd="線の太さ"col="線の色")
points(data$その次の項目名,type="折れ線グラフの種類",lty="線の種類",lwd="線の太さ"col="線の色")
....
dev.off()

ここで、
軸のラベルはイラストレータ等で後から入れた方が何かと便利なので""にしてしまいます。
折れ線グラフの種類は、階段状にしたければs。普通の折れ線グラフならlとかb。
線の種類はデフォルトが1で実線。2,3,..,6で様々な点線も指定できます。
線の色はblack, blue, red, green, yellow, magentaなどが使えます。
項目が複数あればpointsの行を増やしていくだけ。

パラメータ、点線は何だったっけ?というときは、Rのヘルプ窓がコンソールのウィンドウの右上にありますから、そこでヘルプミーしたら懇切丁寧に教えてくれます。また、便利な事にいろいろなウェブサイトでRのコマンドやパラメータの詳しい解説があります。以下、ほんの一例。

Rの初歩(ググると大抵一番上にヒットするサイト。分かりやすい)
 http://oku.edu.mie-u.ac.jp/~okumura/stat/first.html
バイオインフォマティックス入門(Rに限らずこれは便利!)
 http://bio-info.biz/tips.html#tr
統計解析フリーソフトRの備忘録
 http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html

 このあたり時代は変わりましたね。かつては大学院生の先輩や研究室のスタッフはこういったマメ知識の蓄積で若い人からのささやかな尊敬を勝ち得ていたものですが、ちかごろはiPhoneにすっかりお株を奪われた感もあります。でも、先輩も、スタッフも、寂しいのです。若い学生さんはひとつ大人の対応をということで、ウェブに聞けば2秒で済む事も、研究室の先輩やスタッフに積極的に聞いてあげましょう!

 あと、ここではエア実験でデータを揃えましたが、当然本番で使うデータはqPCRマシンからのデータなり、画像解析から出てきたデータなり、ノートに記された記録なり、ということになります。もともとサイエンスの世界ではエア実験はしないという紳士協定がありましたが、昨今では悲しい事にこのルールを破っているとしか思えない例も少なからず見られるようです。Rの作図に用いたcsvファイルだけでは、「本当に実験やったの?」と、いわれの無い疑いをかけられた時に強く反論できません。でも、大丈夫。そういう時は、csvの作成に使った生データ、元データを出せば何の問題もありません。こういうデータは特定のフォルダに整理してまとめておき、必要に応じて公開する義務を負うのがこれからの標準ルールになっていくのかもしれません。

中川

(この項おしまい。近いうちに、ncRNA+BlogはncRNAネオタクソノミ公式ニュースレターページとして生まれ変わる予定です)


July 26, 2014

Rで行こう!!〜その2

ものすごく高度な使い方が出来るらしいRを僕のような素人が使うのはちょっとハードルは高かったのですが、図を書くのは実はエクセルよりもずっと簡単!

Rを使うのにはアプリケーションをインストールしなくてはいけません。一番手軽で親しみやすいのは、エクセルやワードと同じように、単体のアプリケーションをインストールする事で、東大の農学研究科の門田さんのホームページに詳しいです。
http://www.iu.a.u-tokyo.ac.jp/~kadota/r_seq.html#install
マック板のインストールはこちらのpdfのほうが詳しいです。
http://www.iu.a.u-tokyo.ac.jp/~kadota/R_install_mac.pdf
ちなみに、このホームページはすごい充実ぶり。今度授業にモグリにいこうかな、、、

さて、ここでエア実験。次のようなウエスタンの定量の結果がでてきたとしましょう。
WTのタンパク質量:5.3, 2.9, 3.4, 5.2, 4.6
KOのタンパク質量:9.2, 7.4, 3.5, 6.9, 8.2

エクセルなどの表計算ソフトで
WT KO
5.3 9.2
2.9 7.4
3.4 3.5
5.2 6.9
4.6 8.2
こんなファイルを作って、適当な名前を付けて.csv形式で保存します(ここでは"exp_1.csv"にします。)。ちなみに、R関連のデータは全て一つのフォルダにまとめておくと便利です。僕自身はDropboxの下にRのフォルダを作って、その下にプロジェクトごとのフォルダを作り、全てのcsvファイルはそこに放り込んでいます。ファイル名にはスペースだとかハイフンだとか使わずにアンダーバー"_"を使うと、なんかちょっとだけ大人になったような気がしますね。文系の彼女からささやかな尊敬のまなざしをむけてもらえるかも(妄想と偏見はいってます…)。かつてこのキーを探すのに四苦八苦した思いがありますが、右下のシフトキーの隣です。

次に、Rを立ち上げて、作業ディレクトリを指定します。Macだったらcommand+Dでフォルダ指定のウィンドウが出てきます。もしくは、メニューの「その他」から「作業ディレクトリの変更…」を選びます。csvファイルを放り込んでいるフォルダを選べばオーケー。

箱ヒゲ図やbeeswarm図を書こうと思ったら、ちょっとおまじない。メニューの「パッケージとデータ」から「パッケージマネージャ」を選んで、beeswarmにチェックを入れておきます。

で、やる事は簡単。Rコンソール画面で次の文字を打ち込むだけ。このままコピペでコンソール画面に貼付けてリターンを押しても構いません。

data<-read.csv("exp_1.csv")
boxplot (data)

おおっ!!という間もなく、Quartz 2[*]というウインドウに箱ヒゲ図が現れます。ウィンドウの大きさをいじれば大きさもかえられますし、pdf形式で保存もできます。

こんな簡単で良いのだろうか、、、というのが第一印象でした。この図、エクセルで書こうと思ったらものすごく手間がかかる、というか、書けませんよね?

ただ、縦軸がゼロ起点でないのが気に入らないとか、boxplotに重ねてbeeswarm(全てのデータをプロットしたもの)を重ねたいとか、全てのグラフで決まった形式で同じ大きさで出力したいとか、いろいろ要望があると思います。僕自身は、この手のデータは全て次の命令文で出力する事に決めています。

postscript("出力したいファイル名.eps", horizontal = FALSE, onefile = FALSE,paper = "special", height = 4, width = 3);
data<-read.csv("拡張子csv付き読み込みたいファイル名.eps")
beeswarm (data, pch=16,col="blue", ylim=c(0,max(data, na.rm=T)))
boxplot (data, add=TRUE, ylim=c(0,max(data)))
dev.off()

こうすると、もとのcsvファイルを置いていたフォルダに、出力したいファイル名.epsというファイルが生成されるので、それをイラストレータやパワーポイント等に貼付ければ、図のいっちょ上がりです。

Rで便利なのは、この手の命令文をためておける点で、いったん気に入ったフォーマットで図がかければ、あとはそれをコピペで使えます。つまり、csv形式でどんどんいろいろなデータを保存していって、図にする時は同じ命令文で読み込みファイル名を変更するだけで、簡単に同じ図が作れます。eps形式のファイルはイラストレータにドラッグ&ドロップで貼付ける事が出来ますが、これはリンクで貼付けられているために、epsファイルの方が更新されれば自動的にイラストレータの図のほうも更新されるのもとっても便利です。たとえば、実験の例数が増えた時も、元のcsvファイルを書き換えて、以前図を作った時のRの命令文をもう一回Rコンソール画面に貼付けてリターンキーを押すだけ。全く同じフォーマットでイラストレータの図の更新が出来ます。

ちなみに棒グラフはもうちょっと面倒くさくて、
postscript("出力したいファイル名.eps", horizontal = FALSE, onefile = FALSE,paper = "special", height = 4, width = 3);
data<-read.csv("拡張子csv付き読み込みたいファイル名")
average<-apply(data, 2, mean, na.rm = T)
stdev<-apply(data, 2, sd, na.rm = T)
bar<-barplot(average, ylim=c(0,max(average+stdev)))
arrows(bar, average-stdev, bar, average+stdev, angle = 90, length = 0.1)
arrows(bar, average+stdev, bar, average-stdev, angle = 90, length = 0.1)
dev.off()


あー面倒くさ…という感じですが、いちおうこれでエクセル風の図を書こうと思えば、書く事は出来るようです。ただ、棒グラフにしてしまうと、いろいろな情報が消えてしまっている事が分かると思います。そもそも、nがいくつか、図からは分かりません。
(追記:また、エクセルだとエラーバーをつけるのにいちいち標準偏差を計算したセルを作って、グラフでエラーバーの追加を選んで、標準偏差のセルを指定して、と面倒くさいですね。Rなら、よみこむファイル名を変えてコピペ一発でオーケー)

最近特に思うのは、ここでやったようなエア実験ではなく、特に動物実験のような精神的に重めの実験の場合、一つ一つの実験データへの愛着を表現できるboxplot-beeswarmの方がしっくり来るなあ、ということです。例えば、このエア実験でも、KOのくせに一匹だけWTとかわらないけしからん奴がいますが、それが棒グラフでは分かりません。じっさいそういうことは往々にして起きるのですね。こそっと無かった事にしたくなったりもしますが、苦労した実験ほど一つ一つのデータに愛着が出てきますし、そのデータのすべてを論文で表現したい。そういう要望にRは簡単に答えてくれます。

あと、Rでグラフを書く、というのは、コマンドを入力して命令を実行するという点で、NGSデータのなんちゃって解析に通じるものがあるような気がします。これからはマッピングから普通の発現量解析ぐらいまでなら実験屋も普通にやらなければいけない時代だと思いますし、NGS解析へのハードルを低くするためにも、学生さんは特に、早いうちからエクセルでなくRで作図をする習慣を付けてみられてはいかがでしょうか!とりあえずデータ(WTとKOの2条件でなくても構いません)のcsvファイルを作って、上のRのコマンドをコピペで貼付けて実行してみて下さい。その有用性がすぐ分かると思います。

中川

July 12, 2014

Rで行こう!!〜その1

新学術「ノンコーディングRNAネオタクソノミ」領域は発足したものの、班員の間での情報共有、情報発信のやり方はまだ決まっていません。ですので、こちらのほうで、しばらく覚え書きを続けさせていただきます。まずは、「Rで行こう!!〜その1」ということで。

そもそも何故唐突にRかということなのですが、現在Journal of Cell Biologyなどで推奨されている図でエクセルのグラフ機能に無い図をかなり簡単に作れるから、という事に尽きます。ちなみに僕自身は統計についての知識はサッパリですし、Rも、使いこなしている人がイチローなら、少年野球の補欠ぐらいのレベルです。そもそもエクセルで作った図ですら、自分の論文にのせたのは学生の頃は皆無。ポスドクで留学した時の論文がはじめて。しかも、「写真見たら分かるじゃないですか。統計データ集める意味わかりません。」とか言って当時の上司を困らせていた、穴が入ったら入りたい、忸怩たる思いの思い出があります。今から思えば冷や汗ものなのですが、おぬしやる気あるんかと怒鳴り散らさず、心優しいChristineは天使の笑顔で、「もし私があなたのサンプルから統計データを取れと言われればもちろん喜んでやらせていただくわ」。それから数日、黙々と顕微鏡をのぞいて僕のノートにP=0.0000001となるであろう数値を書き込むChristineの背中を見ながら、何を思ったか。。。北風と太陽ではありませんが、今も昔も反省のきっかけになるのは、太陽な方々の背中であると、つくづく思う次第です。反省、反省、反省、、、

反省ばかりしていては前に進めませんので、話をググっとグラフに戻しますと、我々実験系の生物学で一番良くあるパターンのグラフは、コントロールと実験区。平均値と標準偏差。この黄金パターンです。ノックアウトマウスの解析であれば、WTとKO。生化学的な解析であれば、なんたら蛋白あり、なし。生物学的な実験であれば、大体n=2か3でそのようなデータを出してきて、定量した値をグラフで表して、ね、だからこの写真やウエスタンのフィルムの言う通りでしょ、許してね、というパターンがほとんどなのではないでしょうか。

おなじみエクセルで作る典型的な図はこんな感じ。

でも、それで良いのかな?Rならこんな図が簡単に書けます。

というところから始めていきたいと思います。ほんとに単なる恥さらしな覚え書きですが、特にこれからこういう図をやまほど作っていく事になる学生さんには役に立つかなと思いまして。。。

中川