2018年06月19日(火)

フォルダ内のファイル名を取得してまとめて処理

投稿者:

公共データベースから大量にsraファイルをダウンロードしてきたり、自前のRNAseqのデータがわんさかある時、フォルダ内のファイル名を取得して一括処理する場面が往々にして出てきます。Rの場合はlist.filesという便利なコマンドがあるのでファイル名をベクターに入れてforループでまわせば良いですが、ターミナルの時はどうするんだろう?スペイン語をマスターするとイタリア語もある程度わかるらしいですが、Rをちょとかじったぐらいではターミナルのbashはとてもとても、、、とりあえずググってもなんだか?の記事ばかりで、まあ、このあたりは検索ワードのチョイスのセンスがないと路頭に迷いがちなのですが、なんとかとてもわかりやすい記事にたどりつきました。早速その内容を取り入れてサルマップ2018のまとめをアップデートして、ついでに少しでも同じような境遇で同じようにつまづいているベンチ屋と情報共有しようとTWしたら、これがすごい勢いでレスがついてなんだかすごく役に立ちそうなので、こちらにまとめておきます。

事の始まりは僕のこのTW。

早速専門家のツッコミが入ります。

こういうアドバイスは本当にありがたいですね。早速サルマップのほうもアップデートしたのですが、ツッコミはこれにとどまらず。どうやらプログラマーのツボにハマったみたいで、、、

おおっ!これはなんだかミニプレップのレベルをとうに超えてます。さらにコメント続きます。

なんだか一気に賢くなった気がします。次はぜったいコピペでなくてシェルスクリプト書くんだ!とモティベーションアップ↑↑↑です。

それにしても、この、インフォ界隈の人々の助言文化、素晴らしいなあと思います。一昔前はBio Technical フォーラムで自分も知らない分子生物学系のトピがたくさん立ってとても勉強になりましたが、最近はこちらのリテラシーも向上して落ち着いている感じ。素人質問に始まりリテラシーが向上してゆく過程は、なんだかとてもワクワクします。下手の横好きのなんちゃってインフォがやめられないのは、このワクワク感も大きいような気がします。とまれ、今日のフレーズはこれ!

for filename in *.gz; do
  echo $filename
  echo `date` ${x}
  ...
done

 

中川 真一

北海道大学 薬学研究院 教授
▶ プロフィールはこちら

ブログアーカイブ

ログイン

サイト内検索