Progressのある曜日
小さい雑用が来た。
と思ったら、なかなか手間取る。
2次元の表(行項目がサンプルで、SNPが列項目)で同一データを持っている列を簡単に探せる方法が見つからない。Rでfor文とcor()でグルグルと相関係数1のところを探させるとずいぶん時間がかかる(放って帰宅)。何かないのだろうか。
<追記>
unique()とduplicated()で出来るようだ。
unique(as.matrix(data),MARGIN=2)
で同じデータを持つ列はuniqになる。データがdata.frameなのでas.matrixしてやらないといいみたい。
あとna.actionがないので欠損値をいじることが出来ない。
将来的には、imcoparablesという引数で選択出来るようだが、今のところFALSEしか駄目(R2.0.1)。