iGenomesよりダウンロードしたラットゲノムを使って解析している。

今回ダウンロードしたのはRattus norvegicusのEnsembl(Rnor_6.0)をダウンロードして使っている。
同じダウンロードファイル内にあるgtfファイルで一般的なRNA-seq解析パイプラインを動かしていた。

ところがどっこい、UCSCのテーブルブラウザからダウンロードしたアノテーションファイル(.UCSC)での解析がうまくいかない。
はてさてなんでだろうと思ったところ、すぐに原因が分かった。
このiGenomes上のラットゲノムとテーブルブラウザ上の染色体番号の扱いが異なっていた。

一番染色体を表す場合、iGenomes版では”1”、テーブルブラウザ上では”chr1”となっていた。
なぜiGenomes版はこんな面倒な番号になっているのだろうか...。

ちなみに同じくiGenomes上のUCSC版では、普通にchr1になっていた。
Ensembleだからってことなのかな...?

#追記(2018/10/11)
iGenomesのマウス(mm10)- Ensembleでも同様の表記になっていました。
なるほど。