Exome 解析に使うツール群のリンク (主に Exome)

ツールアップデートめんどいので、なるべく CUI からいけるように付記したバージョンを書き起こした。

  • FastQC

http://www.bioinformatics.bbsrc.ac.uk/projects/fastqc/

  • FASTX-Toolkit

http://hannonlab.cshl.edu/fastx_toolkit/

  • Burrows-Wheeler Aligner

http://bio-bwa.sourceforge.net/
https://github.com/lh3/bwa

git clone https://github.com/lh3/bwa.git

bwa-0.6以降では SOLiD/colorspace 対応がなくなっている様子 (オプションとしては見えるが、README か NEWS にそう書かれている)。必要な場合は bfast や bwa-0.5.10など対応版を使うしかなさそう。

  • SAMtools

http://samtools.sourceforge.net/

svn co https://samtools.svn.sourceforge.net/svnroot/samtools/trunk/samtools

  • Picard

http://picard.sourceforge.net/

svn co https://picard.svn.sourceforge.net/svnroot/picard/trunk picard

svn よりバイナリーをダウンロードした方がラク

  • bedtools - bedtools: a flexible suite of utilities for comparing genomic features.

http://code.google.com/p/bedtools/
https://github.com/arq5x/bedtools

git clone https://github.com/arq5x/bedtools.git

http://www.openbioinformatics.org/annovar/
作者にメールする必要がある

  • GATK

http://www.broadinstitute.org/gsa/wiki/index.php/Home_Page

git clone https://github.com/broadgsa/gatk.git

  • Dindel: Accurate indel calls from short-read data - Wellcome Trust Sanger Institute

http://www.sanger.ac.uk/resources/software/dindel/

wget -r -np -nd ftp://ftp.sanger.ac.uk/pub4/resources/software/dindel -P dindel

  • Pindel

https://trac.nbic.nl/pindel/

svn checkout https://trac.nbic.nl/svn/pindel pindel

その他

  • dbSNP VCF

ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606/VCF/v4.0/000-README.txt
ただし annovar のそれを使った方が楽なケースが多いと思う

  • variationtoolkit

svn checkout http://variationtoolkit.googlecode.com/svn/trunk/ variationtoolkit-read-only

  • vcftools

http://vcftools.sourceforge.net/

svn co https://vcftools.svn.sourceforge.net/svnroot/vcftools vcftools

  • VarScan

Variant Detection in Massively Parallel Sequencing Data

http://varscan.sourceforge.net/

  • ExomeCNV

Availability: CRAN package "ExomeCNV"
http://cran.r-project.org/web/packages/ExomeCNV/index.html
2012/06/01にもアップデートしてる
ExomeCNV User Guide - Nelsonlab
https://secure.genome.ucla.edu/index.php/ExomeCNV_User_Guide

  • exomeCopy

http://bioconductor.org/packages/release/bioc/html/exomeCopy.html

  • CNVnator

http://sv.gersteinlab.org/cnvnator/

  • CNAseg

http://www.compbio.group.cam.ac.uk/software.html
download
http://www.compbio.group.cam.ac.uk/Resources/CNAseg/CNAseg.rar
example data
http://www.compbio.group.cam.ac.uk/Resources/CNAseg/CNAseg_exampledata.rar

  • GATK の資料

GATK documentation index
http://www.broadinstitute.org/gsa/gatkdocs/release/
Running the GATK for the first time - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Running_the_GATK_for_the_first_time
Best Practice Variant Detection with the GATK v3 - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Best_Practice_Variant_Detection_with_the_GATK_v3
Frequently Asked Questions - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/Frequently_Asked_Questions
GATK resource bundle - GSA
http://www.broadinstitute.org/gsa/wiki/index.php/GATK_resource_bundle

  • Bowtie2

http://bowtie-bio.sourceforge.net/bowtie2/index.shtml

  • TopHat - A spliced read mapper for RNA-Seq

http://tophat.cbcb.umd.edu/
iGenome にあるゲノムとインデックスは bowtie2 のものにアップデートしているとウェブサイトに表記がある
http://tophat.cbcb.umd.edu/igenomes.html

  • Cufflinks - Transcript assembly, differential expression, and differential regulation for RNA-Seq

http://cufflinks.cbcb.umd.edu/

  • Bowtie2

http://bowtie-bio.sourceforge.net/bowtie2/index.shtml

  • BFAST: Blat-like Fast Accurate Search Tool

http://sourceforge.net/apps/mediawiki/bfast/index.php?title=Main_Page

git clone git://bfast.git.sourceforge.net/gitroot/bfast/bfast

  • IGV

http://www.broadinstitute.org/software/igv/
http://www.broadinstitute.org/software/igv/download

  • jksrc のバイナリー

http://hgdownload.cse.ucsc.edu/admin/exe/

TruSeq Exome 関連