GWAS分析-EMMAX软件
GWAS的全称是全基因组关联分析(Genome-wide association study),从物种基因组范围内中找出存在的单核苷酸多态性(SNP),与某种表型进行关联分析,从而找出与表型相关的SNPs。进行GWAS分析的软件有很多,今天我们主要使用EMMAX软件,其官网为(http://genetics.cs.ucla.edu/emmax/),该软件使用的是混合模型。下面介绍它的安装及使用:
一、安装
该软件的安装比较简单,直接在linux平台下解压缩即可。
tar -zxvf emmax-beta-07Mar2010.tar.gz
解压缩出来的目录中包含了emmax、emmax-kin 、README三个文件。
二、数据集准备
该软件的使用也较为简单,主要需要构建其能识别的输入文件格式。
- 基因型文件其识别的基因型文件为tped格式,你可以使用plink将VCF文件转为该格式。
plink --allow-extra-chr --recode --vcf ${infile}.vcf --out ${outfile}plink --file $infile --make-bed --allow-extra-chr --out $oufileplink --bfile $infile --recode12 --output-missing-genotype 0 --transpose --out $outfile --allow-extra-chr
- 表型文件整理完基因型文件后,我们需要整理表型文件,表型文件每一行为一个样本记录,其样本顺序需要与上一步生成的tfam文件的顺序一致,表型文件包含三列FAMID,INDID和表型值。缺失的表型值应表示为“NA”
- 协变量文件(可选)若有协变量存在,还可以构建协变量文件,其格式与表型文件一致。
三、使用
该软件的使用分为两步,详细可参考官网文档(https://genome.sph.umich.edu/wiki/EMMAX):
- 构建亲缘关系矩阵
使用emmax-kin进行构建emmax-kin -v -d 10 [tped_prefix]
- 进行关联分析使用emmax进行关联分析
emmax -v -d 10 -t [tped_prefix] -c 协变量文件 -p 表型文件 -k 亲缘关系矩阵 -o 输出文件前缀
以上就是GWAS分析的简单流程,明天给大家介绍曼哈顿图的绘制!
该文主要发表于我的公众号,欢迎关注我的公众号“生信之旅”
版权声明:本文转载请注明出处!
最新评论:
s 2021年6月1日 09:35
我在构建亲缘关系矩阵的时候,出现emmax-kin 未找到命令,是什么原因呢
微生信在线作图 2020年4月29日 09:10
很好!
发表评论
电子邮件地址不会被公开。 必填项已用*标注