生信之旅

扫码分享下吧!
分享

GWAS分析-EMMAX软件

GWAS的全称是全基因组关联分析(Genome-wide association study),从物种基因组范围内中找出存在的单核苷酸多态性(SNP),与某种表型进行关联分析,从而找出与表型相关的SNPs。进行GWAS分析的软件有很多,今天我们主要使用EMMAX软件,其官网为(http://genetics.cs.ucla.edu/emmax/),该软件使用的是混合模型。下面介绍它的安装及使用:

emmax

一、安装

该软件的安装比较简单,直接在linux平台下解压缩即可。

tar -zxvf emmax-beta-07Mar2010.tar.gz

解压缩出来的目录中包含了emmax、emmax-kin 、README三个文件。

二、数据集准备

该软件的使用也较为简单,主要需要构建其能识别的输入文件格式。

  1. 基因型文件其识别的基因型文件为tped格式,你可以使用plink将VCF文件转为该格式。
  2. plink --allow-extra-chr --recode --vcf ${infile}.vcf --out ${outfile}plink --file $infile --make-bed --allow-extra-chr --out $oufileplink --bfile $infile --recode12 --output-missing-genotype 0 --transpose --out $outfile --allow-extra-chr
  3.  表型文件整理完基因型文件后,我们需要整理表型文件,表型文件每一行为一个样本记录,其样本顺序需要与上一步生成的tfam文件的顺序一致,表型文件包含三列FAMID,INDID和表型值。缺失的表型值应表示为“NA”
  4. 协变量文件(可选)若有协变量存在,还可以构建协变量文件,其格式与表型文件一致。

三、使用

该软件的使用分为两步,详细可参考官网文档(https://genome.sph.umich.edu/wiki/EMMAX):

  1.  构建亲缘关系矩阵
    使用emmax-kin进行构建
    emmax-kin -v -d 10 [tped_prefix]
  2. 进行关联分析使用emmax进行关联分析
    emmax -v -d 10 -t [tped_prefix] -c 协变量文件 -p 表型文件 -k 亲缘关系矩阵 -o 输出文件前缀

以上就是GWAS分析的简单流程,明天给大家介绍曼哈顿图的绘制!

该文主要发表于我的公众号,欢迎关注我的公众号“生信之旅”

版权声明:本文转载请注明出处!

最新评论:

头像
    s 2021年6月1日 09:35

    我在构建亲缘关系矩阵的时候,出现emmax-kin 未找到命令,是什么原因呢


头像
    微生信在线作图 2020年4月29日 09:10

    很好!


发表评论

电子邮件地址不会被公开。 必填项已用*标注

captcha

公告栏

有任何问题均可以在文章页面留言!或者邮件 burning@burning.net.cn 欢迎关注微信公众号 “生信之旅”,每天均可在菜单栏领取外卖红包、支付宝红包!最高20元!

服务器推荐

欢迎关注公众号

欢迎关注生信之旅