企业网站建设河北,创意海报设计,建网站 发信息 做推广,中国最顶尖的广告公司DESeq2和EdgeR都可用于做基因差异表达分析#xff0c;主要也是用于RNA-Seq数据#xff0c;同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据。这两个都属于R包#xff0c;其相同点在于都是对count data数据进行处理#xff0c;都是基于负二项分布模型。因此会发现#xff…DESeq2和EdgeR都可用于做基因差异表达分析主要也是用于RNA-Seq数据同样也可以处理类似的ChIP-Seq,shRNA以及质谱数据。这两个都属于R包其相同点在于都是对count data数据进行处理都是基于负二项分布模型。因此会发现用两者处理同一组数据最后在相同阈值下筛选出的大部分基因都是一样的但是有一部分不同应该是由于其估计离散度的不同方法所导致的。 ### DESeq2的使用方法输入矩阵数据行名为sample列名为geneDESeq2不支持无生物学重复的数据因此我选择了2个样本3个生物学重复的数据并对count data取整(经大神指点这里需要说明下我的测试数据readcount是RSEM定量的结果并不是常见的htseq-count的结果所以count值会有小数点而DESeq2包不支持count数有小数点所以这里需要round取整)。database_all database type database 设置分组信息以及构建dds对象condition coldata dds 使用DESeq函数进行估计离散度然后进行标准的差异表达分析得到res对象结果dds res 最后设定阈值筛选差异基因导出数据table(res$padj 0.05)res resdata write.csv(resdata,file LC_1_vs_LC_2.csv)EdgeR的使用方法跟DESeq2一样EdgeR输入矩阵数据行名为sample列名为geneDESeq2不支持无生物学重复的数据因此我选择了2个样本3个生物学重复的数据。exprSet_all exprSet group_list 设置分组信息去除低表达量的gene以及做TMM标准化exprSet 1) 2,]exprSet exprSet 使用qCML(quantile-adjusted conditional maximum likelihood)估计离散度(只针对单因素实验设计)exprSet exprSet 寻找差异gene(这里的exactTest函数还是基于qCML并且只针对单因素实验设计)然后按照阈值进行筛选即可et tTag tTag write.csv(tTag,file LC_1_vs_LC_2_edgeR.csv)Summary以上我主要针对单因素两两比较组进行差异分析其实DESeq2和EdgeR两个R包都可以对多因素进行差异分析。DESeq2修改以上代码的分组信息design参数以及在差异分析results函数中添加所选定的分组因素其他代码基本一样具体参照DESeq2手册EdgeR则需要用Cox-Reid profile-adjusted likelihood (CR)方法来估算离散度y