admin 2025-05-23 18:07:09 世界杯足球现场

找不到某些GEO数据的表达矩阵肿么办

举个栗子,GSE99410和GSE78200。

library(GEOquery)

gse = "GSE78200"

eSet <- getGEO(gse, destdir = '.',getGPL = F)

exp <- exprs(eSet[[1]])

#Error in exp[1:4, 1:4] : subscript out of bounds

exp[1:4,1:4]

boxplot(exp)

#Error in names(groups) <- nam : 'names' attribute [10] must be the same length as the vector [0]

代码看起来没有问题,怎么就画不了图?

dim(exp)

#[1] 0 10

因为它是空数据啊。

有两种情况

第一类,不是芯片数据,用于后续分析的文件以其他形式存储了,这是GSE99410的

这是GSE78200的:

第二类,就是作者没有并上传表达矩阵,而是只提供了原始数据文件,如CEL、txt、gpr等格式。

原始数据的处理,有法可依呀。

CEL格式的芯片原始数据处理方法

aglient 家txt格式的芯片原始数据处理方法

gpr格式的芯片原始数据处理方法

如果是illumina的bead芯片,可以用lumi试试,还没有整理。

处理原始数据的技能搞定,还有一个问题可以一并解决:

表达矩阵里有负值,无法正常用limma包做下游分析了,也可以找找原始数据去处理它 ~