在文献 J Natl Cancer Inst. 2018 Jul ;题目是:Intratumor Heterogeneity of the Estrogen Receptor and the Long-term Risk of Fatal Breast Cancer,看到该研究使用的是agilent表达芯片,老实说我其实不太喜欢这个公司的芯片,从数据分析的角度来说,因为其R包非常少。不过作为生信技能树,我们不得不全面建设不同类型数据分析流程,所以还是硬着头皮啃一下这个数据分析:
既然是附件补充材料里面有描述,我就去看了看,希望找到芯片数据的GSE号:
结果,不仅没有找到ID号,而且还看到了oligo包,很有趣,第一次看到oligo包可以处理agilent芯片的,不知道亲爱的读者你们觉得这个靠谱吗?
关于oligo包
我在你要挖的公共数据集作者上传了错误的表达矩阵肿么办(如何让高手心甘情愿的帮你呢?) 这个教程里面介绍过,可以用来处理affy芯片的原始数据,就是cel文件,示例代码如下:
# BiocManager::install(c( 'oligo' ),ask = F,update = F)
library(oligo)
# BiocManager::install(c( 'pd.hg.u133.plus.2' ),ask = F,update = F)
library(pd.hg.u133.plus.2)
dir='~/Downloads/GSE84571_RAW/'
od=getwd()
setwd(dir)
celFiles <- list.celfiles(listGzipped = T)
celFiles
affyRaw <- read.celfiles( celFiles )
setwd(od)
eset <- rma(affyRaw)
eset
# http://math.usu.edu/jrstevens/stat5570/1.4.Preprocess_4up.pdf
save(eset,celFiles,file = f)
# write.exprs(eset,file="data.txt")
只需要在GEO该数据集的主页里面找到原始芯片数据,下载解压为 ~/Downloads/GSE84571_RAW/ 文件夹里面,然后使用我们这个示例代码就可以得到的eset这个对象,与我们之前一直讲解的GEOquery包下载是一样的, 所以后续代码不需要变化。
必须要注意的是你的电脑里面的 ~/Downloads/GSE84571_RAW/ 文件夹里面有cel文件哦。
关于affy芯片
昂飞(Affymetrix)公司,基因芯片行业的先驱,全球销量第一的基因芯片厂家。它是第一款商业化基因芯片的诞生之地,它是全球基因芯片行业标准的制定者。
上个世纪八十年代,Stephen P.A. Fodor博士与他的科学家团队将组合化学技术与半导体制造技术结合,尝试在小玻璃芯片上建立大量生物数据。这一革命性的想法经过他们十多年的钻研尝试,成为了现实——他们发明出革命性的基因芯片GeneChip®技术。这一技术迅速进行商业转化,由Affymax公司的Affymetrix部门专职运营。
1992年,Stephen P.A. Fodor博士带领Affymetrix部门从Affymax公司独立出来,在硅谷中心单独成立公司,名字仍采用Affymetrix,也就是现在的Affymetrix公司。公司最初的发展受到美国政府先进技术计划项目的经费支持,而公司也没辜负联邦政府的期望,1994年就开始将GeneChip®专利技术进行商业化运营,并于1996年在纳斯达克上市。Affymetrix以基因芯片为立家之本,陆续收购包括分子生物学试剂USB、免疫学试剂公司eBioscience等多家生物医学公司,形成了环绕基因组学和蛋白组学的庞大产品生态群。
Affymetrix公司致力于研发能够在细胞、蛋白和基因水平对生物系统进行多重和平行分析的技术,促进科研人员研究成果的转化,使科学家和临床医生能够将其研究成果更快地转化为对疾病的治疗技术,并在农业领域促进基因标记辅助育种技术的发展。
Affymetrix公司的客户遍布于生物学科研工作的各个领域,包括生物制药、临床诊断、农业育种、食品安全和消费品行业,同时还包括科研院所、政府实验室和其他非盈利性研究机构等。
Affymetrix公司曾入围全球50个最具创新能力公司和2011年度Frost & Sullivan北美产品领袖奖。公司于1996年在美国纳斯达克(NASDAQ)上市,总市值超过30亿美元,20年来,凭借在美国股票市场上的融资,Affymetrix公司在企业并购的路上一路狂奔。
2000年2月,Affymetrix 收购了DNA芯片仪器公司Genetic MicroSystems;
2000年10月,Affymetrix收购了计算基因组学公司Neomorphic;
2005年,Affymetrix收购了基因研究公司 ParAllele BioScience,随后又收购了分子生物学和生物化学试剂产品公司USB及膜蛋白提取纯化产品公司Anatrace;
2008年,Affymetrix收购了基因标记公司True Materials 和芯片公司Panomics;
2012年,收购了免疫肿瘤研究和诊断公司eBioscience。
然而,Affymetrix公司也逃不过被并购的命运。在2016年1月9日,全球最大的科学仪器生产商赛默飞世尔科技公司表示,同意13亿美元现金收购美国芯片制造商Affymetrix,以加强其基因分析产品相关业务。
关于agilent芯片
Agilent的生物芯片(系统)和别的公司的生物芯片(系统)一样,同样由:扫描仪、生物芯片、分析软件,三部分组成。Agilent的芯片扫描仪,叫SureScan DX,SureScan DX已经取得了欧洲的CE认证和中国的CFDA认证,可以应用于临床。
Agilent的CGH生物芯片,在细胞遗传学中有着很广泛的接受度,并可以临床应用。 Agilent的表达谱芯片,是用荧光素直接标记的,检测灵敏度高、检测速度快、检测的线性范围大,很受欢迎。另外比较受欢迎的就是Agilent的miRNA相关芯片了。