我在前面的推文合理的提出来了一个讨论:所以GSE号也可以弄错吗,很多被该公司坑害过的科研伙伴们留言让我们去Google关键词”KangChen Biotech Retraction”, 就明白该公司的劣迹斑斑了。但是居然有人留言恐吓我:
有意思哦,懒得费口水,直接把这个东西拉黑了,耳根清净。咱清清白白写教程,分享笔记,不怕这些牛鬼蛇神!
说一下背后的故事
我为什么会留言到这个文章呢,比较它们这些”KangChen Biotech Retraction”, 都是科研害虫,都是被钉在历史的耻辱柱上面的,不值得学习,我也不是刻意拿它们出来游街示众。
完全是一个意外啊,是一个粉丝问我ceRNA调控的问题,文章标题是:《Comprehensive circular RNA profiling reveals the regulatory role of the circRNA-000911/miR-449a pathway in breast carcinogenesis》,发表于February 5, 2018 https://doi.org/10.3892/ijo.2018.4265,该研究者首先在真实的病人队列做了5 tissues samples and control non-tumor tissue,差异分析结果是:A total of 716 circRNAs that were differently expressed by >1.5-fold between the breast cancer tissues and the normal tissues were identified.
然后从 Chinese Academy of Sciences (Shanghai, China).获得了 这些细胞系:MCF-7, MDA-MB-231, MDA-MB-468, MDA-MB-453, SKBR-3 and T47D, and one normal breast epithelial cell line (MCF-10A) .而这些表达量研究,就是使用了基因芯片,是: The circRNAs chip (ArrayStar Human circRNAs chip; ArrayStar, Rockville, MD, USA) containing 5,639 probes specific for human circular RNAs splicing sites was used. The circRNA microarray process was performed by KangChen Biotech, Inc. (Shanghai, China).
我看到了文章里面数据有GSE编号,所以认为是可以下载哦, https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE97332 准备处理后写教程给粉丝啊!
但是呢,谁知道居然完全是南辕北辙的数据啊,说好的乳腺癌,结果是肝癌,我也一脸懵逼呢。
不过,回过头来想了想,其实无所谓啊,我就是写教程,做一个差异分析啥的,我并不关心它这个数据集来源于什么癌症。前面我们在生信技能树已经系统性的总结了circRNA的相关背景知识:
- 首先了解一下circRNA背景知识
- circRNA芯片分析的一般流程
- circRNA-seq分析的一般流程
- ceRNA-芯片分析的一般流程
- circRNA_ID转化
而且差异分析呢,可以看到我五年前的教程,推文在: - 解读GEO数据存放规律及下载,一文就够
- 解读SRA数据库规律一文就够
- 从GEO数据库下载得到表达矩阵 一文就够
- GSEA分析一文就够(单机版+R语言版)
- 根据分组信息做差异分析- 这个一文不够的
- 差异分析得到的结果注释一文就够
反正这些芯片技术都是十几年前的了,大家不要觉得我五年前的教程有什么过时的地方哈。学徒作业
完成这个数据集, https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE97332 ,的差异分析,跳转的文献是:Circular RNA circMTO1 acts as the sponge of microRNA-9 to suppress hepatocellular carcinoma progression. Hepatology 2017 Oct;66(4):1151-1164. PMID: 28520103
做出一个热图即可,详见:所以GSE号也可以弄错吗。
(A) The heat map showed the top 10 most increased and decreased circRNAs in HCC tissues as compared to that in the matched nontumor tissues analyzed by circRNAs Arraystar Chip.
帮我验证一下,top10的上下调circRNAs 是不是一样的!