25

并不是只有发SCI才能致谢我们生信技能树

早些年,我们在你都不感谢我凭什么要求我帮你宣传:有奖征集了发文章的规范化致谢格式!
格式超级简单:We thank Dr.Jianming Zeng(University of Macau), and all the members of his bioinformatics team, biotrainee, for generously sharing their experience and codes.
不过,很少宣传,所以看到了这个规范化致谢格式的并不多,偶尔就会有人在我们《生信技能树》公众号后台提问这件事。但是我们看后台的频率并不高,所以还是专门的再宣传一下吧,而且并不是只有你发表了SCI才能致谢我们生信技能树,绝大部分朋友不一定会去搞科研,发文章本来就没意义对大部分人来说。
如果我们这七年在《生信技能树》,《生信菜鸟团》,《单细胞天地》的系列教程确实对你有帮助,你的本硕博毕业论文,也可以加上啊,毕竟每个人都会毕业哦!
9991617619101_.pic_hd

那么问题来了,致谢有什么好处呢?

其实真没有,毕竟我们这七年在《生信技能树》,《生信菜鸟团》,《单细胞天地》的系列教程都是免费给大家的,你都不付费,再要求好处就有点过分了!
而且呢,如果使用好处来诱惑你去致谢我,这个就显得不伦不类了,而且很可能是学术不端了。
但是呢,赠人玫瑰,手有余香,我们写这个推文,只是提醒那些真心觉得我们的付出对大家的学术科研工作确实是有帮助但是不记得可以致谢的小伙伴!如果你致谢了,我会很开心,咱们会混个脸熟,至少某一天你需要我的帮助了,我会优先回答你的问题!

25

单细胞级别的ChIP-seq和传统bulk数据分析流程差异大吗

很早以前我就在《生信技能树》的推文:新的ngs流程该如何学习(以CUT&Tag 数据处理为例子),提到了我自己是不太可能去把所有的ngs流程全部录制视频的,只能说是更好的传达学习方法给到大家。

其实如果你看过我表观组学系列,比如《ChIP-seq数据分析》《ATAC-seq数据分析》 就会知道这些技术都可以被单细胞化, 如果你具备比较好的背景知识,理论上是可以自己根据文档把它们对应的单细胞水平的数据分析摸索成功。那就作为学徒作业吧,摸索scChIPseq流程!

文章是:High-throughput single-cell ChIP-seq identifies heterogeneity of chromatin states in breast cancer. Nat Genet 2019 Jun;51(6):1060-1066. PMID: 31152164

数据在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE117309

GSM3290887 H3K4me3_scChIPseq_Jurkat-Ramos
GSM3290888 H3K27me3_scChIPseq_Jurkat-Ramos

GSM3290889 H3K27me3_scChIPseq_HBCx-95
GSM3290890 H3K27me3_scChIPseq_HBCx-95-CapaR
GSM3290891 H3K27me3_scChIPseq_HBCx-22
GSM3290892 H3K27me3_scChIPseq_HBCx-22-TamR

# 下面的4个单细胞都是10x技术的 
GSM3290893 H3K27me3_scRNAseq_HBCx-95
GSM3290894 H3K27me3_scRNAseq_HBCx-95-CapaR
GSM3290895 H3K27me3_scRNAseq_HBCx-22
GSM3290896 H3K27me3_scRNAseq_HBCx-22-TamR

可以看到,区分T和B细胞亚群的效果非常好!

image-20210414185154532

两种组蛋白修饰情况:

  • H3K4me3: n = 1,736 T cells and 839 B cells;
  • H3K27me3: n = 1,481 T cells and 1,643 B cells

这两个两种组蛋白修饰的生物学意义完全不一样哦:

image-20210414193246028

数据分析方面也是拿到矩阵,主要是Bowtie v.1.2.2比对到mm10和 hg38两个 参考基因组,去除PCR重复,:

  • We generated a coverage matrix and metrics from these de-duplicated reads, referred to as ‘unique reads’ in the text.
  • For each cell, reads were binned in non-overlapping 50 kb bins for H3K27me3, known to accumulate over broad genomic regions, and 5 kb genomic bins for H3K4me3,
  • known to accumulate in narrow peaks around TSSs, spanning the genome, to generate an n X m coverage matrix with n barcodes and m genomic bins.

如果你没有单细胞转录组认知,需要先看看基础10讲:

最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释

25

2020也不差-单细胞天地编辑团队全体成员有话说

在周运来的提议下,我们开启了一个颇有仪式感的元旦寄语活动,所以大家在2021年的1月1号的0点看到了这封由单细胞天地编辑团队全体成员“拼凑”出来的信,蓦然回首,发现在这个已经是去了的几乎每天都是在“见证历史”的2020,咱们其实也不差,该发文章的发文 Continue reading

25

带着文件夹结构的拷贝

最近接了一个单细胞转录组项目,有80个10X样品,每个样品的单细胞测序数据都是100G左右的fq.gz文件,很不容易跑完了全部的cellranger流程,发现了一个很有意思的事情,每个样品的输出文件都很很复杂。这个时候我需要把各自样品的html文件拷贝并且改名后先给客户开卡,如下所示的结构: Continue reading