最近一直在这里细胞通讯分析相关软件工具及原理,看到不同细胞亚群的网络图,就以为是细胞通讯分析。
细胞通讯分析在肿瘤领域的单细胞研究数据处理很常见,因为恶性的肿瘤细胞并不是孤立存在的,它会跟其周围的肿瘤微环境(免疫细胞以及基质细胞)有着各种相互作用,影响着肿瘤的发生发展,转移复发耐药等等。如果是发育领域,就是拟时序分析/轨迹分析出镜率更高了。
细胞通讯分析相关软件工具也不少了,但是缺乏一个综述文章,或者说一个benchmark文章,对这些工具进行测评。我们就挑选出镜率比较高的几款软件进行介绍吧,主要是有CellPhoneDB,SingleCellSignalR,celltalker和iTALK以及cellchat。
但是回顾到一篇于2019年5月发表在cell reports杂志的文章:《Dissecting the Single-Cell Transcriptome Network Underlying Gastric Premalignant Lesions and Early Gastric Cancer》,链接是:https://www.sciencedirect.com/science/article/pii/S221112471930525X 它里面的细胞亚群的网络图其实并没有涉及到细胞通讯分析,我看完了全文都没有找到软件工具。
如下所示:
图例是:(D) The similarity network among diverse epithelial cell types in our dataset. The thickness of edges in the network was denoted as the Pearson correlation coefficient between the centroids of any pair of cell types. See also Figures S15C and S15D.
然后我就看了看 Figures S15C and S15D.如下所示:
图例是:Related to Figure 6. The similarities between these cell populations were showed in the form of network (c) and correlation matrix (d). The thickness of the edges in the network was denoted as the Pearson correlation coefficient between the centroids of any pair of cell types.
所以它其实就是不同细胞亚群的简单的相关性矩阵的网络展现形式可以,挑选一个阈值,低于阈值的相关性就直接删除,高于阈值的相关性就以线条的粗细展现即可。
两个细胞亚群的相关性计算方式如下:
(E) The correlations between the centroids of cancer cells and metaplastic stem-like cells (left) and enterocytes (right).
细胞亚群的相关性计算3个步骤:
- First, we assessed the association of each cell type pair by Pearson correlation coefficient between the centroids of them as the thickness of cell type-cell type network.
- Then, we derived the marker genes for representative cell types in each lesion by performing differential expression analysis with the threshold as fold change > 1.5 and FDR < 0.01.
- Finally, we connected marker genes for with known protein-protein interactions (PPIs) documented in STRING database for each lesion.
实际上它也是另外一种细胞通讯的计算方式了!
代码在:http://bioinfo.au.tsinghua.edu.cn/member/pzhang/scstomach.r细胞通讯分析的背景知识
一般来说,建议大家直接读原汁原味的综述,比如2020年11月9日,Erick Armingol等在 Nature Reviews Genetics上发表了一篇综述《Deciphering cell–cell interactions and communication from gene expression》,我看到了解读:从基因表达解读细胞之间的相互作用和交流,读了一下发现确实超级适合作为细胞通讯分析的背景知识学习材料。
不同细胞类型和组织中的细胞之间相互作用(CCI),主要是通过各种分子包括离子、代谢物、整联蛋白、受体、连接蛋白、结构蛋白、配体和细胞外基质的分泌蛋白来实现的。一些分子如激素、生长因子、趋化因子、细胞因子和神经递质等配体介导细胞之间的信息交流(CCC). 人们可以从基因表达中推断出CCI和CCC,尤其是在单细胞转录组测序之后,以RNA为代表的细胞信息之间的相互作用更能够对其进行解析。
主要是流程就是根据数据库记录的参与细胞间通讯的相互作用蛋白列表,筛选表达矩阵后,看配体和受体表达量根据某个评分函数的交流得分,多个配体和受体聚合成为细胞与细胞之间的总体交互状态,最后通过网络可视化展现出来。自分泌,旁分泌,近分泌和内分泌
- 自分泌信号转导是指细胞内通讯,细胞分泌配体,这些配体用于通过同源受体诱导同一细胞上表达的那些分子的细胞应答。
- 旁分泌细胞间的通讯不需要细胞间的接触,而是取决于信号分子在分泌后从一个细胞扩散到另一个细胞。
- 近分泌,即依赖于接触的细胞间通讯依赖于间隙连接或膜纳米管等其他结构,使信号分子直接在细胞之间传递,而不会分泌到细胞外。
- 内分泌细胞间的通讯代表细胞间的通讯,信号分子被分泌并通过诸如血浆的细胞外液传播很长一段距离。
数据库大全
数据库记录着参与细胞间通讯的相互作用蛋白列表,最常用的蛋白-蛋白的相互作用(PPI)是string数据库,但是
软件工具算法大全
主要是分成4种
- 基于差异分析
- 基于网络连通
- 基于表达量排序
- 基于张量等复杂的数学运算
实验验证
很少会做到这一步,毕竟绝大部分的数据分析仅仅是为了出一个好看的图表,一个加分项。但如果不同细胞亚群的独特的作用关系确实有比较好的临床意义,是自己生物学故事的中心点。就有必要进行一定程度的验证了,主要是下面的3种:
- 通过蛋白质组学,酶联免疫吸附测定,蛋白质印迹或免疫组化可以看蛋白质表达情况
- 通过显微镜结合免疫染色,单分子荧光原位杂交或通过流式细胞术测量共存看相邻细胞的作用关系
- 甚至激活剂或抑制剂或细胞的遗传操作进行体内或体外实验
展望
主要的难点在于多组学整合,以及时空维度的结合,跨物质的交流或者对比,以及临床转化。