留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

细胞间通信预测方法研究进展

任丽萍 潘贤润 刘天元 杨煜 宁琳 张杨

任丽萍, 潘贤润, 刘天元, 杨煜, 宁琳, 张杨. 细胞间通信预测方法研究进展[J]. 电子科技大学学报, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
引用本文: 任丽萍, 潘贤润, 刘天元, 杨煜, 宁琳, 张杨. 细胞间通信预测方法研究进展[J]. 电子科技大学学报, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
REN Liping, PAN Xianrun, LIU Tianyuan, YANG Yu, NING Lin, ZHANG Yang. Progress in Study on Intercellular Communication Prediction Methods[J]. Journal of University of Electronic Science and Technology of China, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
Citation: REN Liping, PAN Xianrun, LIU Tianyuan, YANG Yu, NING Lin, ZHANG Yang. Progress in Study on Intercellular Communication Prediction Methods[J]. Journal of University of Electronic Science and Technology of China, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035

细胞间通信预测方法研究进展

doi: 10.12178/1001-0548.2023035
基金项目: 国家自然科学基金(62202069);四川省自然科学基金(2022NSFSC1610, 2023NSFSC0678, 2023NSFSC0569);广东省基础与应用基础研究基金联合基金青年基金(2019A1515110701)
详细信息
    作者简介:

    任丽萍(1985 − ),女,主要从事生物信息学方面的研究

    通讯作者: 张杨,E-mail: yangzhang@cdutcm.edu.cn
  • 中图分类号: TP391; Q811.4

Progress in Study on Intercellular Communication Prediction Methods

  • 摘要: 基于配体−受体(L-R)互作的细胞间通信是细胞相互协同完成复杂生命活动的重要方式。随着单细胞测序技术的快速发展,在单细胞水平上系统地解析细胞间通信网络及功能迅速成为细胞生物学研究的热点。生物信息学家已开发了大量细胞间信号通信预测的方法及平台,为细胞间信号通信研究提供了重要技术支撑。该文简要阐述了细胞间通信的基本生物学过程;并系统比较了目前较具代表性的细胞间通信预测相关数据库、算法以及评测分析研究;最后系统总结了细胞间通信预测方法的发展趋势,并展望了其未来的研究方向。
  • 图  1  细胞间通信的生物学过程示意图

    图  2  细胞间通信的可视化策略

    表  1  部分细胞间通信相关L-R互作数据库与数据集

    L-R互作数据库 人类的L-R互作数据 小鼠的L-R互作数据 数据来源 复合物 分析工具
    Cellinker 3 744 3 331 来源于文献及数据库
    CellphoneDB 1 396 / 来源于文献及数据库
    SingleCellSignalR 3 251 / 来源于文献及数据库
    CellTalkDB 3 398 2 021 来源于文献
    文献[21] 1 894 / 来源于数据库
    connectomeDB2020 2293 人类同源数据 来源于文献及数据库
    iTALK 2 649 / 来源于文献及数据库
    OmniPath 6 561 人类同源数据 来源于文献及数据库
    下载: 导出CSV

    表  2  部分细胞间通信预测算法

    方法 L-R互作数目 基因表达 细胞内信号 统计推断
    CellCall 1 141 L/R/TF 基因调控网络 TF激活
    CellPhoneDB 1 396 L/R / 置换检验
    SingleCellSignalR 3 251 L/R 信号转导网络 /
    CellChat 1 939 L/R / 置换检验
    Nichenet 12 019 L/R/下游基因 PPI /
    NATMI 2 187 L/R / /
    iTALK 2 649 L/R / 差异表达
    SoptSC 13 L/R 信号转导网络 /
    ICELLNET 380 L/R / /
    CytoTalk 1 942 L/R/下游基因 基因共表达网络 置换检验
    scMLnet 2 557 L/R/TF 基因调控网络 /
    下载: 导出CSV

    表  3  部分结合ST数据的细胞间通信预测方法

    算法 是否需要ST数据 融合ST数据策略 细胞间通信预测策略
    Cell2Cell ST数据 Bray-Curtis样评分 高斯混合模型
    SpaOTsc 细胞距离信息或ST数据 最优传输 最优传输结果映射到细胞空间距离
    stLearn ST数据 基于空间信息对基因表达标准化 使用CellphoneDB算法
    SVCA ST数据 融合细胞空间距离 高斯混合模型
    MISTY ST数据 随机森林 配体受体加权表达
    COMMOT ST数据 集体最佳传输方法 结果映射到细胞空间距离
    下载: 导出CSV
  • [1] ELLISON D, MUGLER A, BRENNAN M D, et al. Cell−cell communication enhances the capacity of cell ensembles to sense shallow gradients during morphogenesis[J]. Proceedings of The National Academy of Sciences of The United States of America, 2016, 113(6): 679-688.
    [2] THURLEY K, WU L F, ALTSCHULER S J. Modeling cell-to-cell communication networks using response-time distributions[J]. Cell Systems, 2018, 6(3): 355-367. doi:  10.1016/j.cels.2018.01.016
    [3] REN X W, KANG B X, ZHANG Z M. Understanding tumor ecosystems by single-cell sequencing: Promises and limitations[J]. Genome Biology, 2018, 19(1): 211. doi:  10.1186/s13059-018-1593-z
    [4] 程馨, 燕蕊, 郭帆. 单细胞多组学技术新进展及其在发育生物学研究中的应用[J]. 中国科学: 生命科学, 2021, 51(5): 496-506.

    CHENG X, YAN R, GUO F. Advances in single-cell multi-omics methods and their applications in developmental biology[J]. Scientia Sinica (Vitae), 2021, 51(5): 496-506.
    [5] ZHANG Q M, HE Y, LUO N, et al. Landscape and dynamics of single immune cells in hepatocellular carcinoma[J]. Cell, 2019, 179(4): 829-845. doi:  10.1016/j.cell.2019.10.003
    [6] ARMINGOL E, OFFICER A, HARISMENDY O, et al. Deciphering cell–cell interactions and communication from gene expression[J]. Nature Reviews Genetics, 2021, 22(2): 71-88. doi:  10.1038/s41576-020-00292-x
    [7] SHAO X, LU X Y, LIAO J, et al. New avenues for systematically inferring cell-cell communication: Through single-cell transcriptomics data[J]. Protein Cell, 2020, 11(12): 866-880. doi:  10.1007/s13238-020-00727-5
    [8] 任丽萍, 宁琳, 谢雷, 等. 肿瘤免疫微环境中免疫细胞间通信景观探究[J]. 电子科技大学学报, 2022, 51(2): 177-183. doi:  10.12178/1001-0548.2021372

    REN L P, NING L, XIE L, et al. Deciphering the landscape of intercellular communication among immune cells in tumor immune microenvironment[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(2): 177-183. doi:  10.12178/1001-0548.2021372
    [9] BROWAEYS R, SAELENS W, SAEYS Y. NicheNet: Modeling intercellular communication by linking ligands to target genes[J]. Nature Methods, 2020, 17(2): 159-162. doi:  10.1038/s41592-019-0667-5
    [10] EFREMOVA M, VENTO-TORMO M, TEICHMANN S A, et al. CellPhoneDB: Inferring cell–cell communication from combined expression of multi-subunit ligand−receptor complexes[J]. Nature Protocols, 2020, 15(4): 1484-1506. doi:  10.1038/s41596-020-0292-x
    [11] CABELLO-AGUILAR S, ALAME M, KON-SUN-TACK F, et al. SingleCellSignalR: Inference of intercellular networks from single-cell transcriptomics[J]. Nucleic Acids Research, 2020, 48(10): e55. doi:  10.1093/nar/gkaa183
    [12] ALMET A A, CANG Z, JIN S, et al. The landscape of cell-cell communication through single-cell transcriptomics[J]. Current Opinion in Structural Biology, 2021, 26: 12-23. doi:  10.1016/j.coisb.2021.03.007
    [13] SONG D L, YANG D W, POWELL C A, et al. Cell–cell communication: Old mystery and new opportunity[J]. Cell Biology and Toxicology, 2019, 35(2): 89-93. doi:  10.1007/s10565-019-09470-y
    [14] YANASHIMA R, KITAGAWA N, MATSUBARA Y, et al. Network features and pathway analyses of a signal transduction cascade[J]. Frontiers in Neuroinformatics, 2009, 3: 13.
    [15] THOMAS P J, ECKFORD A W. Capacity of a simple intercellular signal transduction channel[J]. IEEE Transactions on Information Theory, 2016, 62(12): 7358-7382. doi:  10.1109/TIT.2016.2599178
    [16] ASTHAGIRI A R, LAUFFENBURGER D A. Bioengineering models of cell signaling[J]. Annual Review of Biomedical Engineering, 2000, 2(1): 31-53. doi:  10.1146/annurev.bioeng.2.1.31
    [17] GRAEBER T G, EISENBERG D. Bioinformatic identification of potential autocrine signaling loops in cancers from gene expression profiles[J]. Nature Genetics, 2001, 29(3): 295-300. doi:  10.1038/ng755
    [18] ARMSTRONG J F, FACCENDA E, HARDING S D, et al. The IUPHAR/BPS guide to PHARMACOLOGY in 2020: Extending immunopharmacology content and introducing the IUPHAR/MMV guide to MALARIA PHARMACOLOGY[J]. Nucleic Acids Research, 2020, 48(D1): 1006-1021.
    [19] KANEHISA M, FURUMICHI M, SATO Y, et al. KEGG: Integrating viruses and cellular organisms[J]. Nucleic Acids Res, 2021, 49(D1): 545-551. doi:  10.1093/nar/gkaa970
    [20] BEN-SHLOMO I, HSU S Y, RAUCH R, et al. Signaling receptome: A genomic and evolutionary perspective of plasma membrane receptors involved in signal transduction[J]. Science’s STKE: Signal Transduction Knowledge Environment, 2003, 2003(187): Re9.
    [21] RAMILOWSKI J A, GOLDBERG T, HARSHBARGER J, et al. A draft network of ligand–receptor-mediated multicellular signalling in human[J]. Nature Communications, 2015, 6(1): 7866. doi:  10.1038/ncomms8866
    [22] HOU R, DENISENKO E, ONG H T, et al. Predicting cell-to-cell communication networks using NATMI[J]. Nature Communications, 2020, 11(1): 5011. doi:  10.1038/s41467-020-18873-z
    [23] SHAO X, LIAO J, LI C Y, et al. CellTalkDB: A manually curated database of ligand–receptor interactions in humans and mice[J]. Briefings in Bioinformatics, 2020, 22(4): bbaa269.
    [24] SZKLARCZYK D, GABLE A L, LYON D, et al. STRING v11: Protein–Protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets[J]. Nucleic Acids Research, 2018, 47(D1): 607-613.
    [25] TÜREI D, VALDEOLIVAS A, GUL L, et al. Integrated intra- and intercellular signaling knowledge for multicellular omics analysis[J]. Molecular Systems Biology, 2021, 17(3): e9923. doi:  10.15252/msb.20209923
    [26] ZHANG Y, LIU T Y, WANG J, et al. Cellinker: A platform of ligand–receptor interactions for intercellular communication analysis[J]. Bioinformatics, 2021, 37(14): 2025-2032. doi:  10.1093/bioinformatics/btab036
    [27] WANG Y X, WANG R P, ZHANG S J, et al. iTALK: An R package to characterize and illustrate intercellular communication[EB/OL]. [2023-02-09]. https://doi.org/10.1101/507871.
    [28] SHAN N Y, LU Y, GUO H, et al. CITEdb: A manually curated database of cell-cell interactions in human[J]. Bioinformatics, 2022, 38(22): 5144-5148. doi:  10.1093/bioinformatics/btac654
    [29] TYLER S R, ROTTI P G, SUN X, et al. PyMINEr finds gene and autocrine-paracrine networks from human islet scRNA-Seq[J]. Cell Reports, 2019, 26(7): 1951-1964. doi:  10.1016/j.celrep.2019.01.063
    [30] CILLO A R, KÜRTEN C H L, TABIB T, et al. Immune landscape of viral- and carcinogen-driven head and neck cancer[J]. Immunity, 2020, 52(1): 183-199. doi:  10.1016/j.immuni.2019.11.014
    [31] TSUYUZAKI K, ISHII M, NIKAIDO I. Uncovering hypergraphs of cell-cell interaction from single cell RNA-sequencing data[EB/OL]. [2023-02-09]. https://doi.org/10.1101/566182.
    [32] JIN S Q, GUERRERO-JUAREZ C F, ZHANG L H, et al. Inference and analysis of cell-cell communication using CellChat[J]. Nature Communications, 2021, 12(1): 1088. doi:  10.1038/s41467-021-21246-9
    [33] NOËL F, MASSENET-REGAD L, CARMI-LEVY I, et al. Dissection of intercellular communication using the transcriptome-based framework ICELLNET[J]. Nature Communications, 2021, 12(1): 1089. doi:  10.1038/s41467-021-21244-x
    [34] ZHANG Y, LIU T Y, HU X S, et al. CellCall: Integrating paired ligand-receptor and transcription factor activities for cell-cell communication[J]. Nucleic Acids Research, 2021, 49(15): 8520-8534. doi:  10.1093/nar/gkab638
    [35] BACCIN C, AL-SABAH J, VELTEN L, et al. Combined single-cell and spatial transcriptomics reveal the molecular, cellular and spatial bone marrow niche organization[J]. Nature Cell Biology, 2020, 22(1): 38-48. doi:  10.1038/s41556-019-0439-6
    [36] CHOI H, SHENG J T, GAO D C, et al. Transcriptome analysis of individual stromal cell populations identifies stroma-tumor crosstalk in mouse lung cancer model[J]. Cell Report, 2015, 10(7): 1187-1201. doi:  10.1016/j.celrep.2015.01.040
    [37] HU Y X, PENG T, GAO L, et al. CytoTalk: De novo construction of signal transduction networks using single-cell transcriptomic data[J]. Science Advances, 2021, 7(16): eabf1356. doi:  10.1126/sciadv.abf1356
    [38] CHENG J Y, ZHANG J, WU Z D, et al. Inferring microenvironmental regulation of gene expression from single-cell RNA sequencing data using scMLnet with an application to COVID-19[J]. Briefings in Bioinformatics, 2021, 22(2): 988-1005. doi:  10.1093/bib/bbaa327
    [39] ARMINGOL E, GHADDAR A, JOSHI C J, et al. Inferring a spatial code of cell-cell interactions across a whole animal body[J]. Plos Computational Biology, 2022, 18(11): e1010715. doi:  10.1371/journal.pcbi.1010715
    [40] CANG Z X, NIE Q. Inferring spatial and signaling relationships between cells from single cell transcriptomic data[J]. Nature Communications, 2020, 11(1): 2084. doi:  10.1038/s41467-020-15968-5
    [41] PHAM D, TAN X, XU J, et al. stLearn: Integrating spatial location, tissue morphology and gene expression to find cell types, cell-cell interactions and spatial trajectories within undissociated tissues[EB/OL]. [2023-02-09]. https://doi.org/10.1101/2020.05.31.125658.
    [42] ARNOL D, SCHAPIRO D, BODENMILLER B, et al. Modeling cell-cell interactions from spatial molecular data with spatial variance component analysis[J]. Cell Reports, 2019, 29(1): 202-211. doi:  10.1016/j.celrep.2019.08.077
    [43] CANG Z X, ZHAO Y X, ALMET A A, et al. Screening cell-cell communication in spatial transcriptomics via collective optimal transport[J]. Nature Methods, 2023, 20(2): 218-228. doi:  10.1038/s41592-022-01728-4
    [44] SHEIKH B N, BONDAREVA O, GUHATHAKURTA S, et al. Systematic identification of cell-cell communication networks in the developing brain[J]. IScience, 2019, 21: 273-287.
    [45] WANG L, YU P, ZHOU B Y, et al. Single-Cell reconstruction of the adult human heart during heart failure and recovery reveals the cellular landscape underlying cardiac function[J]. Nature Cell Biology, 2020, 22(1): 108-119. doi:  10.1038/s41556-019-0446-7
    [46] HU Y X, PENG T, GAO L, et al. CytoTalk: De novo construction of signal transduction networks using single-cell transcriptomic data[J]. Science Advances, 2021, 7(16): eabf1356.
    [47] DIMITROV D, TÜREI D, GARRIDO-RODRIGUEZ M, et al. Comparison of methods and resources for cell-cell communication inference from single-cell RNA-Seq data[J]. Nature Communications, 2022, 13(1): 3224. doi:  10.1038/s41467-022-30755-0
    [48] JASSAL B, MATTHEWS L, VITERI G, et al. The reactome pathway knowledgebase[J]. Nucleic Acids Res, 2020, 48(D1): 498-503.
    [49] LIU Z Y, SUN D Q, WANG C F. Evaluation of cell-cell interaction methods by integrating single-cell RNA sequencing data with spatial information[J]. Genome Biology, 2022, 23(1): 218. doi:  10.1186/s13059-022-02783-y
  • [1] 曹慧, 刘馨莲, 张录顺.  生物信息数据库分析 INHBA在结直肠癌中的表达及临床意义 . 电子科技大学学报, 2022, 51(2): 295-304. doi: 10.12178/1001-0548.2021348
    [2] 叶远浓, 梁定发, 曾柱.  DBEncRNA:细菌必需非编码RNA数据库 . 电子科技大学学报, 2022, 51(3): 348-352. doi: 10.12178/1001-0548.2021389
    [3] 任丽萍, 宁琳, 谢雷, 张杨.  肿瘤免疫微环境中免疫细胞间通讯景观探究 . 电子科技大学学报, 2022, 51(2): 177-183. doi: 10.12178/1001-0548.2021372
    [4] 施雯靖, 潘贤润, 吕哲宇, 詹超英, 沈百荣.  口腔鳞状细胞癌遗传变异数据库 . 电子科技大学学报, 2022, 51(5): 661-667. doi: 10.12178/1001-0548.2022044
    [5] 陈旦, 杨非, 叶晓俊.  多角度数据库活动监控技术研究 . 电子科技大学学报, 2015, 44(2): 266-271. doi: 10.3969/j.issn.1001-0548.2015.02.018
    [6] 王缓缓, 胡爱娜.  RSSI和距离区间映射的测距方法 . 电子科技大学学报, 2012, 41(4): 522-526. doi: 10.3969/j.issn.1001-0548.2012.04.008
    [7] 张增军, 李向阳, 肖军模.  基于粗糙集理论的数据库推理控制 . 电子科技大学学报, 2007, 36(3): 528-530,537.
    [8] 冯朝胜, 秦志光, 袁丁.  数据库加密系统密钥管理模块的设计 . 电子科技大学学报, 2007, 36(5): 830-833.
    [9] 周雪莲, 罗代升, 张朋, 张天宇, 王博.  自动生成特定伪码的设计与实现 . 电子科技大学学报, 2007, 36(2): 260-262,324.
    [10] 左朝树, 刘心松, 邱元杰, 刘克剑, 杨峰.  用于分布式并行数据库系统的重定向算法 . 电子科技大学学报, 2005, 34(5): 646-649.
    [11] 王爱军.  基于数据库查询过程优化设计 . 电子科技大学学报, 2003, 32(2): 192-194.
    [12] 方英武, 张广鹏, 吴德伟, 黄玉美, 赵修斌, 王轶.  分布式数据挖掘计算过程——DDCP算法研究 . 电子科技大学学报, 2003, 32(1): 80-84.
    [13] 陈文宇.  面向对象的关系数据库设计 . 电子科技大学学报, 2002, 31(1): 53-56,75.
    [14] 吴跃, 邱会中, 余水, 余元辉.  Web数据库性能调优 . 电子科技大学学报, 2002, 31(3): 255-261.
    [15] 陈文宇, 许鸿川.  利用数据库处理多个对象间的关系 . 电子科技大学学报, 2002, 31(3): 270-274.
    [16] 赵玲.  合金平衡相图的数字化处理 . 电子科技大学学报, 2002, 31(4): 366-368.
    [17] 王有德, 孙世新.  数据库应用程序中数据完整性的分层实现 . 电子科技大学学报, 2001, 30(4): 414-418.
    [18] 吴跃, 余水, 傅彦, 邱会中.  Internet数据库访问技术 . 电子科技大学学报, 2001, 30(1): 58-61.
    [19] 陆鑫.  利用ASP技术实现WEB数据库的访问 . 电子科技大学学报, 2000, 29(1): 87-90.
    [20] 周西京.  基于Java的Internet上数据库存取及实现 . 电子科技大学学报, 1999, 28(2): 202-206.
  • 加载中
图(2) / 表(3)
计量
  • 文章访问数:  9133
  • HTML全文浏览量:  2189
  • PDF下载量:  64
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-02-19
  • 修回日期:  2023-04-16
  • 网络出版日期:  2023-10-08
  • 刊出日期:  2023-09-30

细胞间通信预测方法研究进展

doi: 10.12178/1001-0548.2023035
    基金项目:  国家自然科学基金(62202069);四川省自然科学基金(2022NSFSC1610, 2023NSFSC0678, 2023NSFSC0569);广东省基础与应用基础研究基金联合基金青年基金(2019A1515110701)
    作者简介:

    任丽萍(1985 − ),女,主要从事生物信息学方面的研究

    通讯作者: 张杨,E-mail: yangzhang@cdutcm.edu.cn
  • 中图分类号: TP391; Q811.4

摘要: 基于配体−受体(L-R)互作的细胞间通信是细胞相互协同完成复杂生命活动的重要方式。随着单细胞测序技术的快速发展,在单细胞水平上系统地解析细胞间通信网络及功能迅速成为细胞生物学研究的热点。生物信息学家已开发了大量细胞间信号通信预测的方法及平台,为细胞间信号通信研究提供了重要技术支撑。该文简要阐述了细胞间通信的基本生物学过程;并系统比较了目前较具代表性的细胞间通信预测相关数据库、算法以及评测分析研究;最后系统总结了细胞间通信预测方法的发展趋势,并展望了其未来的研究方向。

English Abstract

任丽萍, 潘贤润, 刘天元, 杨煜, 宁琳, 张杨. 细胞间通信预测方法研究进展[J]. 电子科技大学学报, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
引用本文: 任丽萍, 潘贤润, 刘天元, 杨煜, 宁琳, 张杨. 细胞间通信预测方法研究进展[J]. 电子科技大学学报, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
REN Liping, PAN Xianrun, LIU Tianyuan, YANG Yu, NING Lin, ZHANG Yang. Progress in Study on Intercellular Communication Prediction Methods[J]. Journal of University of Electronic Science and Technology of China, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
Citation: REN Liping, PAN Xianrun, LIU Tianyuan, YANG Yu, NING Lin, ZHANG Yang. Progress in Study on Intercellular Communication Prediction Methods[J]. Journal of University of Electronic Science and Technology of China, 2023, 52(5): 667-674. doi: 10.12178/1001-0548.2023035
  • 细胞可通过各种化学或物理信号相互交流、应答及协作[1]。在单细胞生物中,细胞间的信号可使不同细胞相互协调,分工合作,继而完成单个细胞无法单独完成的任务。在多细胞生物中,细胞间信号可以使得细胞向不同方向特化形成不同的细胞类型,而不同种类的细胞之间又可以通过胞间信号传递与交流,有序组合形成肌肉、血液及神经系统等组织和系统,最终行使特定的生物学任务[2]。细胞这种从其他细胞或环境接收和处理各种信息,同时又通过信息的内部运作对其他细胞与外环境做出响应的过程被称为细胞间通信。

    单细胞测序技术的快速发展为细胞生物学提供了新的研究范式[3]。尤其是单细胞RNA测序(single cell RNA sequencing, scRNA-seq)技术,可在单细胞水平上精确表征组织及微环境中的细胞组成,提供对组织或微环境细胞异质性和单细胞基因表达的高分辨率景观,是剖析组织及微环境稳态及动态过程的有力工具[4]。目前已有诸多研究利用scRNA-seq技术来绘制生理及病理情况下的组织及微环境的细胞图谱,为解析组织与微环境中细胞间信号传递及调控机制提供了重要的技术支撑与数据基础[4-5]。在单细胞水平上利用生物信息学方法,系统地解析组织及微环境中细胞间通信网络及信息交流机制迅速成为细胞生物学研究的热点[6-8]。近三年有诸多研究开发了基于单细胞测序数据的细胞间通信预测方法,极大地促进了单细胞层面细胞间信号转导及机制研究[9-11]。同时,作为scRNA-seq的补充,空间转录组学(spatial transcriptomics, ST)技术可绘制细胞单“点”或亚细胞分辨率下的基因表达。有研究提出将ST数据与单细胞测序的数据结合来推断细胞间通信以提高预测的准确性及合理性[12]。本文首先简要回顾了细胞间通信的基础生物学过程,继而结合国内外基于单细胞测序的细胞间通信预测研究现状,对目前细胞间通信相关蛋白质配体-受体(ligand-receptor, L-R)互作数据库、预测算法以及基准评测研究进行综述,总结存在的问题并提出展望。

    • 细胞已经进化出多种信号转导机制来完成生物信息传递,如图1a所示[2]。在多细胞生物中,各种代谢物、生长因子、激素、神经递质和细胞外基质是细胞传递信号的关键分子,被称为配体。而配体又可通过与细胞表面的受体特异性结合,将信号传递到受体细胞内部。根据化学信号的形式,细胞间信号传递可主要分为自分泌、旁分泌、细胞黏附以及内分泌4种方式,如图1b所示。如血液中的代谢物可以触发腺体细胞表面受体,导致细胞释放葡萄糖调节所需的激素。神经递质作为一类短程信号分子,可穿过相邻神经元之间或神经元与肌肉细胞之间的微小空间,与其特异性受体结合传递神经信号。某些细胞表面配体及受体还具有黏附能力,其不仅可在细胞之间传递信息,而且还能在物理上将这些细胞彼此连接。此外,某些配体不仅能在局部微环境中发挥作用,也可以通过内分泌的方式,利用体液进行长距离传播发挥信号传递作用[13],如促卵泡激素,其从哺乳动物的大脑通过血液传播到卵巢触发卵子释放,这种通过体液的远距离传播信息的方式,在跨器官通信中起关键作用。

      图  1  细胞间通信的生物学过程示意图

      此外,在靶细胞上的受体蛋白接收到配体传递的信号后会发生构象变化,进而在细胞内启动一系列生化反应。形成细胞内信号通路,也称为信号转导级联[14]。实际上,一个活跃的细胞无时无刻不在接收和响应大量信号,且多个信号转导通路同时在细胞质中并行,这些通路之间又存在许多交叉点,构成复杂的级联串扰网络(crosstalk)。最终,细胞通过这种高度复杂而精密的信号通路网络,不断整合从外部环境接收到的所有信息,完成各种复杂的生物学任务[15]

      综上所述,细胞间的通信过程可简述为:细胞生产各种信号分子作为配体,当其与自身或其他细胞的特异性受体结合时,会在该细胞内进一步触发一系列信号级联事件,这些事件将配体传递的信号传送到细胞内部,并进一步将其放大,最终使得细胞执行相应的具体功能。而在细胞微环境中,各种信号分子允许微环境内的细胞共享有关内部和外部条件的信息,这些信息有助于细胞自行安排、协调完成各种复杂的生物学功能。但由于目前传统生物实验技术的局限,生物学家对细胞间及细胞内的信号转导过程的层次结构及其高度集成及动态的过程的理解仍不清晰。相信随着学科不断的交叉融合发展,尝试基于生物学实验数据对细胞内外分子信号网络进行数学建模,创建算法用于解析目前条件下无法用实验解析的结果,将是细胞间信号传递研究的新路径[16]

    • 目前,基于单细胞测序的细胞间通信研究的主要原理是通过单细胞测序数据中配体及受体的mRNA表达水平推测不同细胞群落中的细胞间通信关系,该过程主要依赖于蛋白质L-R互作先验知识[6]。除DLRP[17]、IUPHAR/BPS[18]、KEGG[19]及HPMR[20]等单细胞测序时代之前的L-R互作数据库之外,近几年针对单细胞测序细胞间通信研究的L-R互作数据库也陆续上线,如表1所示。其中,2015年文献[21]从已知的L-R数据库如DLRP、IUPHAR/BPS及HPMR等收集并整合得到1 894条L-R互作数据,并构建了144种细胞间的通信网络。同时,该课题组在2020年进一步通过文献挖掘及数据库整合等方式将该数据集更新为2 293条L-R互作数据,并命名为connectomeDB2020数据库[22]。CellPhoneDB数据库[10]通过文本挖掘及其他PPI数据库收集了1 396条L-R互作数据,并开发了一个在线分析平台用于scRNA-seq数据的细胞间通信分析。CellTalkDB数据库[23]通过大规模地收集STRING v11数据库[24]中的L-R互作数据,并通过文献挖掘验证,最终收集了3 398个人类的L-R互作数据、2 021个小鼠的L-R互作数据。OmniPath数据库[25]通过收集数据库来源的配受体数据及PPI数据,整合构建了可用于细胞间通信分析的细胞间及细胞内信号网络数据集。Cellinker数据库[26]通过文本挖掘、数据库整合以及同源分析等方法收集了超过3 700条人类、3 300条小鼠以及16条冠状病毒−人类的高置信的L-R互作数据,Cellinker数据库还收录了超过400条内源性小分子−受体互作数据,为细胞间通信预测研究提供了重要的数据基础。同时,一些细胞间通信算法如SingleCellSignalR[11]及iTALK[27]等同样构建了L-R互作数据集用于推测细胞间通信。上述L-R互作数据资源为细胞间通信研究及细胞微环境信号转导网络研究奠定了重要的数据基础。此外,文献[28]绕过了L-R互作数据,开发了一个收录高质量的人类细胞互作的数据库CITEdb,该数据库通过文献挖掘收集了728条人类细胞互作数据,为细胞间通信研究提供了重要的基准数据集。

      表 1  部分细胞间通信相关L-R互作数据库与数据集

      L-R互作数据库 人类的L-R互作数据 小鼠的L-R互作数据 数据来源 复合物 分析工具
      Cellinker 3 744 3 331 来源于文献及数据库
      CellphoneDB 1 396 / 来源于文献及数据库
      SingleCellSignalR 3 251 / 来源于文献及数据库
      CellTalkDB 3 398 2 021 来源于文献
      文献[21] 1 894 / 来源于数据库
      connectomeDB2020 2293 人类同源数据 来源于文献及数据库
      iTALK 2 649 / 来源于文献及数据库
      OmniPath 6 561 人类同源数据 来源于文献及数据库
    • 为帮助推测细胞间通信,近三年已开发了大量基于单细胞测序数据的细胞间通信算法和工具,如表2所示。依据所采用的具体模型与策略,现有方法主要可分为4类:1)基于配受体差异表达的方法;2)基于配受体表达结合统计检验的方法;3)基于L-R互作下游细胞内信号网络的方法;4)结合ST数据的方法[6]

      表 2  部分细胞间通信预测算法

      方法 L-R互作数目 基因表达 细胞内信号 统计推断
      CellCall 1 141 L/R/TF 基因调控网络 TF激活
      CellPhoneDB 1 396 L/R / 置换检验
      SingleCellSignalR 3 251 L/R 信号转导网络 /
      CellChat 1 939 L/R / 置换检验
      Nichenet 12 019 L/R/下游基因 PPI /
      NATMI 2 187 L/R / /
      iTALK 2 649 L/R / 差异表达
      SoptSC 13 L/R 信号转导网络 /
      ICELLNET 380 L/R / /
      CytoTalk 1 942 L/R/下游基因 基因共表达网络 置换检验
      scMLnet 2 557 L/R/TF 基因调控网络 /
    • 基于L-R互作中配受体差异表达的方法包括iTALK[27]、PyMINer[29]以及CellTalker[30]等,其主要原理是筛选scRNA-seq数据中不同细胞类型之间显著差异表达的基因,并将差异基因列表中存在的L-R互作定义为差异细胞间通信。此类方法对于推测不同细胞类型间特异的细胞间通信比较有效,但该策略忽略了在所有细胞类型之间都普遍且稳定存在的通信关系[6]。此外,还有基于L-R互作配受体表达矩阵分解的方法,代表性工具是scTensor[31],其使用张量模拟L-R互作。从数据中生成了一个等级为3的张量,其中两个维度分别表示单细胞数据中每种细胞类型的配体和受体表达,第3个维度代表所有L-R互作。然后进行非负塔克分解来分解这个张量,产生3个矩阵,其系数代表相互作用的细胞与其各自的配体和受体之间的关系。这种基于张量分解的方法,其隐变量的可解释性依然存在问题[6]

    • 基于L-R互作中配受体表达结合统计检验的方法包括CellPhoneDB[10],CellChat[32],NATMI[22]和ICELLNET[33]等,其方法原理主要是通过置换检验等统计检验方法评估L-R互作中配体与受体表达之积或之和的统计显著性。此类方法策略同样过度依赖于配体受体的表达量高低,而对稳定表达的L-R互作相关细胞间通信缺乏鉴定能力[34]。总体而言,上述基于L-R互作中配受体表达强度或特异性来推断细胞间通信的方法存在明显局限。首先,某些受体蛋白质通常在细胞中表现出稳定的表达水平,其表达量高低与细胞间通信强弱并不完全相关[25];且部分编码细胞表面受体的mRNA通常处于低丰度状态,这可能导致受体的表达无法在单细胞水平被检测到,造成数据删失[6, 35];而上述方法最根本的问题在于其模型未考虑L-R互作下游的细胞内信号转导过程[9]

    • 为解决上述问题,最近已有多种方法开始尝试基于L-R互作下游信号网络的方式将细胞内信号转导过程也纳入细胞间通信分析模型,包括CCCExplorer[36],SoptSC,NicheNet[9],CytoTalk[37],scMLnet[38]以及CellCall[34]等,其算法原理主要通过L-R下游的信号转导网络、基因调控网络或基因共表达网络的拓扑结构与基因表达来推测细胞间通信关系。如NicheNet算法通过PageRank方法计算细胞内部转录因子(transcription factor, TF)调控网络中TF的靶基因与细胞外配体的相关性去推测细胞间通信。CytoTalk算法通过PCSF(prize-collecting Steiner forest)方法筛选与细胞间L-R互作相关的细胞内基因共表达网络,继而重建细胞间信号转导网络。CellCall算法[34]可通过整合L-R互作的表达和L-R互作下游TF的激活程度来推断细胞间通信,其能够同时推断细胞间通信和相应的细胞内部信号。上述方法将细胞外信号与细胞内信号结合,在一定程度上解决了细胞间信号转导推断方法过度依赖于配体与受体表达的问题,生物学模型相对合理,同时此类方法还增加了对细胞内信号转导网络的推测能力。

    • 细胞间通信的本质是细胞膜表面或分泌型配体将生物信号扩散传递到微环境中附近的细胞,因此,配体在有限空间扩散率限制了组织或微环境中可发生通信的细胞数量及范围。因此,有研究提出将空间转录组数据与单细胞测序的数据结合推断细胞间通信以提高预测的准确性及合理性。随着ST技术的不断发展,目前已出现多种基于ST数据的细胞间通信方法,如表3所示。如Cell2Cell通过对大量L-R互作进行Bray-Curtis样评分,然后结合不同细胞之间的距离定义细胞间通信关系[39]。SpaOTsc通过推断配体、受体及细胞内信号通路的推测信号发送细胞及接收细胞的空间分布,并通过空间最小传输距离推测细胞间通信[40]。stLearn算法通过计算不同的空间簇中细胞多样性以及相关L-R互作的共表达分数去推测在空间中细胞间通信信号密集的热点区域[41]。SVCA算法主要使用概率模型来推断细胞特异性基因如何受到邻近细胞和外部环境的影响[42]。COMMOT通过集体最佳传输方法来推断空间转录组学中的通信,提出了一种处理复杂分子相互作用和空间约束的集体最佳传输方法[43]。其可解释不同配体和受体物种间的竞争以及细胞间的空间距离。然而,细胞间通信是一个动态的变化过程,目前还未有方法考虑ST数据中固有的动态时序信息。随着ST技术分辨率的进步,开发基于ST数据时序信息的细胞间通信动态变化过程预测方法必将是下一步探究的方向[12]

      表 3  部分结合ST数据的细胞间通信预测方法

      算法 是否需要ST数据 融合ST数据策略 细胞间通信预测策略
      Cell2Cell ST数据 Bray-Curtis样评分 高斯混合模型
      SpaOTsc 细胞距离信息或ST数据 最优传输 最优传输结果映射到细胞空间距离
      stLearn ST数据 基于空间信息对基因表达标准化 使用CellphoneDB算法
      SVCA ST数据 融合细胞空间距离 高斯混合模型
      MISTY ST数据 随机森林 配体受体加权表达
      COMMOT ST数据 集体最佳传输方法 结果映射到细胞空间距离
    • 除了推测或量化细胞间通信关系外,目前各种方法还提供了丰富的细胞间通信分析结果的可视化策略,包括绘制Circos图、桑基图、热图以及气泡图等。在此,本文以CellCall算法为例,简略介绍几种常见的细胞间通信可视化图,如图2所示。CellCall使用Circos图(图2a)对数据中所有细胞间的通信总体呈现,外圈线段代表不同的细胞,圈内指向曲线代表不同细胞间的总体通信情况(颜色深浅表示通信强弱);CellCall使用热图(图2b)对细胞间L-R互作的分数进行可视化,通常热图的行和列分别为细胞对以及L-R互作对,而热图的颜色深浅则代表某对细胞的某对L-R互作的通信得分;CellCall使用气泡图(图2c)呈现信号通路富集分析结果,其中气泡大小代表P值,颜色深浅代表富集度;此外,CellCall还使用桑基图(图2d)呈现L-R-TF三元关系,使用GSEA富集图(图2e)和山峦图(图2f)呈现了TF激活程度。总之,不同算法集成了不同的可视化策略,如不同于CellCall,一些算法如CellChat等使用Circos图,而CellphoneDB等方法使用气泡图对细胞间L-R互作进行可视化呈现。

      图  2  细胞间通信的可视化策略

    • 建立适当的基准数据是评价和比较已开发的各种细胞间通信预测方法的前提与基础。然而,目前已鉴定的细胞间通信关系在多大程度上代表真实的生物学情况还尚未清楚。当前评价算法的常用手段仍是通过湿实验(如体内成像)和下游功能研究(通过实验干扰某些细胞间通信)来验证具体某一特定细胞间通信是否存在[44-45]。同时,除了用作约束以优化细胞间通信的推断结果之外,ST数据也可以用作评估假阳性率的基准[46]。此外,也有研究通过计算机模拟仿真数据对细胞间通信推断算法进行基准测试[12]。为了比较各细胞间通信数据库数据的重合率及结果的准确性,文献[47]系统比较分析了16个L-R互作数据资源以及7种算法,结果发现大多数数据库中的L-R互作数据主要来源于KEGG[19],Reactome[48]和STRING[24]等数据库,且不同数据资源在通路、功能分类、组织特异性蛋白质等方面存在偏倚,提示各数据资源的选择将会影响细胞间通信的预测。文献[49]将ST数据与scRNA-seq数据相结合用于评价各细胞间通信的数据库及算法的一致性,并将配受体间的互作信息分为基于细胞直接接触的短程互作及基于分泌信号的远程互作,其分析结果提示不同方法预测结果存在显著差异,并建议在未来预测细胞间通信的工作中纳入不同配受体间及细胞内的调控信息,以提高预测的准确性。

    • 探究细胞间通信精细调控过程及全局特征有助于阐明机体的精细调控机制及内环境稳态,也可为进一步探究机体疾病发生发展奠定理论基础。尽管目前已经有大量相关数据库及算法用于研究细胞间通信,且相关算法仍在不断推陈出新,但该领域仍然存在诸多挑战:1)细胞信号传递主要体现在蛋白水平而非基因层面,但基因表达并不一定产生蛋白质表达,而现有预测方法均基于转录组学数据,因此其预测结果不可避免会存在失真;2)同时,目前的方法只能用于预测组织或者微环境内细胞间短程通信,而对内分泌等远程通信的研究还力有未逮;3)细胞间通信的物质基础除蛋白质外,还包括大量其他非肽类的内源性小分子(如小分子、碳水化合物、脂质和核酸配体),但目前的数据库及算法均只收录了蛋白质L-R互作数据,涵盖的范围存在明显局限。

      因此,未来的工作需进一步将细胞外信号与下游转导信号结合以提高对细胞信号传导的细胞类型特异性的理解;同时,还需增加单细胞多组学数据,尤其是蛋白质组以及代谢组学数据进行联合分析,进一步提高预测的准确性及全面性;此外,相关工具还需增加跨器官通信等远程通信的解析能力,扩展预测方法的应用范围,为单细胞测序数据分析以及细胞间信号转导网络分子机制研究提供新的技术手段,为疾病机制、临床诊疗及药物开发研究提供关键的理论依据。

参考文献 (49)

目录

    /

    返回文章
    返回