通过4个步骤，入门生物信息学分析

2024-07-19 1231阅读

二十一世纪是生物的世纪，该观点已提出多年。

甚至有人提出，这句话的真正含义应该是“二十一世纪在各行各业都能找到曾经学生物的人”。

对此，我们不再做进一步推敲。

但可以看出的是，越来越多人已经投身于生物相关研究了。

还不问问自己，是不是快成了那个掉队宝宝啦？

▽ 生物信息学分析入门

生物信息学（Bioinformatics）是研究生物信息的采集、处理、存储、传播，分析和解释等各方面的学科，以信息技术及其相关的手段对生物问题进行探索研究。

生物信息学，信息是手段，生物是核心。

生物信息学分析，目前主要用于肿瘤类疾病的研究。

想尽快领悟生信分析领域，需要从2方面着手准备：文章套路、数据复现。

所谓文章套路，即解读文章时应从宏观思维出发，能理解文章的逻辑思维。

而数据复现，则是对文章结构有所了解后，能进行模块化拆解还原，即可以复现出所有模块的数据。

理解了文章套路，复现出文章数据，才在一定程度上掌握了文章的技能。

▽ 生信研究四大模块

生信分析研究最主要的思想可概括为：挑、圈、联、靠。

挑（分子）：筛选出和疾病相关的差异表达分子。

圈（功能）：对筛出的差异表达分子进行标签化、归纳和分类，如GO及KEGG分析。

联（关系）：进行分子与分子间、或信号通路和信号通路之间的连接，如PPI分析。

靠（临床）：是否与临床表征有明确的关联，如PFS、OS等。

生信分析主要模块内容及相关分析工具如下所示。

以上只是给出了生信分析的主要关键点，并非一成不变。

在具体的生信分析中，需要根据实际情况做相关的逻辑组织哦。

▽ 生信分析实例

看到这儿，大家肯定还是有点迷茫。

接下来，SAM给出一个生信分析的具体实例，看完大致就可知道生信分析在做什么啦。

1.挑分子

上图是国内学者2021年发表于期刊OncoTargets and Therapy的生信相关文献。

题名：Identification of HOXD10 as a Marker of Poor Prognosis in Glioblastoma Multiforme （HOXD10为多形性胶质母细胞瘤预后不良的标志物）

需要注意的是，在开始具体分析之前，此论文作者已通过前期筛选，得到了一个与母细胞瘤疾病发展相关的关键分子（HOXD10），即已完成了生信分析的第一步：挑分子。

2.靠临床

针对该研究，作者首先证明，HOXD10在肿瘤组织中的表达高于正常组织（A）。

▽

△

随后作者利用不同来源（TCGA、CGGA、GEO）的数据，通过生存分析证明了HOXD10表达水平影响患者的生存时间。

该部分通过表达分析和预后分析，阐明了HOXD10与肿瘤的发生发展相关。

作者首先证明，研究的分子具有临床意义，是具有解决临床问题的潜在价值的，值得后续做更深层次的研究。

这部分，实现了“靠临床”。

△

随后作者又通过单因素COX回归分析，探索了不同临床特征下（是否全切除、是否TMZ治疗、是否放疗、IDH1状态、HOXD10状态），HOXD10对预后的影响（A-E）。

又通过多因素COX回归分析，探索了影响患者生存的独立预后因子（表2）。

此部分，作者仍然是做“靠临床”的分析。

3.圈功能

前面通过各种分析论证了HOXD10影响疾病发展，接下来作者探讨了HOXD10参与肿瘤发生发展可能的作用机制。

△

作者先筛选出母细胞瘤中与HOXD10表达模式相似的一群差异基因（A）。

随后通过富集分析探索了这群基因可能参与的生物学过程、发挥的分子功能（B），及其涉及的信号通路（C）。

可以看到，这群基因主要与细胞因子-细胞因子受体相互作用通路相关。

该部分，作者进行了“圈功能”的分析。

4.联关系

△

最后，作者通过蛋白-蛋白互作（PPI）网络，呈现了这群分子之间的相互作用形式。

该部分，作者进行了“联关系”的分析。

作者虽然不是完全按照“挑、圈、联、靠”的过程进行内容整合，但生信分析的精髓可是面面俱到啊。

这也充分说明了生信分析的灵活性，给足了我们自由发挥的空间，说“一千个人一千个哈姆雷特”也不为过。

在这里只呈现了部分简单结果，主要展示了生信分析的4大节点。

该研究还有很多其他精彩的部分在此不再做过多分析，感兴趣的小伙伴可以自行阅读深究哦。

相信现在的你，心里又有一个不解之谜了。那就是：这个分子是怎么找到的？是不是觉得，有了这个分子，世界皆在我脚下！！

这真是应了“万事开头难”，我要是有这个分子，我也会生存分析、COX回归对不对？

可是问题又来啦，即使找到了这个分子，可是要分析，那数据又从何而来呢？

这真是，一波掀起千层浪啊。

既然看明白了文章套路，就需要研究如何找分子、数据从何下载、如何下载、数据如何处理、用什么统计分析方法、如何分析等问题啦，这就进阶到了数据复现。

VPS购买请点击我

免责声明：我们致力于保护作者版权，注重分享，被刊用文章因无法核实真实出处，未能及时与作者取得联系，或有版权异议的，请联系管理员，我们会立即处理! 部分文章是来自自研大数据AI进行生成,内容摘自(百度百科,百度知道,头条百科,中国民法典,刑法,牛津词典,新华词典,汉语词典,国家院校,科普平台)等数据,内容仅供学习参考,不准确地方联系删除处理! 图片声明：本站部分配图来自人工智能系统AI生成,觅知网授权图片,PxHere摄影无版权图库和百度，360，搜狗等多加搜索引擎自动关键词搜索配图，如有侵权的图片，请第一时间联系我们，邮箱：ciyunidc@ciyunshuju.com。本站只作为美观性配图使用,无任何非法侵犯第三方意图,一切解释权归图片著作权方,本站不承担任何责任。如有恶意碰瓷者,必当奉陪到底严惩不贷!