莱利赛百科

您现在的位置是:首页 > 健康养生 > 正文

健康养生

免疫细胞浸润的生信套路(免疫细胞浸润的生新套路)

max2022-12-20健康养生153

CIBERSORT:反卷积推测bulk中的苹果干细胞美容多少钱细胞类型

五一学了一个新的分析方法- CIBERSORT ,这个包其实很早就想学的,因为现在一般的单细胞文章的套路,很难不用到它,那么它能干什么呢? 它能够推测出bulk RNA每一个样本中各类细胞的比例 。通俗易懂的来讲,就是角膜缘干细胞缺乏症是大多数致盲性角膜病变的主要原因能够 把bulk RNA当作single cell RNA来分析 。

实现把bulk RNA当作single cell RNA来分析主要是有两种算法 反卷积 和 ssgsea ,而CIBERSORT就是基于反卷积算法来做的,所以这篇着重介绍反卷积算法。

要想了解什么是反卷积,我们就要了解什么是卷积,我先show一张图,这张图就展示了卷积的过程

我想用一些比较容易懂的话来讲卷积,所以可能讲述或隐喻的不准确,望谅解!!!

根据这张图我们可以看出 其实bulk RNAseq就像是每一个细胞的RNA-seq卷起来的乘积,所以称为卷积(图:左边(bulk)是右边(cell)的乘积运算的结果,而这个乘积运算需要细胞的表达量和一个系数表),现在我们来解释 反卷积 : 反卷积顾名思义反过来/不卷积,对bulkRNA的反卷积就相当于对bulk RNA进行除法,我们只要给一个系数表,就可以得到细胞的RNA表达量,那么我们就可以知道bulk中有哪一些细胞类型了 。(其实没有那么简单哈,但是大致是这样的,里面涉及到算法啥的我也不知道怎么解释,主要是也不太会哈哈哈哈)

那么根据上面的解释我们可以知道假如进行bulk RNA的反卷积,我们需要什么:

1.系数表

2.bulk RNA的表达矩阵(假如你是一个生信入门的人,你一定要注意这个,表达矩阵,什么样的表达矩阵,首先是芯片还是RNA-seq,再是count?fpkm?rpkm?cpm?CIBERSORT说的很清楚,芯片或者RNA-seq都可以,参数上选择不同而已,RNA-seq数据不建议直接使用Count,应使用FPKM和TPM或DESEq2标准化后的矩阵为宜)

首先LM22-ref.txt文件是什么,这里要从免疫浸润讲起,免疫浸润可以当作肿瘤组织中全部免疫细胞的总和,而LM22就是拿来分析免疫浸润的,所以我们用excel打开来看看这个文件吧,第一列是基因名字,后面每一列是某类细胞和他干细胞实验室平面图们gene symbol的系数,所以这个LM22-ref.txt文件就是我们的 系数表 (关于这个表格怎么来的可以去看其他大神的文章)

这时候我们还缺我们的 bulk RNA的表达矩阵 ,所以我们要拥有一个这样的表格,把它保存为txt文件,命名为 test.txt

然后我们就可以得到这样的result

何为个性化,就是当我们在做单细胞分析的时候,自己定义了一个群或者定义了一些细胞,想看这种细胞类型在bulk中的含量该怎么办呢,我怎么得到每一种细胞类型的系数呢?其实没有那么复杂,细胞类型的系数表其实就是 AverageExpression ,所以我们可以这样来做

后面附上sig.txt用excel打开后的样子,以免大家报错

在这里我需要强调,大家不要小看给出来的txt用excel打开后的格式,因为这是报错的主要原因,一定要跟我的格式一样,为什么呢,可以看CIBERSORT.R这个函数

写在文末,假如大家真的很想了解这个算法,强烈建议去看jimmy老师的教程,我这个只做参考!!!

References:

;mid=2247493507idx=1sn=e8533247aa045ce82e3a6cbb9f3b4281scene=21#wechat_redirect

免疫浸润分析方法

肿瘤不是单纯的恶性细胞群,而是由不同类型细胞组成的复杂生态系统。在这些细胞中,肿瘤浸润免疫细胞在肿瘤控制和治疗反应中起着核心作用。例如,细胞毒性CD8 + T细胞是抗癌免疫的主要效应因子,因为它们可以特异性地识别和杀死携带新抗原的肿瘤细胞。肿瘤特异性抗原主要来源于突变基因的表达。但免疫细胞也可以发挥免疫抑制作用,支持肿瘤发生和免疫逃避,如调节性T细胞。因此,对不同类型的肿瘤浸润免疫细胞进行定量研究,有助于阐明肿瘤免疫应答的机制、评价肿瘤治疗的免疫原性作用,最终指导设计合理治疗方案。 背景介绍 最著名的 标记基因分析方法 是基因集富集分析(GSEA)。基于GSEA的方法计算富集分数(ES),当某一细胞类型的特异性基因在感兴趣的样本中处于高表达的前几位,而在其他情况下则处于低表达的前几位时,该分数较高。

基于GSEA的方法只能计算样本中细胞类型富集的半定量分数,而 反褶积方法 可以定量地估计感兴趣的细胞类型的相对分数。反褶积算法将异种样本的基因表达谱看作是不同细胞的基因表达水平的卷积,并利用描述细胞类型特异性表达谱的特征矩阵来估计未知的细胞组分。

下面是利用标记基因与GSEA或其他评分方法,或利用反褶积算法和免疫细胞表达特征,从 细胞混合物的表达数据量化免疫细胞 的计算方法。

下图是几个 从转录组学数据定量肿瘤浸润免疫细胞 的计算工具:

方法简介****01 基于标记基因的评分方法 (1)MCPcounter

一种基于标记基因定量肿瘤浸润免疫细胞(CD3 + T细胞,CD8 + T细胞,细胞毒性淋巴细胞,NK细胞,B淋巴细胞,单核细胞来源的细胞(单核细胞系),髓样树突状细胞,中性粒细胞)、成纤维细胞和上皮细胞的方法。对于每个细胞类型和样本,丰度得分为细胞类型特异性基因表达值的几何平均值,独立地对每个样本进行计算的。由于分数是用任意单位表示的,它们不能直接解释为细胞分数,也不能在细胞类型之间进行比较。进行定量验证时,估计分数与真实细胞分数之间具有很高的相关性,证明了MCP-counter用于样本间比较的价值。MCP-counter已应用于对32个非血液学肿瘤的19,000多个样本中的免疫细胞和非免疫细胞进行量化。

(2)TIminer

TIminer是一个用户友好的计算框架,用于不同的肿瘤免疫基因组分析,包括(i)来自NGS数据的人白细胞抗原HLAs基因分型;(ii)使用突变数据和HLA类型预测肿瘤新抗原;(iii)来自大量RNA-seq数据来分析定量肿瘤浸润免疫细胞;(iv)通过表达数据量化肿瘤的免疫原性。

(3)xCell

xCell是一种基于ssGSEA的方法,能够计算64种免疫细胞的丰度分数,包括适应性和先天免疫细胞、造血祖细胞、上皮细胞和细胞外基质细胞。基于FANTOM5,ENCODE,Blueprint,Immune Response In Silico (IRIS),Human Primary Cell Atlas (HPCA)和Novershtern等6个研究的489个基因集。对于每种细胞类型,计算xCell丰度分数的主要步骤有四个:(i)利用R包GSVA对489个基因集单独进行ssGSEA;(ii)对属于一种细胞类型的所有基因集的ES进行平均;(iii)平台特异性ES转化为丰度分数;(iv)使用与流式细胞术数据分析类似的spillover方法纠正密切相关的细胞类型之间的关系。

02 使用表达特征对细胞混合物进行反褶积 (1)DeconRNASeq

Gong和Szustakowski将约束回归模型应用于RNA-seq数据分析,并将其实现在R包DeconRNASeq中。混合五种人体组织(大脑、骨骼肌、肺、肝和心脏)的RNA-seq数据,通过合并组织类型特异性基因来估计组织或细胞类型的比例。并利用Illumina’s human Body Map 2.0中RNA-seq数据构建的特征矩阵,对算法进行了仿真验证。虽然还没有开发出新的免疫特征,但该工具原则上可以应用于任何特征矩阵。

(2)CIBERSORT

CIBERSORT算法利用微阵列数据构建特征矩阵,描述22种免疫细胞表型的表达特征,包括不同的细胞类型和功能状态的免疫细胞。CIBERSORT使用ν-SVR评估细胞分数。CIBERSORT分别在9个免疫细胞亚群和3个免疫细胞亚群的同时反褶积方面具有较高的准确性,在4种恶性免疫细胞的模拟混合物上测试,也证明了对不同程度的噪音和未知的肿瘤具有鲁棒性。

(3)TIMER

一个系统评估不同的免疫细胞对不同癌症类型的临床影响的资源。利用一系列免疫特异性标记和免疫细胞表达特征,来估计32种癌症类型中6种免疫细胞类型(B细胞、CD4 T细胞、CD8 T细胞、中性粒细胞、巨噬细胞和树突状细胞)的丰度。从RNA-seq或微阵列数据中提取的癌症表达矩阵与免疫细胞表达矩阵合并,并用Combat进行归一化,以消除批量效应。通过从免疫细胞标记中选择与肿瘤纯度负相关的基因,为每种癌症类型分别识别特征基因。最后,对于每种癌症类型,考虑到所选的免疫细胞标记,从标准化的免疫细胞配置文件构建特征矩阵。TIMER使用线性最小二乘回归方法执行反褶积,并强制所有负估计为零。用越来越小的一组T细胞标记重复估计几次,以减少CD8 +和CD4 + T细胞比例之间的相关性。与CIBERSORT不同的是,最终的估计并没有被规范化,因此不能直接解释为细胞组分,也不能在不同的免疫细胞类型和数据集之间进行比较。

(4)EPIC

Estimate the Proportion of Immune and Cancer cells (EPIC),用来估计免疫细胞和癌细胞比例。EPIC使用约束最小二乘回归明确地将非负性约束引入反褶积问题,并要求每个样本中所有细胞组分的总和不超过一个。EPIC克服了以往从大量肿瘤基因表达数据预测癌症和免疫细胞或其他非恶性细胞类型的方法的几个局限性,考虑了非特征性和可能高度可变的细胞类型,并在算法上得到了发展。能够广泛应用于大多数实体肿瘤,如黑色素瘤和结直肠样本验证的情况,但不适合血液恶性肿瘤,如白血病或淋巴瘤。

(5)quanTIseq

quanTIseq是专门为RNA-seq数据开发的反褶积工具,能够准确定量未知肿瘤的含量,以及量化整体组织的免疫细胞组份。基于约束最小二乘回归和一个新的特征矩阵(来自51个纯化或富集的免疫细胞类型的RNA-seq数据集)。quanTIseq实现了一个完整的反褶积流程来分析RNA-seq数据,能够避免混合物和特征矩阵之间的不一致性。

03 细胞组分和表达谱的同时反褶积 (1)DSA

数字排序算法Digital Sorting Algorithm—DSA是一个完整的反褶积算法,它基于一组从混合组织样本中提取在特定细胞类型中高度表达的标记基因,利用二次规划来推断复杂组织中的细胞组分和表达谱。该算法在三种恶性免疫细胞系混合的微阵列数据上进行了测试,重建了真实的细胞组分和表达谱。该算法是无偏的,不需要细胞类型频率的先验知识。

我总结 今天我们简单介绍了一些关于免疫浸润的方法,之后会有更多详细的压箱底使用方法分享,不要错过呀。REF:Finotello, F., Trajanoski, Z. (2018). Quantifying tumor-infiltrating immune cells from transcriptomics data. Cancer immunology, immunotherapy : CII, 67(7), 1031–1040.

肿瘤干细胞指数的两种生信研究套路

mRNAsi是一种描述肿瘤细胞与干细胞相似程度的指标,可以认为是CSCs的量化。干细胞具有自我更新以及治疗耐药性的特征,在癌症中发挥着重要作用。

目前研究肿瘤干细胞大多通过RNA计算的mRNAsi进行相似程度评估。

我通过对19年和20年的文章进行研究,总体上说一共有两种相关的设计思路。

第一种:mRNAsi评分高低分型

代表文章:胱癌癌症干细胞(CSCs)的文章[Frontiers in Oncology;2019.7]

1. 在BLCA中mRNAsi的分子亚型以及临床特征

2. 筛选差异表达基因

由于正常mRNAsi与肿瘤有显著差异,作者进一步进行了差异表达分析。从分析中筛选出8,510个DEGs,其中5,422个上调,3,088个下调。(图1B)

3. WGCNA: 识别最显著的基因和模块

4. 模块的功能富集分析

5. 关键基因表达的分析与验证

图3

6. 因果关系以及蛋白质相互作用

7. 关键基因和上游基因存在共表达

第二种:mRNAsi相关的基因

代表文章:Prognostic Value of a StemnessIndex-Associated Signature inPrimary Lower-Grade Glioma[Frontiers in genetics;2020.5]

主要通过TCGA中已经公布的mRNAsi相关的基因直接跟差异基因取交集。然后包括差异分析、WGCNA、富集分析、风险模型、免疫评分,外部验证等。

1、整体分析流程图

2、WGCNA分析

3、功能富集分析

4、森林图预后分析

5、KM曲线和模型验证

纯生信分析套路 综述|癌症中m6A与非编码RNA之间相互作用新见解

说起国自然研究新宠儿 “m6A甲基化修饰” ,想必大家都不陌生,m6A甲基化是包括mRNA和ncRNA(即非编码RNA,包括miRNA,rRNA,circRNA和lncRNA等)在内的所有RNA最普遍的表观遗传修饰。越来越多的证据表明,m6A甲基化修饰在各种生理和病理过程中都起着至关重要的作用。今天就向大家分享一篇发表在Molecular Cancer(IF:15.302)杂志上的关于m6A与ncRNA在癌症中相互作用的综述文章。

Part 1.初识m6A甲基化真面目

m6A,又称N6-甲基腺苷,指腺嘌呤的第6位氮原子(N)发生了甲基化修饰,通过甲基化酶复合物对甲基进行“书写”(Writer)、“擦除”(Eraser)或“阅读”(Reader),进而对RNA发挥调控作用。

m6A甲基化的分子组成 —甲基化酶复合物

1)  甲基化转移酶(methyltransferase):被称为“编码器”(Writer),主要包括METTL3、METTL14、WTAP、KIAA1429、METL16、RBM15 / 15B等;

2) 去甲基化酶(demethylase):被称为“消码器”(Eraser),主要包括FTO、ALKBH5等;

3)  m6A识别因子(recognition factors): 被称为“读码器”(Reader),主要包括YTHDC1/2、YTHDF1/2/3、HNRNP、eIF3、IGF2BP1 / 2/3等。

图1.m6A甲基化修饰示意图:m6A甲基化是一个动态可逆的过程,由“Writer”、“Eraser”、“Reader”三者共同完成。

Part 2.m6A甲基化修饰miRNA

miRNA的失调参与多种生物学行为,如小鼠胎儿发育,免疫应答,炎症反应和致癌等,研究表明,m6A甲基化可以修饰参与多种miRNA的成熟,参与该过程的主要是甲基化转移酶METTL3和METTL14等:

① METTL3促进miR-25-3p成熟,miR-25-3p在胰腺导管腺癌(PDAC)中起关键作用;

② METTL3增强pri-miR-221 / 222与DGCR8的结合,而DGCR8参与了膀胱癌的增殖;

③ METTL3促进pri-miR-1246的成熟从而促进结直肠癌(CRC)的转移;

④ METTL3加速miR-143-3p的成熟,导致METTL3 / miR-143-3p / vasohibin-1轴的形成,有利于肺癌的转移;

⑤ METTL3通过修饰多个miRNA(miR-106b,miR-18a / b,miR-3607,miR-423,miR-30a,miR-320b/d /e)影响砷诱导的癌变;

⑥ METTL14促进pri-miR-126的成熟,从而可以抑制肝癌(HCC)的侵袭和转移。

图2. m6A甲基化修饰miRNA:调节胰腺导管腺癌,肺癌,肝癌,膀胱癌和结直肠癌等癌症的发生和转移

Part 3.m6A甲基化修饰lncRNA

lncRNA一般指长度大于 200 个核苷酸的非编码 RNA,可在癌症中被m6A甲基化修饰,参与该过程的主要是甲基化转移酶METTL3、METTL14,去甲基化酶ALKBH5,m6A识别因子YTHDF1、IGF2BP2等:

① MALAT1是首个被发现与肺癌相关的lncRNA,METTL3可以调节MALAT1-miR-1914-3p-YAP轴来诱导非小细胞肺癌的耐药和转移,还可以通过MALAT1/miR-145/FAK途径加重梗阻性肾病的肾纤维化;

② METTL3上调LINC00958,并使miR-3619-5p海绵化而促进HCC细胞的迁移和侵袭;

③ METTL3家族成员FAM225A充当海绵miR-590-3p / miR-1275的ceRNA和上调ITGB3来促进鼻咽癌(NPC)的发生和转移;

④ METTL3/14通过上调DKK1的lncRNA激活调节剂(LNCAROD)来增强头颈部鳞状细胞癌(HNSCC)的迁移;

⑤ METTL3介导lncRNA RP11通过Zeb1的上调增强CRC迁移和侵袭,而

METTL14增加lncRNA XIST的m6A水平,抑制CRC的增殖和转移;

⑥ ALKBH5通过维持FOXM1表达和细胞增殖程序来维持胶质母细胞瘤类干细胞(GSCs)的致瘤性,lncRNA FOXM1-AS可促进ALKBH5与FOXM1之间的相互作用;

⑦ ALKBH5通过减少lncRNA NEAT1的甲基化来促进胃癌(GC)的侵袭和转移。

⑧ YTHDF1与LINC00278相互作用可抑制食管鳞状细胞癌(ESCC)转移,而ALKBH5则促进ESCC转移;

⑨ IGF2BP2作为m6A读取器调节LncRNA DANCR,有利于胰腺癌的致癌性。

图3. m6A甲基化修饰lncRNA:参与多种癌症的肿瘤发生和转移,包括GSC,HNSCC,NPC,ESCC,肺癌,GC,HCC,胰腺癌和CRC

Part 4. m6A甲基化修饰circRNA

circRNA一般指环状RNA。环状RNA(circRNA)是一类特殊的非编码RNA分子(在活体中有时也有表达),也是RNA领域最新的研究热点。

circRNA在蛋白质翻译中起着至关重要的作用: METTL3和YTHDC1与环状RNA锌指蛋白609(circ-ZNF609)的代谢有关,并促进其生成,circ-ZNF609促进蛋白翻译和成肌细胞增殖;核糖体-circRNAs的“迷你基因”可以促进果蝇头部的蛋白翻译;

m6A甲基化会影响cricRNAs的蛋白质翻译: m6A基序在circRNA中富集,单个m6A位点被认为是启动circRNA翻译的触发器。m6A调控因子METTL3/14、FTO、YTHDF3和起始因子eIF4G2参与了m6A驱动的蛋白翻译。哺乳动物细胞可以识别circRNAs上的m6A修饰,通过抑制免疫基因激活和佐剂活性来抑制先天免疫。

circRNA的失调与多种癌症进展相关: circNSUN2的m6A甲基化修饰可促进细胞质输出并稳定HMGA2,从而促进结直肠肝转移;circPVRL3的m6A甲基化修饰可促进胃癌细胞的增殖和迁移。

表1:m6A甲基化修饰癌症中的ncRNA

Part 5. ncRNA调节癌症中的m6A甲基化

非编码RNA(ncRNA)具有影响涉及多个生物学过程m6A水平的能力。

miRNA调节癌症中的m 6 A甲基化:

① miR-33a通过靶向METTL3 mRNA抑制NSCLC细胞的增殖;

② miR-600抑制METTL3的表达并逆转了METTL3对NSCLC进展的积极作用;

③ miRNA let-7g通过靶向3'UTR下调METTL3表达,加速乳腺癌细胞的增殖;

④ miR-1266通过直接靶向FTO促进CRC的发生和发展;

⑤ miR-145通过靶向YTHDF2来抑制HCC的增殖;

⑥ miR-488是一种通过靶向eIF3a发挥作用的抑癌miRNA,还参与NSCLC细胞中eIF3a介导的顺铂耐药性;

⑦ miR-141通过形成miR-141 / IGF2BP2 / P13K / Akt轴来抑制胰腺癌的增殖。

lncRNAs调节癌症中的m 6 A甲基 化 :

① lncRNA LINC00470与METTL3相互作用促进PTEN mRNA降解,从而促进GC进程;

② lncRNA miR503HG通过调节肝细胞癌中的HNRNPA2B1 /NF-κB途径来抑制肿瘤转移;

③ lncRNA LINC01234与HNRNPA2B1相互作用,促进NSCLC中的细胞增殖并抑制细胞凋亡;

④ lncRNA LIN28B-AS1与IGF2BP1相互作用,促进肺腺癌(LUAD)的增殖和转移;

⑤ lncRNA LINRIS可稳定IGF2BP2并促进CRC增殖;

⑥ lncRNA GAS5-AS1与ALKBH5相互作用调节GAS5的表达抑制子宫颈癌(CC)细胞的增殖,迁移和侵袭;

⑦ lncRNA GAS5可以抑制YAP介导的YTHDF3,从而抑制CRC的增殖;

⑧ lncRNA GATA3-AS增强KIAA1429和GATA3 pre-mRNA之间的相互作用,促进肝癌的进展。

表2:ncRNA调节癌症中的m6A甲基化

Part 6. m6A甲基化在癌症中的临床应用

m6A甲基化是癌症诊断和预后的新生物标记

① METTL3,YTHDC2和HNRNPC用于预测HNSCC患者的预后;

② METTL3/FTO上调或YTHDF2和METTL14下调可能预示GC、CRC和HCC的生存率较差;

③ METTL14低表达与肿瘤分化、临床分期、微血管浸润有关;

④ ALKBH5或FTO下调预示肺癌和HCC预后不佳;

⑤ IGF2BP2被认为是胰腺癌,食管胃交界腺癌和CRC的预后标记物。

m6A甲基化参与耐药性和癌症治疗

① METTL3稳定YAP和ARHGAP5,诱导NSCLC和胃癌顺铂耐药;

② HNRNPA2B1在他莫昔芬耐药乳腺癌中过表达,降低他莫昔芬的敏感性;

③ METTL3、METTL14、FTO、YTHDF2在急性髓性白血病(AML)中过表达,FTO抑制剂(FB23)及其衍生物(FB23-2)通过靶向FTO促进AML中的髓样分化和凋亡;

④ m6A甲基化参与胃癌的肿瘤微环境和TME浸润特征评估;

⑤ YTHDF2与炎症浸润,血管重建和远处转移相关,并预示肝癌的不良预后。

生信人往期也有很多有关m6A的好文章可学习:

m6A+免疫浸润

m6A+突变思路

m6A调节因子泛癌分析

结语

越来越多的研究关注于m6A甲基化如何改变ncRNA的稳定性、剪接和翻译,或ncRNA如何在癌症中调控m6A。m6A甲基化与ncRNA的相互作用可影响肿瘤细胞增殖、侵袭和转移等不同的生命活动。就m6A甲基化的临床应用而言,可作为癌症诊断、预后和治疗的潜在靶点。然而,m6A甲基化与ncRNA之间的特异性结合位点还需要进一步研究。

无论是对于正在为写标书申基金发愁的老师们,还是正在为毕业课题发愁的研究生们来说,相信这篇综述都能够帮助你更好的理解m6A甲基化与ncRNA之间的相互作用,为你的课题添光加彩,感兴趣的小伙伴们赶快阅读起来吧!

生信分析 玩法上新,细胞死亡遇上肿瘤微环境

       之前给大家分享的肿瘤基因集预后玩法很多了,记得上一回说肿瘤基因集预后的内容是缺氧和免疫,浏览量和后台留言很多,今天这个思路可谓青出于蓝胜于蓝。到底是个啥,准备小板凳和瓜子,嗑上!

对思路感兴趣的 可提交意向表单定制方案   生信分析意向表

背景:

肿瘤微环境(TME)由肿瘤细胞和周围区域组成,周围区域包括血管,细胞因子,趋化因子,成纤维细胞,细胞外基质。外部刺激或治疗,在肿瘤微环境中引发了多种细胞死亡过程。由于肿瘤、基质、内皮和免疫细胞死亡活性的改变而产生的免疫反应可以显著改变肿瘤的生长轨迹。

今天分享的就是三种经典的细胞死亡途径: 自噬,细胞凋亡和坏死  对肿瘤免疫微环境的贡献。

题目

肺癌细胞死亡相关免疫基因signature

发表杂志:

cancers(IF:6.126)

部分内容谍照:

1、细胞死亡风险模型构 建cell death index (CDI)

2、分组趋化因子差异表达、功能分析

2、各细胞死亡分组免疫浸润细胞差异

3、各细胞死亡分组免疫浸润细胞差异

背景:

肿瘤微环境(TME)由肿瘤细胞和周围区域组成,周围区域包括血管,细胞因子,趋化因子,成纤维细胞,细胞外基质。外部刺激或治疗,在肿瘤微环境中引发了多种细胞死亡过程。由于肿瘤、基质、内皮和免疫细胞死亡活性的改变而产生的免疫反应可以显著改变肿瘤的生长轨迹。

今天分享的就是三种经典的细胞死亡途径: 自噬,细胞凋亡和坏死  对肿瘤免疫微环境的贡献。

题目

肺癌细胞死亡相关免疫基因signature

发表杂志:

cancers(IF:6.126)

部分内容谍照:

1、细胞死亡风险模型构 建cell death index (CDI)

2、分组趋化因子差异表达、功能分析

2、各细胞死亡分组免疫浸润细胞差异

3、各细胞死亡分组免疫浸润细胞差异

对思路感兴趣的 可提交意向表单定制方案   生信分析意向表

更多生信精彩文章,可浏览 生信人网站

纯生信分析套路 非标准化的基因表达分类器

PrOTYPE:一个针对临床非标准化分析的高级别浆性卵巢癌亚型的基因表达预测器

背 景:

癌症分类的解剖学和组织病理学已经建立有一个多世纪了,但两者都作为疾病潜在分子特点客观评估的补充。分子生物学发展很好的助力于疾病的诊断和预测,比如最致命的妇科疾病,卵巢癌中最常见的组织类型(~70%)-- 高级别浆液性输卵管-卵巢癌(HGSOC, high grade serous tubo-ovarian carcinoma)可使用基于芯片的基因表达数据研究。

而HGSOC针对之前研究,分为以下四类(C1.MES,C2.IMM,C4.DIF和 C5.PRO)。C1/Mesenchymal (C1.MES)主要表现为间质纤维化,细胞质基质的成分高表达,其预后效果差。C2/Immunoreactive (C2.IMM) 瘤内CD3+/CD8+细胞浸润,炎症因子高表达,预后较好。C4/Differentiated (C4.DIF)瘤内CA125/MUC16高表达,临床表征与C2.IMM无区别。C5/Proliferative (C5.PRO) 瘤体通常耗尽基质和免疫组分,癌胚胎和干细胞基因高表达,预后不佳。

但由于基因表达层面的HGSOC分子亚型在临床上还没有统一的分型标准,今年6月加拿大温哥华总医院, 英国哥伦比亚大学卵巢癌研究中心联合美国多所大学和研究机构 尝试突破现有临床局限性和基因分子优势性,提出 PrOTYPE – 最小基因集HGSOC预测器 。该预测器使用NanoString平台,采用固定样本,耐受RNA降解,广泛适用于医院的病理实验室。

原理:

如流程图:PrOTYPE预测器原理示意图所示,该预测器输入数据类型分为独立的两类,也成为 并行数据 。首先采集数据,收集回顾性分析的20个来自Ovarian Tumor Tissue Analysis (OTTA) 联盟的FFPE肿瘤和临床数据;一个NanoString CodeSet包括513个基因(外加5个管家基因),通过文献挖掘,监督学习等方法进行亚型聚类。建立技术重复,排除偏倚,使用bootstrap方法训练和 评估了9种监督学习算法 ,最后基于树的集成分类算法(ADaboost)得到All array (1650基因)和随机森林(random forest)得到TCGA (438/513个基因)两个并行标记模型。根据标记模型,推导分类器所使用NanoString数据的最小基因集。将数据分为三组,训练集(8 studies),确认集(5 studies)和验证集(4 studies)。具体数据分类情况如图一。重复标记CL验证时,采用leave-one-study-out交叉验证方法和三种算法(LASSO, random forest and AdaBoost),对于ADcboost和随机森林,采用聚集基尼系数(aggregated Gini coefficients)排序,LASSO采用非零系数比例处理每个bootstrap样本,每次加入一个基因,通过迭代,得到前100高表达基因。

(流程图:PrOTYPE预测模型数据处理流程及模型建立)

 (图一:. Overview of processing of samples in from the ovarian tumor tissue analysis (OTTA) consortium. OTTA数据样本分类情况)

经过比对预测标签和CL的准确性、一致性和稳定性,确定最优势的算法,同时在确定集内考虑更小范围的基因数目,重复前面步骤,维持定义性能稳定情况下,确定最 小基因集 为 55个基因 。

最后做预测标签与临床相关的病理特征关联分析,用单因素方差(one-way ANOVA)分析比较连续变量,卡方检验(chi-square test)分析分类变量。Kaplan-Meier生存曲线和log秩检验评估单变量生存率。在多变量模型中,使用Cox proportional hazard,并使用综合似然比(omnibus likelihood ratio test)检验计算P值。所有统计检验均为双边检验。

结果:

通过比对两个并行数据集,生成每个亚型概率和预测熵,取概率值最高的作为每个模型的标签标记,发现在两组中有很高的一致性(accuracy 79%; kappa 0.72),亚型比较发现C1.MES/C2.IMM 和 C2.IMM/C4.DIF差异明显。CL标记的样品,预测熵显著更低(p 0.0001),如下图二显示。

(图二:All Array 和TCGA模型一致性评价指标。)

通过上述三种算法对于最小数据集筛选,发现随机森林在确认集(n=817) 在55个基因后的95 -97%准确性(图三)。

(图三:随机森林算法确定55个最小基因集)

最终确认了55个基因模型,该模型具有指定的NanoString probeset和对照、特定的计算程序,以及对原始输卵管卵巢、未治疗的HGSOC样本输入标本的要求,如下图四。

(图四:PrOTYPE预测器工作示意图)

分析所选出的55个基因集,是之前HGSOC亚型报道的通路富集基因,有细胞外基质组分(COL11A1, COL1A2, FBN1),免疫基因marker(CD3D, CD3E, CD8A),表面受体和激酶(CSF1R,CD2, AXL),细胞因子和细胞形态(CXCL9, CXCL11, CCL5)和血管生成的基因(PDGFRB, FGF1, TCF7L1)。PrOTYPE对于两个NanoString数据集,相对于CL准确性分别为95%和94%。

之后研究人员选取临床样本做HGSOC亚型确定和临床病理关联分析,从1982-2014年间被诊断的病人,发现overall survival (OS) 和 progression-free survival (PFS) (reverse Kaplan-Meier)显著不同(Log-rank p0.0001,如下figure5)这和先前报道一致。C2.IMM和C4.DIF生存率最高,C 1.MES的存活结果最差(下图五)。根据之前的研究, CD8+ TIL水平在C2.IMM中最高:43%有高水平的TIL, 10%低水平或没有CD8+ TIL。C5.PRO有最低水平的CD8+TIL。随着CD8+ TIL的加入,OS和PFS亚型对应的风险比发生了变化,但OS亚型仍然独立预后。加上残留疾病和/或BRCA1/2加入模型,OS和PFS亚型都失去独立诊断价值。

图五

基于NanoString平台建立的PrOTYPE可很好的使用多种分析和FFPE组织样本。 有分析意向() 因此对于临床试验回顾性复查和档案样本收集分析,都有很好的复现作用。过去的几十年中,HGSOC诊断和治疗只有微小的改善,越来越多的案例表明,靶向治疗的重要性,PrOTYPE提供可供参考的高准确度的阈值,不妨是将利用基因预测作为临床病例分型诊断的一个新的开始。

发表评论

评论列表

  • 这篇文章还没有收到评论,赶紧来抢沙发吧~