TCGA癌症临床数据资源全面介绍---癌症研究科技领域的全谱!

2021-12-06 03:53 来源:焦作妇科医院

2006年,帕金森氏症序列由此可知谱(The Cancer Genome Atlas, TCGA)原先以多形普遍性胶质母线粒体疣(GBM)、肾上皮细胞线粒体癌症(LUSC)和卵巢浆液普遍性囊脑疣(OV)开始为期3年的试点这两项,2009年~2015年全盘进行时。到这两项年末,TCGA网络研究者指导者已描绘了33种帕金森氏症并一般来说10,000余唯病症人的化学键特性,并度量了很多化学键免疫球蛋白。TCGA包含的病患关键特性代列于小党化的数据集搜罗。为确保自始确可用这些具序列特性的海量病患数据集,最近TCGA进行时一批重大成果,发列于在CellPress旗下的期刊。

本文对4月末5日发列于Cell上的一文顺利进行程式码。文章探讨以OS(总肉食动物期)、PFI(无方面有规律)、DFI(无病症有规律)和DSS(疟疾相关存活)为四个主要病患结果往南的TCGA小党帕金森氏症病患数据集资源(TCGA-CDR)规范数据集库,并量度出来了每种帕金森氏症并一般来说的往南可用促请。TCGA病患数据集可从序列数据集共有享室内空外(GDC)搜索引擎下载,所有的化学键数据集在下载。病患数据集和化学键数据集可用比方说的条形码结构,便于病症人的病患数据和结果推断化学键数据集统合。

TCGA小党癌症数据集库配置文件特性

由此可知1A为病患数据集统合和研究方法有及4个主要病患往南衍生和分析的流程由此可知,对33份初始登记和97份后续数据集文件,共有33种帕金森氏症并一般来说111,60唯帕金森氏症病症人的数据顺利进行了执行。列于1为每个TCGA配置文件的基本特性。按原发结果推断根据化学键特性被选为每个配置文件,皮肤黑色素疣(SKCM)的原发和移往灶两种并一般来说都有,其它极更加少数的原发与移往并一般来说也有研究者。

由此可知1. 病患数据集统合和研究方法有及4个主要病患往南衍生和分析流程由此可知

列于1. TCGA 小党癌症配置文件特性

病患结果往南OS、PFI、DFI和DSS

总肉食动物期(OS)很最主要,优点是度量OS血案时模糊普遍性最低。但可用OS作往南意味著削弱病患研究者,因为非癌症惨死法一般来说能说明了出病理学、蹂躏普遍性或对病症患缓解。可用OS或须更加长的随访时长;很多病患试验中的,通常采用相对于随访时长较短的DFI或PFI。针对除此以外TCGA病患数据集,要了解到MLT-病患随访有规律在蹂躏普遍性帕金森氏症并一般来说结果的最主要普遍性,因为意味著几年内就检视到病患血案,在丧命前所已用到病症情发作或方面。对蹂躏普遍性较弱的帕金森氏症并一般来说,病症人在数十乃至几十年后发作,随访长时间意味著无法检视够大血案以支应以合理结果外说明。该研究的旨在是验TCGA小党癌症病患检查的相对于优势和不足,个人兴趣今后的研究和防止随访有规律时长不足等局限性。

研究全部TCGA病患数据集后,事实如下:在数据集比如说得时,OS、PFI及DFI相对于精确,但大部分情况下只能估算DSS。由此可知1B为33种不尽相同帕金森氏症并一般来说的OS K-M圆弧。尽管肉食动物研究不是TCGA主要最大限度,大部分帕金森氏症并一般来说肉食动物圆弧与过去分析相同肉食动物往南的独立国家研究者相仿,GBM、OV(2008, 2011)和低级别胶质疣(LGG)(2015)的TCGA结果就是比较好唯证。PFI、DFI和DSS的K-M圆弧见由此可知1C–1E。

由此可知1 B-E病患数据集研究

基于每种帕金森氏症并一般来说4个往南的检视时长量度最低随访时长及血案或验的中的位时长(列于2)。所有的中的位随访时长为22.1个月末,但不尽相同并一般来说帕金森氏症该时长差异普遍性极大;GBM和急普遍性髓系白血病症(LAML)最短最低12个月末,而消化道嫌色线粒体癌症(KICH)最长最低48个月末。

列于2 总体中的位随访时长及4个往南的血案与检视中的位时长

举荐可用的病患结果往南

病患结果往南选择一般来说研究者最大限度、血案存量、配置文件大小和结果数据集总质量。将这些方法有和开发的其它方法有作为对单个疟疾数据集库的验和补充验,量度出来在每种疟疾并一般来说中的可用每个结果往南的促请及缘故(列于3)。每种帕金森氏症并一般来说的肉食动物往南须要至更加少通过一个主要验和补充验才被放弃。33种癌症中的的13种可用全部4个往南:膀胱尿路上皮癌症(BLCA)、宫颈上皮细胞线粒体癌症(CESC)、结肠癌症(COAD)、食管癌症(ESCA)、黑纹上皮细胞线粒体癌症(HNSC)、消化道状线粒体癌症(KIRP)、肾脑疣(LUAD)、LUSC、OV、胰脑疣(PAAD)、肉疣(SARC)、消化道脑疣(STAD)和子宫内膜癌症(UCEC)。忽略,很难一个往南的有嗜铬线粒体疣和副结缔一个组织疣(PCPG)。呼吸道弥漫大B线粒体呼吸道疣(DLBC)、LAML和胸腺疣(THYM)仅一个往南;剩余帕金森氏症并一般来说2或3个往南,但其中的一些应以保留意愿。最合理的是PFI,可无保留地举荐给除LAML(无数据集)、DLBC和KICH(小心谨慎可用)和PCPG(不举荐)以外的4种。

列于3 往南OS,PFI,DFI及DSS的分析与举荐可用

解析TCGA-CDR及案唯应用

在乳脑疣研究者中的,雌激素ER阴普遍性病症人病患肉食动物期肾功能比ER+病症人差。分别用OS、PFI、DFI和DSS相当这两类病症人的肉食动物期(由此可知3A–3D;圆弧年末于10年随访时长,但可用整个数据集库顺利进行研究)。单诱因研究推断,可用PFI(p= 0.005)和DFI(p = 0.001)作为病患往南,TCGA中的ER+乳脑疣病症人比ER-病症人有更加好的肉食动物期,但可用OS时两类病症人外不不存在差异普遍性(p = 0.097) 。此以外,两类病症人的DSS(p = 0.009)有相当大差异普遍性,列于明DSS的潜在内涵。以上发现证明了PFI和DFI是特定并一般来说乳脑疣化学键研究者的合适往南。

由此可知3 解析和应用实唯

此以外还解析了蹂躏普遍性GBM肉食动物结果往南。TCGA中的GBM中的位OS为12.6个月末,介于早先所媒体报道的规格病症患的12.1个月末和规格病症患重新组建替莫唑胺的14.6个月末都有。中的位PFI是6.1个月末,介于早先所媒体报道的规格病症患5个月末和规格病症患重新组建替莫唑胺的6.9个月末都有。无论如何,TCGA数据集库OS和PFI血案时长与文献一致。再度印证OS和PFI作为GBM化学键研究者的病患往南效度。

用Cox百分比意味著会复归线性确定高期(III、IV期)相对于低期(I、II期)帕金森氏症病症人的意味著会比(HR),解析4个往南的TCGA-CDR数据集。由于DFI度量与其它结果的度量不一致,对举荐可用OS、PFI和DSS的14种并一般来说帕金森氏症相当logHR(列于3)。随后仅对保证Cox百分比意味著会断言的疟疾顺利进行统计分析(由此可知3E–3G)。结果列于明,14种并一般来说帕金森氏症中的,除外皮疣(MESO)、PAAD和葡萄膜黑色素疣(UVM)以外,高期对比低期HR在3个举荐往南OS、PFI及DSS上轻微偏高。采用归一化结果推断的Wilcoxon秩和验,当可用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测时,logHR有相当大差异普遍性,推断疟疾方面和肉食动物往南在HR上不存在系统会偏移;OS与DSS都有很难相当大差异普遍性(p = 0.106)。对2个logHR数值的规格误用顺利进行逆加权最低确定Pearson绝对值, 由logHR估算的3种结果有极相当大自始相关:PFI和OS绝对值0.96(95%置信区外[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区外:0.76–0.99),OS和DSS为0.90(95%置信区外:0.61–0.98)。这些相关普遍性潜在支应以病患最初用PFI,后期用OS和DSS做往南。

除了统合化学键数据集,还更进一步研究首次病症患后无病症病症人与非无病症病症人是不是用到不尽相同的新近血案。TCGA-CDR中的29类帕金森氏症反馈可用化解该缘故,确立病症人从病患到进行时首治并达到无病症状态至更加少存活3个月末。以LUSC为唯,有289唯无病症病症人和41唯长时间非无病症病症人,NTE率分列21.8%和68.2%。用Cox百分比意味著会复归线性,发现在非无病症病症人中的NTE意味著会相当大略低于无病症病症人(HR = 6.68,95% CI = 4.25–10.51,FDR缩减q数值<0.05)。在另以外21种帕金森氏症并一般来说中的也有数值得注意结果(列于4)。余下7种中的很难检视到这些差异普遍性。我们也在分析是不是每个线性都保证百分比意味著会断言,其中的有两个不具备,须要研究者时长忽略及多参数线性来寻找缘故。

列于4 非无病症与无病症病症人NTE发展对比

TCGA从全球数百个市区内搜罗爱滋病症,为化解病患数据集不尽相同市区内外的可比普遍性,须慎重考虑数据集完整普遍性、和病症人特性等。对每种疟疾而言,我们对比了前所两名缺少爱滋病症数最多的一个组织;也市区内(TSS)与所有其它TSS的同种疟疾及4个结果往南(列于5)。

列于5 对来自前所两位TSS的每个帕金森氏症并一般来说研究者结果顺利进行相当

对于GBM等极富蹂躏普遍性的,前所两位TSS(#1和#2)的发病症年轻人与其它TSS相比数值得注意的有OS、PFI和DSS,因血案太更加少难以研究不举荐DFI做往南。BRCA等较低蹂躏普遍性,强力举荐可用PFI和DFI,但促请小心谨慎用OS或DSS分析。TSS #1的病患数据集产生不太好的OS和DSS,但很难检视到PFI差异普遍性;另以外,列于面上TSS#1有更加好的DFI结果,仅用到3唯 DFI血案。这种列于里不一的现象列于明该市区内的结果数据集须全面分析。另一方面,TSS #2的4个往南结果与其它地方一致。

这个简单的结果相当列于明,当从特定结果研究整体TCGA的病患数据集时,须要慎重考虑TSS的确切反馈。由于年龄、分期/分级及病症患等诱因冲击不尽相同TSS患病症年轻人的往南结果,TSS可以作为这些和不完全病患释义等其它未能测差异普遍性的替代。

潜在的参杂诱因、公平竞争结果的

意味著会及线性断言

对病患肉食动物往南研究来说,促请可用所执行的全部病患数据集。但相比化学键/序列数据集的统合研究,要注意到两个方面。首先,举荐意愿基于基线肉食动物线性,以化学键免疫球蛋白作分析表征划分结果推断集,有意味著损坏结果统计分析的相当大普遍性差异普遍性。因此,从互不关联的TCGA化学键数据集或免疫球蛋白TCGA-CDR结果数据集中的得出的事实须在独立国家的数据集库中的全面证明。

第二,我们促请仅可用原发的化学键数据集,因为病症人初诊时,最主要时长反馈等归一化的病患数据集已搜罗相对于完整。皮肤黑色素疣(SKCM)在TCGA并一般来说中的非常特别,470唯中的仅103唯原发,其余296唯为原发局部腹腔移往,68唯远端移往。这与很更加少搜罗到移往疣的其它TCGA帕金森氏症并一般来说形成一时期。SKCM移往疣很更加少不具归一化的原发,而其它TCGA帕金森氏症并一般来说尽管很更加少有移往疣,但都不具归一化的原发结果推断。因此,对于SKCM结果的相关普遍性,促请只可用有限存量的原发爱滋病症,尽管SCKM腹腔移往的III期爱滋病症可作为独立国家组群顺利进行研究者。

在可用新近统合的TCGA-CDR数据集库时,还须要注意到:潜在混淆诱因、公平竞争结果的意味著会及线性断言。

参杂诱因

参杂诱因不存在但被剔除在线性之以外时,偏移意味著太低或忽略真实。如在乳脑疣的种族差异普遍性研究者中的,白人与黑人病症人都有不存在最主要的基因列于达差异普遍性,然而根据化学键免疫球蛋白顺利进行缩减后,这种差异普遍性相当大减更加少甚至销声匿迹。治果也是潜在的参杂诱因,当反馈可受惠时应适当慎重考虑缩减。病症患未能知时,年龄、诊治医院及病患日期等规格病症患作为替代反馈能减更加少大多误用差。对这方面的决策构建,鼓励可用;也肾功能研究者促请分析报告(REMARK)。

公平竞争结果的意味著会

测出DSS、DFI和PFI往南时,要对很难经历最主要血案且无病症的丧命病症人顺利进行审查。在这种情况下,如果断言病症人很难其它惨死法,那她/他最终仍意味著惨死于帕金森氏症指征。然而,在估算病症患等分析表征对继发普遍性帕金森氏症或心血管疟疾等非规格普尔帕金森氏症丧命意味著会的分析能力时,该断言并不比如说。

线性断言

应用Cox百分比意味著会(PH)线性只能验PH断言。除更加少数案唯以外,大大部分线性都保证Cox PH断言,但须全面探索这些爱滋病症以追踪无视断言的缘故,从而对HR显然更加准确的估算。尽管之前为清理数据集和化解缘故付出了巨大坚应以不懈,但仍不存在最主要的可用约束,访问TCGA病患数据集都只能了解这些约束。

首先,TCGA主要是为化学键研究者设计,最初爱滋病症选择来自多个机构不具合适备用一个组织的未能病症患原发爱滋病症,因此这些爱滋病症不组合而成连续普遍性。此以外,对于每种不尽相同并一般来说/研究者,随访数据集很难统一搜罗。同时,病患数据集搜罗的一些规则在过去设法随着时长的很短而改变。TCGA - CDR不包含帕金森氏症病症患史,并非所有爱滋病症都被释义。因此,研究特定并一般来说或免疫球蛋白的病症患取材很低概况普遍性小党癌症研究。当病症人顺利进行确切病症患时,受惠能用DFI和PFI往南直接研究。

其次,TCGA结果推断病患随访根据当地诊所的时长列于,意味著为疟疾或特定口腔的发作和病症人最主要一个人状态的记录,因此很难TCGA指定的病患随访原先,仅量度出来这两项主要强调的化学键特性。

之前所,几乎所有TCGA取得的结果推断和序列及化学键数据集来自新近诊病症人原发的单个切片,由此产生的序列和化学键数据集不能在室内空外或时长任何方面一致逃逸代列于另一病症人结果参数的异质普遍性。该缘故不是TCGA相异的,任何线性原发普遍性研究者都不存在。

展望

这项指导是当今世界第一次全盘着重执行TCGA小党癌症病患数据。由此产生的TCGA-CDR的结果往南与独立国家非TCGA研究者结果一致,说明该资源在空前所规模的病患尺度上缺少了生物观测新近视角。也要了解到TCGA-CDR的内在可用局限普遍性及关键普遍性个人兴趣和举荐意愿。之前非常明晰,人类疟疾未能来大规模的化学键研究者只能着重搜罗病患病症理、病症患和转归血案数据集,以坚应以最高规格的病患研究者。尽管有其局限普遍性,TCGA-CDR缺少了规范数据集库,以及明了的4个病患结果往南导出,并化解了总质量缘故,从而在小党癌症和个体水平上顺利进行转化研究者。未能来数据集研究者的融合将全面提高结果都有的可比普遍性,更加好地解释和支应以重复。

参考数据

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
经络两虚的症状 经络不足易与皮肤干燥症混淆
发汗是持续化学固体短时间活动、抵挡传染病和持续容颜的只能固体,当发汗过剩时候化学固体容更易遭遇多种患病现像,如异性恋容更易衰老、乏力,...[详细]
2022-05-05
痛经是什么状况导致的
烦经是再次发生在女特质人群之中的病症,它是女特质在排卵前或是排卵此后再次发生的额下腹部疼烦腹泻,中风可能还就会伴随着腰酸的不适腹泻再次...[详细]
2022-05-04
【科普营养】拿什么搭救你的发际线——也许吃对了就能改变!
已授权《中都国外科微量元素网》转载 「发际线」频频上热搜。并未人一心到,「英年早秃」没明白现在是许多年轻人都担心的关键问题。 某宝上一...[详细]
2022-05-03
前车之鉴!医生临床经验教训回顾
临床药剂学医生们其实也有同;也的历程,初临手术室的小药剂学医生们叮嘱认自始看无论如何,这些例子都是这样一来则会牵涉到的,不怕一万,就怕...[详细]
2022-05-02
当菜鸟医师碰上菜鸟护士……
在外人看成,救护搭班就只有一种,眼科医生和医务人员,但是在我们医务人员看成,搭班可就不止一种了……菜鸟眼科医生眼看菜鸟医务人员这是救护...[详细]
2022-05-02
试管婴儿复制后孕酮低怎么办呢
对于哪些没有自然分娩的家庭来说,试管婴儿是最科学的**形式之一,在复制后准妈妈最害怕的事情之一,是雌甲状腺激素变较差,那么,碰见这种...[详细]
2022-04-28
排卵期有什么症状 这些现象别容忍
男性生殖是来得极其重要的一个过渡阶段,因为在男性生殖中备孕和节育就是一个来得极其重要的过渡阶段,但是很多男性不发觉在牵涉到生殖的时候时...[详细]
2022-04-27
宫寒的原因 保暖不足还会随之而来这个问题
多数的成年人朋友在生活中的则都会遇上宫寒的情形,一旦浮现了宫寒对我们的双腿有很小的直接影响,这个时候我们某种程度怎么办呢?并不需要引起宫...[详细]
2022-04-26
铠侠对生命科学研究成果中的大容量数据进行加速分析
铠侠集团(KioxiaCorporation)新宣布为科研成果中大容量数据的加速分析做出了贡献,并在《科学》杂志(1)上发表了一篇新论文《扩展测序:完整生物系统中的...[详细]
2022-04-25
  • 地区医院
  • 医院联盟