解读生命密码了解那些
文章目录
解读⽣命密码,了解那些 「命中注定
《⿇省理⼯科技评论》10 年合辑(套装全 5 册)
解读⽣命密码,了解那些「命中注定」对于普通⼈来说,基因测序获得的数据就好⽐「天书」,⼀段段由 A、T、G、C组成的序列就好像⼀段段暗码,⽞⽽⼜⽞⼜不知所云。因⽽专业的解读,帮助⼈们解析个⼈遗传信息与健康⻛险、⾝体特征以及⾎缘关系显得⼗分必要。
对于⽬前的测序市场,主要有科研级和消费级两种市场需求的基因检测。对于科研级来说,专业的测序为诊断、治疗提供了精准的遗传数据,但始终曲⾼和寡,不够「接地⽓」。对于⼀部分普通⼈来说,解读⾃⼰更多的是出于好奇,⽐如祖先从何⽽来,⾃⼰患有⾼⾎压、糖尿病的⻛险有多⼤,甚⾄包括⾃⼰可能会⻓多⾼、活多久。对于这⼀部分受众来说,精准的全基因组测序显得⼤材⼩⽤,因⽽最近⼏年,以 40 岁以下⼈群为主体的消费级基因测序开始蓬勃起来。
平⺠化的需求,要求基因的获取⽅式必须简单易得,因⽽与传统的基因检测从⾎液或细胞组织中提取遗传物质不同,消费级的基因测序多通过唾液获得,进⽽⽤来了解疾病⻛险。同样,与严肃的临床应⽤不同,消费级的基因测序只需要提取消费者关注的遗传信息,因⽽并不需要全基因组测序,更多的是只选择重要的外显⼦部分进⾏测序储存,⽽这样⼜⽆形中降低了测序成本。
尽管只是⼀种商业化、娱乐化的解读,但个⼈信息安全的问题仍不容⼩觑。正是由于如今测序技术的巨⼤进步,极少量的基因样本便⾜以追根溯源,了解样品提供者的亲缘关系,甚⾄可以推测个⼈特征,在⼀些情境下甚⾄可能导致基因歧视。随着商业化基因测序被⼴泛接纳,个⼈遗传信息安全的意识也必须全⾯加强。
iPhone 为例,消费者可以在应⽤商店中下载不同的软件,⽤来实现购物、运动、学习等⽬的。这些应⽤软件所带来的⽣活便利如今早已司空⻅惯,但你是否想过,也许某⼀天消费者也可以通过智能⼿机解读⾃⼰的遗传信息,定制私⼈⽣活呢?
相⽐传统的科研级基因测序给患者带来绝对精准严肃的医疗信息,对于消费级基因测序来说,消费者关⼼的可能只是何种运动、饮⻝更适合他,或⼀天是不是必须睡够 8 ⼩时才健康这种五花⼋⻔⽽⼜「⽆关痛痒」的问题。⽽ Helix 正是⽴志要满⾜消费者的所有需求⸺创⽴ DNA 应⽤商店。它希望通过与应⽤程序开发⼈员、⽣物公司和提供基因检测服务的医疗机构合作,直接为普通消费者提供有关祖源、娱乐、家庭(遗传病携带者筛查)、健⾝、健康和营养等⽅⾯的基因检测产品和服务,使在线获取基因信息成为可能。
Helix 是 Illumina 在 2015 年成⽴的公司,旨在打造全球最⼤规模⾯向⼤众的基因信息服务平台,在创⽴之初,便获得了超过 1 亿美元的投资。基于「⼀次测序,多次查询」(Sequence Once,Query Oenn)的经营理念,消费者只需通过采集唾液的⽅式向该平台提供遗传信息样本,便可以根据⾃⾝需求,在⼿机上购买相关应⽤查询个⼈信息。由于其创新性的商业模式,为普通消费者提供了更为⽅便快捷、成本低廉的⽅式了解个⼈⻛险和遗传倾向,在公司创⽴之初,便被《⿇省理⼯科技评论》评为 2016 年度⼗⼤突破性技术[13]。
2017 年 7 ⽉ 25 ⽇,Helix 的 DNA 应⽤商店(DNA App Store)正式上线,开启了消费级基因组学新纪元。这家位于旧⾦⼭的初创公司正式实现了他的商业梦想,成为「基因测序领域的苹果」。就像⼿机上的应⽤商店⼀样,通过 Helix 的应⽤平台,消费者可以轻松地探秘个⼈的遗传信息,⽽初始的基因测序,只需要80 美元(有折扣时价格甚⾄低⾄ 20 美元)。
Helix ⾸先对消费者的外显⼦组进⾏测序并且将这些遗传信息存储起来,根据消费者需求将这些信息提供给其 App 商店平台上的其他公司。通过该平台,消费者可以通过⽀付⼀定的费⽤,在祖源、娱乐、家庭遗传病⻛险、健⾝、营养及健康等多个⽅⾯,选择⾃⼰感兴趣的进⾏基因解读,甚⾄获得个性化定制服务。该平台真正做到让普通⼈可以接近⾃⾝遗传信息、解读⾃我,实现个⼈基因组⼀站式消费体验。
2018 年 1 ⽉,Helix 宣布了与内华达州的合作项⽬ Healthy Nevada Project。根据协议,Helix 将为上万名内华达州居⺠提供外显⼦测序服务,⼀旦该项合作成功,未来很可能复制到其他地区,潜在利润⼗分可观。
2018 年 3 ⽉,Helix 宣布完成 B 轮融资的第⼀轮,并计划 B 轮融资 2 亿美元。Helix 称未来资⾦将主要⽤于开发基于下⼀代测序技术的创新型健康产品,医疗保健领域将会是下⼀个重点。
消费级基因检测领域正处于⻜速上升的时期,据估计,截⾄ 2019 年 6 ⽉,约有2,600 万⼈购买了消费级基因检测,⽽其中⼀半以上来⾃ 2019 年。⼴阔的受众以及良好的市场接纳度为未来消费级基因检测市场提供了⽆限的可能,同时Helix 低廉的价格、多元化的应⽤平台给了消费者更多的选择,未来的成绩值得期待。
然⽽对于 DNA 应⽤程序的商业化推⼴,部分专家持谨慎态度。来⾃⻢萨诸塞州综合医院的 Daniel MacArthur 认为,关于⽣活⽅式、营养及健康⽅⾯的基因测试往往缺乏科学根据,过度地消费基因检测带来的过⾼期待,很容易使普通⺠众对临床上的基因检测价值产⽣怀疑。
因⽽内部监管必不可少,对于普通公众来说,很难对⼀款 DNA 应⽤的科学价值做出判断,为了避免噱头式的骗局发⽣,Helix 必须加强对平台的监管,在每⼀款应⽤上架前都必须进⾏测试验证,保证程序质量。同时,美国⻝品及药品监督管理局也在随时关注基因测序的信息安全问题。
除了满⾜消费者的猎奇⼼理,消费级的基因检测也有⼀定的实⽤价值,⽬前来说,消费级基因测序在产前⽆创 DNA 测序的应⽤中最为成熟。使⽤产前 DNA 测序,不仅可以对胎⼉进⾏常规遗传疾病的诊断,如唐⽒综合征等,甚⾄可以预测未来的⾝体特征及智⼒等私密的个⼈信息。这项技术也对公众的道德提出挑战:是否应该在婴⼉并没有选择权的情况下帮助婴⼉选择 DNA 测序,甚⾄因此改变婴⼉的命运。2013 年这项技术被《⿇省理⼯科技评论》评为年度全球⼗⼤突破性技术,却引发了巨⼤的伦理争议[14]。
产前诊断是指在怀孕中,为侦查⽣育缺陷,如神经管缺陷、染⾊体异常、遗传疾病等症状,⽽对胎⼉进⾏的筛查或诊断性检查。产前诊断⽅法包括侵⼊性⽅法和⾮侵⼊性⽅法。⽬前侵⼊性⽅法仍旧是确诊唐⽒综合征等染⾊体疾病的主要⽅式,并以⽺膜腔穿刺最为常⽤,该种诊断⽅法存在⼀定的流产⻛险。
1997 年,⾹港地区的科学家卢煜明通过研究发现,孕妇的⾎液中含有数以万亿计的胎⼉ DNA 碎⽚,其中来⾃胎⼉的 DNA ⾼达 $15%$ ,这使得⽆创筛选成为可能。2010 年,卢煜明等⼈再次发表研究成果,证明孕妇体内游离的 DNA ⽚段可以⽤来重建胎⼉的完整的基因组,并可⽤于⽆创性产前诊断。
只需要⼏毫升来⾃孕妇的外周⾎,研究者便可以收集其中胎⼉的 DNA 碎⽚,并通过⾼通量测序技术结合⽣物信息分析,计算胎⼉患染⾊体⾮整倍体疾病的⻛险。此技术能同时检测 21-三体、18-三体及 13-三体,还可发现其他染⾊体⾮整倍体及染⾊体缺失/重复。由于这种⽆创的筛查⽅式更加安全⽅便,⼀经提出便被⼴泛接受,成为有史以来普及最迅速的检测之⼀。
为了扩⼤⾃⾝在测序市场上的强⼤优势并布局临床应⽤,2013 年 Illumina 以3.5 亿美元的价格成功收购了美国产前诊断公司 Verinata Health。Verinata 是⼀家位于加州的初创企业,其业务主要是利⽤孕妇的⾎液为她们提供产前诊断服务。但在此之前该公司⼏乎没有任何收⼊,⽽这项收购发⽣时距该技术⾯世仅有⼀年的时间,⾜以⻅得该技术的突破性以及⼴阔的应⽤前景。
但产前 DNA 测序技术⼀经提出,便⾯临着巨⼤的道德争议。完整的基因测序就像是打开了潘多拉的盒⼦,将⼀个还未谋⾯的胎⼉的所有信息都展现在眼前,很难预判这种信息的获取会带来什么样的结果。就⽐如关于发⾊的信息,未来婴⼉头发是直是弯,或是否会秃顶。显然,⼏乎没有⼈会因为这种情况终结⼀个胎⼉的⽣命,但也并不意味着不会发⽣。
由此引发的⼈为「完美婴⼉」的担忧并⾮多余,对于⼀些并不致残、致命的缺点,不同⼈的接受度不同。甚⾄对于⼀些⽬前定义为疾病的遗传缺陷,未来很有可能在婴⼉发病前就已攻克,⽽在这之前胎⼉并没有机会决定⾃⼰的命运。在未出⽣前,胎⼉的所有优缺点都已被⼀览⽆余,与可以⾃主选择是否接收全基因组测序的成年⼈不同,胎⼉⽆权选择是否接受基因检测,⽽讽刺的是,这些检查结果却可能决定他的⼀⽣。
同时⽆创产前基因检测也存在⼀定的技术局限:⽬前不能检测易位导致的染⾊体异常;不能检测基因遗传疾病;不能预测晚期妊娠并发症等。随着国内⼆孩政策的展开,越来越多的⾼龄产妇选择产前 DNA 检测为胎⼉的健康保驾护航,但值得注意的是,⽆创 DNA 产前筛查属于筛查范畴,⽽⽺⽔穿刺是诊断范畴,尽管⼆者具有相似的准确度,但两者有本质的区别,前者⽆法代替后者。
同时,过度强调基因的重要性会使⼈们远离探索⾃我的初衷,对基因⻛险的过度解读会使公众只关注可能带来的弊端,因⽽增加⽆谓的恐惧和焦虑等情绪。很显然,可能患病并不等同于⼀定患病,但很多⼈会将这种可能性当作确定性对待。
DNA 测序似乎进⼊了⼀个困局,它存在的价值是因为可以「预告」⼈⽣,但⼀旦预先知道了这样的可能,⼈⽣还会继续吗?研究者不禁陷⼊了迷茫,难道就因为公众对于可能性的误读就要因噎废⻝,将如此价格低廉⼜⾼效的⽅法束之⾼阁吗?
当然不会,既然这种可能性说起来虚⽆缥缈,那为什么我们不将其量化、精准化呢?基于这⼀想法,研究者提出了基于基因的⻛险评估体系,也被称为基因占⼘,2018 年被《⿇省理⼯科技评论》评为年度⼗⼤突破性技术之⼀[15]。同时,2018 年也曾被预测为该技术的爆发元年。
基因占⼘是从海量的遗传数据中捕捉细微的遗传差别所带来的致病可能性。对于单个基因突变引起的遗传疾病,如镰状细胞性贫⾎(由单碱基突变导致),毫⽆疑问,⼀次简单的基因测序便可以确诊疾病。但是像这种突变和疾病之间⼀⼀对应的情况,并不存在于⼤多数疾病中,相反,⼤多数疾病的复杂诱因直到今天仍旧是未解之谜。
⼈类从不孤军奋战,⽽⾝体中的器官、细胞,甚⾄基因也是⼀样。对于⼈体中⼀种特性的控制,常常有多个基因共同参与,⽽对于不同⼈,每个基因⼜有着成千上万种不同的编码可能。来⾃得克萨斯⼤学的⼼脏病专家 Amit Khera 正在架构⼀个叫作「多基因评分」的体系。所谓「多」,指的是他的运算不只涉及单个基因,⽽是涵盖了数千个基因。
⽽构建这样的平台,⾸先需要⼀个浩⼤的数据库作为⽀撑,例如最近的⼀次研究中,研究者为了探究失眠的原因,使⽤了 131 万余⼈的遗传信息,创下了纪录。在英国⽣物样本库(UK Biobank)⾥涵盖了约 50 万英国⼈的 DNA 和医疗记录,遗传学家通过对此类的⼤数据库进⾏深挖,解密这些⼈的基因组信息与疾病、个性甚⾄习惯之间的联系。
通过海量的研究信息捕捉细微的遗传变化带来的影响,听起来似乎有些⽭盾,但如果将基因的评分⽐作⼀本账簿就好理解多了。为了建⽴多基因评分平台,凯拉使⽤了个体⼈类基因组中的 660 万个位置信息。每个位点都有⼀个 DNA 碱基,可能在我的体内是 G ⽽你的体内则是 A。在以往的研究中,遗传的随意性加⼤了理解疾病的难度,但基于遗传⼤数据,凯拉现在可以查找在某特定位点是 G 的⼈,患⼼脏病的⻛险会有什么变化,也许它只会让⻛险增加 $0.1%$ ;其他位置的G 也有可能让⻛险减少 $0.2%$ 。这些影响微不⾜道,但微⼩的遗传影响合计起来便会产⽣不容忽视的后果。
英国⽣物样本库中冻存着由 50 万名英国志愿者捐赠的 DNA 样品,轨道上的机器⼈正在此搜索样品
「在我所想象的未来,你可以在很⼩的时候就获得⼀份(⾝体状况)报告,」Khera 说道,「上⾯将提供你在 10 种疾病上的评分,⽐如你将有 $90%$ 的可能性患有⼼脏病, $50%$ 的可能性患有乳腺癌,⾄少 $10%$ 的⻛险患有糖尿病。」
这种评分对普通⼈来说或许只是⼀种可能性,但对于⼀些制药公司的药物研发及临床试验却很有价值。相⽐于其他基于表观的检测⽅法,DNA 检测具有独⼀⽆⼆的预⻅性,并可以随时检测,同时结果并不会随年龄或环境发⽣变化。2017年,来⾃加州⼤学圣地亚哥分校的脑科学研究者 Anders Dale 称,他计划推出⼀款阿尔茨海默症⻛险计算器。该⻛险计算器可以对⽤⼾是否会患病及何时患病进⾏预估。
尽管该项服务还未启动发⾏,但⼏家药物公司早已开始与其接洽。⽬前在阿尔茨海默症药物研发⽅⾯各⼤制药公司已经投⼊数⼗亿美元,但纷纷折戟。其中⼀个重要的原因就是已知的受试者均已发病,⽬前并没有办法得知未来谁会患病,因⽽也很难得知预防性药物是否真的有效。如果制药公司可以在阿尔茨海默症⾼危⼈群中试⽤药物,⼀切就变得简单多了。未来的药品将有可能贴有这样的标注:「建议多基因⻛险评分达 90 分及以上⼈群使⽤」。
然⽽,评分系统的这个概念并⾮新创,⽽是越来越丰富的数据使得它变得更加精准、更加完善。来⾃ Helix 的⾼级科学家 Sharon Briggs 猜测,未来⼏年内,来⾃ Helix 的 DNA 应⽤商店中的绝⼤多数产品都将采⽤⻛险评估体系。
不仅如此,拥有如此庞⼤的数据信息,研究者甚⾄可以反追疾病背后的「犯罪团伙」。10 年前,⼈类基因组计划完成之初,医学研究⼈员发起了⾸个现代基因搜索,他们仍旧希望通过⼏个主要的遗传元凶来解释糖尿病等常⻅病的病因。「我猜测,糖尿病将和 12 个基因有关,⽽这些基因的真⾝将在两年内陆续揭晓。」现任美国国家卫⽣研究院院⻓的 Francis Collins 于 2006 年⾃信地宣布,他也是⼈类基因组测序的领军⼈物之⼀。
时间如期⽽⾄,但结果却不尽如⼈意。2009 年,柯林斯和其他的遗传学家不得不郁闷地开始谈论「缺失的遗传可能性」。那么导致疾病的基因究竟在哪⾥?答案是,⽆处不在。到 2014 年,研究者终于有了⾜够的遗传信息库去证明这个结果。随着参与糖尿病相关基因搜索研究的⼈数从 661 ⼈变为 1 万⼈,最终升⾄ 8万多⼈,背后的⼀个个答案也蜂拥⽽⾄。现在我们已经知道在⼈类 DNA 中超过400 个位点与 2 型糖尿病相关,每⼀个影响都微⼩且难以检测,⽽并⾮之前预测的 12 个基因。
不难看出⽆论是基因占⼘还是确定疾病的幕后⿊⼿,其命⻔都是数据库。那么海量的数据信息从何⽽来,⼜是谁⼿中握有如此⼤量的遗传数据呢?
医疗科研机构⾃然是其中之⼀,但最⼤的主⼒你也许并未想到⸺消费级测序公司。2018 年,全球共有 1,200 万⼈完成了基因测序,⽽通过 23andMe 和Ancestry.com 公司的服务获取了遗传信息及家族谱树的消费者就有 1,000 万之多。以基因测序公司 23andme 为例,消费者只需要⽀付 99 美元(折扣时低⾄69 美元)就可以获得⾃⼰的祖源信息,如果⽀付更多,那么消费者将会在原始数据的基础上获得多项解读。但测序、解读的费⽤并不是 23andme 从消费者⾝上获取的全部收益,制药公司也喜欢为这部分信息买单。单就 2015 年年初卖给Genentech ⽤于帕⾦森研究的数据库⼀笔⽣意,23andme 就赚了 6,000 万美元。
⼀⽅出售,⼀⽅购买,看起来再平常不过。但对于普罗⼤众来说,使⽤或获取数据库信息时却远没有这么便捷。如今互联⽹已经让地球成为地球村,⼈们已经习惯了从互联⽹获取、分享信息,但基因信息的交流仍旧闭塞。在测序技术平⺠化的今天,⽆法获取⼤量信息的原因并不是技术限制,⽽是研究⼈员不愿意分享,由于隐私⽅⾯的法律法规,贸然将⼈们的基因组信息上传到互联⽹有可能触犯法律。
⽽全球基因组学与健康联盟(Global Alliance for Genomics and Health,GA4GH)要做的正是帮助⼈们打破这最后的限制,通过建⽴让 DNA 数据库互通的技术标准和平台,尽可能地连通每⼀个基因组信息,将基因测序带来的健康红利最⼤化。根据这⼀设想,研究者最终将构建⼀个包含数百万基因组的全球⽹络,即 DNA 的互联⽹。
这⼀想法的提出⾸次将遗传数据的应⽤从个体诊断推及到整个群体的参与,⽽这些共享的数据也必将给⼀些罕⻅病及未知疾病的诊疗带来深远的影响,因⽽2015 年 DNA 互联⽹这⼀技术被《⿇省理⼯科技评论》评为年度⼗⼤突破性技术[16]。
如今看来,这是时代所需的必然产物,但在基因测序⽅兴未艾,尤其是个⼈消费级基因测序刚刚起步时提出这⼀构想,是相当具有前瞻性的。
全球基因组学与健康联盟成⽴于 2013 年,是⼀个由医疗机构、研究型⼤学和⽣命科学公司等组成的⾮营利性组织,最初由 50 名来⾃ 8 个国家的科学家共同建⽴,旨在搭建⼀个共享基因及临床数据的平台。建⽴之初,该组织将⼯作重点集中在基因组数据、临床数据、安全和隐私、监管及伦理四个⽅⾯。
早在 2014 年,该组织就发布了名为「灯塔」(Beacon)的基础 DNA 搜索引擎,他们将数据库⽐喻成「灯塔」,每⼀个愿意加⼊的团体或个⼈只需要安装⼀个服务器程序,⽽这个安装的过程则被称为「点亮灯塔」。系统中的⽤⼾可以对其他数据库进⾏简单的问询,⽽其他灯塔可以回复「是」或「否」的答案。在这个过程中数据库的数据并没有被移动,因⽽保证了遗传信息的相对安全与私密。虽然这个过程很简单,但⾸次连通了孤⽴的数据库,是遗传信息交流的⼀个重要开端。
随着近⼏年基因测序领域井喷式的发展,海量的遗传信息正在涌现。2017 年 10⽉,全球基因组学与健康联盟公布了名为「GA4GH Connect」的未来五年战略规划,呼吁联盟的 500 多名成员开发新的数据共享标准,⽤于当前重⼤的国际基因组学数据计划。
⼀群⼈想着从科研机构⼊⼿,⽽另⼀群⼈则是直接瞄准了每个基因组的拥有⼈⸺普通消费者。遗传信息与普通可销毁的信息不同,⼀旦被外界获取,整个⼈就如同「裸体」⼀般⽰于⼈前,家庭关系、⾝体特征、缺陷等都被⼀览⽆余。很多⼈出于隐私或花费的考虑,并不愿意接受基因测序或共享遗传信息。⽽今,由哈佛⼤学遗传学专家 George Church 牵头创⽴的公司 Nebula Genomics 就很好地均衡了信息共享与隐私问题,他们承诺可以以低于 1,000 美元的价格帮助顾客完成基因组测序,并通过区块链保障信息的安全,甚⾄消费者可以亲⾃参与到⾃⾝遗传信息的决策中,依照⾃⾝的意愿通过区块链决定储存或交易遗传信息[17]。
「这是⼀种应对基因组学挑战的新⽅法,这个⽅法综合考量了测序花费、遗传信息保护、数据管理以及基因组⼤数据的处理,基于区块链技术,让更多⼈真正地『拥有』⾃⼰的遗传信息。」丘奇说道。
区块链具有去中⼼化、公开安全及难以篡改的特点,以区块链为媒介完成消费者遗传信息的保存及分享,可以使普通⼈直接⾯向制药公司,选择是否交易个⼈遗传数据。在交易中,购买⽅的⾝份要求绝对透明,⽽数据提供者则可以保持匿名状态。事实上,⽣物技术公司和医药公司并不能下载消费者分享的数据,⽽只是「借⽤」部分信息。
这⼀构想不仅可以保障遗传信息所有者的隐私安全,同时可以将遗传数据转化成加密货币,实现真正的价值。但随着 DNA 测序及解读的⻜速发展,未来很可能会因此滋⽣⼀些怪相,⽐如根据智商预测为孩⼦选择学校,或根据⾝体条件评估决定是否录⽤职员这类荒唐事,更严重的甚⾄可能引发由于遗传信息决定的社会分级。残酷的是,你的分级并⾮因为测序,⽽是从出⽣的那⼀刻就已经决定了,并⽆法更改。
但这些由于发展过快带来的脱节最终都将会被弥补,并且可以预⻅,未来科研相关的基因检测仍将是核⼼与重点,⽽消费级的基因检测将会成为热点。值得注意的是,尽管⽬前消费级基因检测的市场看起来已经繁花似锦,但这些也只是序曲,消费级基因检测的时代还远未到来,随着测序成本的降低、解读应⽤的完善以及个⼈信息安全保护机制的实现,未来 5 年内,消费级基因检测必将进⼊⼀个新的舞台。
评论
文章作者 知乎
上次更新 2025-03-09