医疗纠纷须知

“精准医疗”忽悠你没商量|2016

 深圳医学律师
精准医疗的核心是:每一个患者,每一个个体他们都是唯一的。
基因测序,从实时定量PCR,到一代测序、二代测序,整个范围比较广。下文中主要跟大家分享的是靶向捕获测序在精准医疗中的应用。
精准医疗与靶向捕获
现在大家有一种印象,好像精准医疗是奥巴马提出的一样,其实往前溯源,个体化医疗、转化医学都属于精准医疗的前身。
西方的医学史里,1940年马里兰州的一个医生就提出了精准医疗的理念。这让我想起了小时候看《动物世界》,每到迁徙季,西非大草原上很多斑马成群结队的在那儿迁徙,我们一眼望去每匹斑马都是一样的。但是实际上你走近了就会发现每匹斑马的纹路甚至是色彩都是唯一的。这就是精准医疗的核心,每一个患者,每一个个体他们都是唯一的。
再往前,在我国也有一些精准医疗理论的始祖。东汉时期张仲景在《伤寒杂病论》就提出了辩证论治,这是一个精准医疗理论的核心,每个病例要有不同的客观地治疗方法。直到2015年奥巴马才走上这个讲台,跟大家说精准医疗是美国的国家战略。然后我们国家紧接着三月份就召开了精准医疗战略专家会议,准备2030年前投入600亿。十二月份卫计委就制定了精准医疗战略规划,十三五的重大专项。在去年年底的时候,几乎有三分之一的省份都陆续启动了各个省级的精准医疗计划。今年三月份的时候科技部也发布了精准医疗的重大专项。
可以说,精准医疗从医学史上和医学理论上有很长的历史,但为什么到2015年才真正的像雨后春笋一样走进我们的视野?
NIH(美国国立卫生研究院)认为,三个技术的飞速发展,推动了精准医疗的爆发。第一个就是基因测序技术,这个主要是以二代测序为代表的基因检测,它无论从速度、准确度还有成本,都呈现了指数级的下降。这里面也有基因捕获技术的推动作用,以及液体活检技术的发展,使精准医疗时机越来越成熟。第二就是生物信息技术,包括云计算,数据整合分析方法,对数据分析、数据解读的推进。第三个也是现在非常活跃的人工智能,让我们的分析能够更加智能,可以发现很多新的东西,学习到新的规律做基因的预测。
紧接着刚才说述,基因测序技术是精准医疗的基础技术和推动力之一,那它又经过了怎样的一个发展历程?最早是人类基因组计划,十几个国家,花了十几亿美元做了好多年。测序越来越成熟以后,全基因组测序越来越方便,在不同的物种里面都取得了大量的数据积累。再往前进一步缩小一下范围,我们对全部的基因编码区进行测序,也就是耳熟能详的的外显子测序。其实外显子测序也是基因捕获的一种,只是把所有基因编码区进行了富集。最后再精准一点目标,就是目标区域捕获测序,它对特定应用场景中任何的基因,或者基因片段,甚至可以是非编码区域的,包括一些热点进行设计,然后开发出用来特定基因检测的panel。
二代测序大约是2006年真正地进入了应用,当时最早是Roche 454焦磷酸测序系统。我第一次看到靶向测序是2008年,当时是基于固相芯片上合成的探针,作为外显子捕获的产品。可以发现靶向测序的技术提供商,实际上最早是从芯片服务提供商演变而来的。大概09年的时候,安捷伦公司也推出了他们的外显子捕获的产品。其实大家可以从安捷伦的前身来看,最早是HP,核心技术是高精度激光打印,还有一些生化仪器都非常好。他也有他的芯片制造平台,也是从固相芯片的技术上发展上来的。
然后大概在2011年,国内的一些研究人员,包括我们当时也大概在那个时间点开始研究。比如说我们在研究这些探针引物的设计,或者说这些试剂的配比,并在2014年时能够对外提供产品和服务。在这个技术上中国跟国外比来说,落后大概6年左右。并在2015年时形成正式的试剂盒产品。
另一个时间轴是讲另外一类捕获技术,“多重PCR”的发展历史。1988年Chamberian提出PCR体系加入多对特异性引物,出现了多重PCR体系的雏形。然后在2005年左右的时候Life Technologies (Thermo Fisher Scientific)推出了他们的高通量测序平台,同时这个平台在07年就开始尝试测序仪的对接。然后在2010年的时候,他们推出来了Ion Torrent的平台,也推出了Ion AmpliSeq捕获的产品。我们从2013年研发,也是在2015年的时候正式的推出了基于扩增子捕获的产品和服务。
当然从国际上来看,这个领域的大部分核心技术提供商还是在美国及欧洲。有四家美国企业,有一个是罗氏收购的一家企业。在捕获测序的应用不一一列举,这是选了几个重要的点。可以说在精准医疗大部分的应用场景中,捕获测序都有它的用武之地,可以是肿瘤的预警、用药、筛查,也可以遗传病的诊断,也可以是产前的疾病筛查,以及我们大众健康的产品,就是前面郝向稳先生重点介绍的一些应用。
上图是我们的一些经验,是在精准医疗上的应用的一些深度、数据量覆盖度的状况。做全基因组测序的时候,其实一般的情况下只能测三十层,但是在我们临床检测当中的时候,要求精准度、灵敏度比较高,这个测序深度是远远不够的。但是如果我也测很深,这个成本在商业场景中是不可负担的。
然后,全外显子常规的现在测序一般一百层,在肿瘤的一些样本当中可能会测到三百到五百层,但是这个测序成本也比较高。
肿瘤组织的捕获测序一般是测一千层,能获得大概5G的数据。Panel的覆盖度,在一般的编码区都能占到99%以上。液体活检可能要测到一万层,因为它对灵敏度要求非常高。像遗传病的话,按照我们的经验两百层到三百层的深度就能够做到准确检测,因为它测的就是遗传突变。肿瘤样品异质性强,要测体细胞突变,所以测序深度要求更高。
靶向测序在精准医疗当中应用的价值是什么呢?第一相对来说检测的靶点多,这个大家都是承认的。第二就是现在的二代测序仪与试剂盒的操作,以及整个流程运转还是很快的,你要是快速测序也就几天就能出结果。第三就是准确灵敏。一般传统意义上认为测序是金标准。当测序深度,包括田埂博士他们做的一些技术提高了以后,灵敏度能到百万分之一。对于靶向测序来说最大的优势是成本低,精准医疗核心是要精准,在临床样品中必须达到一定测序深度才能实现精准。
在价值引导上,我觉得最重要的有两点,就是我们现在在国内做这件事。第一其实在靶向捕获核心技术,你会不太清楚里面的技术参数,从而不能建立这个环节的标准。比如说我们去报批的时候这些参数用户并不清晰,和国外企业合作需要付出极大的成本才能获得参数标准及联合报批的可能性。第二就是自主开发能够助于这个项目落地,无论是你在临床送样检测,还是做成一个解决方案去做入院,都会包含基因捕获的这个重要环节,门槛降低才会方案落地。
捕获技术是精准医疗的基础性技术
第二个部分可能是偏技术类的,我们认为基因捕获技术是精准医疗里面的基础性技术之一,大部分应用场景都会涉及。做一个比喻,大家看到《三国演义》赵子龙千军之中把阿斗给救出来。我们这个有几个过程刚好十分相像。
第一个就是目标区域识别。那么赵子龙在阵前,那么多的曹军在那儿,我又看不到阿斗在哪儿,带回来一个阿猫阿狗肯定不行是吧。所以说第一步是目标区域的识别,这个里面我们把赵子龙,就把这个探针引入。第二个目标区域,我们想要检测的精准目标就是那个阿斗。那么非常嘈杂的背景,因为曹军太多了,当时号称有十万曹军,整个基因组片段打碎以后很多很多,怎么样特异性的把这个给识别出来,这是一个很好的技术问题。
现在在基因捕获这一块主要应用的方法有两类。一个是液相芯片,基于探针杂交的方法,一个是扩增子也叫多重PCR,它大概有不同的应用区域能够结合起来满足市场上90%以上的应用需求。
【进阶版】
液相杂交适合于相对比较连续的长的片断,特别是对大片段的插入缺失、拷贝数变异以及基因融合现象的捕获。而且在大片段捕获时液相芯片的均一性比较稳定。当然它的缺点是什么呢?它的操作步骤还是比较多,杂交过夜的话还要两天,不过我们现在也在研发这个新的技术,看看这个时间能不能再缩短一点。
扩增子的技术也叫多重PCR,其实核心原理是PCR扩增以后直接测序,省去了建库的步骤。扩增子比较适合于热点检测,或者比较小一点的片段捕获。比如说我们能做到几百重或者上千重的扩增子。它的优点比较快速,属于快速检测的一类。第二成本相对比较低。缺点是基因热点特别多,或者捕获区域比较长的时候,获得的数量越多,引物的竞争性越强,这个产品的研发还有它的特异性非常的难保证。液相芯片实验周期还是比较长的,两到三天。扩增子三到五个小时,这是试用的一些范围。
捕获技术的关键无非是几个点,第一就是目标区域的识别,第二是目标区域的捕获,第三目标区域的回收和解析。识别的关键是探针和引物的设计。我们是自主开发的多参数的模型,经过近百个panel开发的磨练和数据反馈,才能把这个模型给优化出来。
第二,捕获需要根据设计的最优结果进行实验。首先通过我们自主开发的算法进行探针或引物设计。比如,大家要打一个家具,工匠们一般也是先用CAD画图,然后再做木工工艺。同理,捕获在实验过程中,也是包括多步骤,多个工艺的过程,你会发现做出来的结果不一定和设计的结果完全一致,所以后续还会有调整优化的过程,我们把这个过程叫做再平衡。再平衡其实里面有很多方向性技巧,没有做过大量的实验的话,第一时间是摸不到那个门路的。我们为什么能够在国内提供快速的订制开发服务,确实因为积累的经验能够支撑我们能够实现快速优化,能在极有限的时间内把高品质产品交付出来。
解析呢,我们把它理解为一个质控的过程。就是我们经过设计、实验然后测序。测序完了以后我们看结果中覆盖度、均一性还有捕获效率等等,是否达到了应用的要求。同时还有一些其它的质控标准,但这三个指标是基因捕获好坏的核心特质。下图是探针设计的一些简单的基本原理,就刚才说的特异性,热力学稳定性曲线,我们每个设计都会出具非常专业的设计报告,在客户评估完毕后再根据需求特异性修订设计或继续向前实验。
艾吉泰康正在努力打造高通量序列设计引擎。我们自己有些感悟,就是探针引物在设计环节都是序列,在高通量的序列特征的分析,或者说设计环节当中有很多的共性的东西。包括我们在基因捕获里面,无论是高通量探针还是引物设计,包括在其它的序列特征提取当中很多规则是一样的。所以我们可能会开发出越来越多的设计的应用,并且做到线上为大家免费提供服务。
实际上在互联网的领域,我们把这个定义为一种SaaS服务,就是一种非常专业的,高通量特征序列提取的一种业务流程。我们可以和专业的云计算的PaaS去配合(比如聚道云等),实际上我们今年一直在这个方面努力。因为它不只是一些生物的问题,还牵涉到一些算法优化,还有硬件的事,确实花了一些的时间,期待能和更专业的IT背景的人或企业合作。在序列设计的领域,当时我们已经积累发表了一批SCI文章和专著,引用率和使用率颇高。
基因捕获在技术原理上其实特别简单。液相杂交法中首先将常规样本的基因组打断,然后根据测序仪器加接头。我们设计的探针,会跟DNA随机打断的片段特异地互补结合,最后通过磁珠把捕获的目标区域吸附下来,吸附下来再经过洗脱、纯化、富集上机测序。可能不同的公司在这个里面有些细节不一样,但是这些公共步骤都是一样的。多重PCR就更简单,实际上它在实验环节中只需经过一轮或者两轮PCR,直接得到产物就上机测序了。这个里面难点还是在设计,以及实验条件的磨合上,实验步骤真的是特别简单。
从解析这个角度上给大家交流一下,里面有哪些关键参数来评判基因检测的好坏。第一个当然是有目标区域的测序量,覆盖度,数据的均一性,代表着是它的可信度,也就是准确度。所谓的均一性,形象一点比喻,你看reads的分布图跟山峰一样的,有高有低的那肯定就不均匀,在峰底的时候准确度就特别低,峰顶是过度的高。还有一些标准就是重复率、捕获效率,以及一些常规的测序质量等等。这个捕获效率我做了一个公式,讲的比较直观一点。比对到目标区域的有效数据量除以比对到所有的人基因组区域的有效数据量就是捕获效率。有效数据量是什么呢,你测序的时候会有重复率,用1减去这个重复率就是不重复率,不重复的达到QC标准比例再乘以原始数据,就是这个有效数据。然后平均深度我们是这么定义的,比对到目标区域的有效数据量除以panel区域的大小来计算平均深度。
重复率这一块我们的去重标准是非常严格的,只允许唯一一条,其它的都叫重复。目前部分企业筛选标准比较低,允许三条,会对检测结果造成很大的解读隐患。下一页展示的是在panel检测中可以通过增加测序深度提高准确度,你看在五十层的时候这个是一个纯合突变,到三百层的时候就被发现是杂合突变,明显表明测序深度能够部分解决准确度的问题。
靶向捕获的研究和临床应用
下面我讲一些具体的应用案例。捕获测序首先在基础科研上有一些应用,最近我们探索地跟一些研究所在基因组编辑的脱靶效应优化上面做的一些合作开发,然后在单细胞测序上面,经过上游的细胞捕获,然后扩增,下游再接上基因捕获看看这个数据效果怎么样。
另外像液体活检ctDNA的这一块也是比较多的应用。另外其实我们刚才聊了很多的东西都是基于基因组的。举个案例,就是基因组编辑的定制化的全基因组脱靶优化方案,实际上它会有一些目标基因,我们会对这个目标利用靶向测序技术分析它的脱靶效应,看能不能通过靶向测序把它给鉴定出来,然后优化实验的过程。首先它会有一些目标基因,比如说这个案例里面,就是DMD基因。我们会在全基因组范围内预测它的脱靶位点,然后从筛选这些位点进行编辑实验,实验结果会通过表型,无论细胞表型还是动物表型去查看。这时候其实还不能确定脱靶位点,然后可以通过把和表型关联的预测的这些脱靶位点进行捕获测序,精确地告诉大家,基因是否在其他的基因组区域上脱靶了,脱靶的基因型是什么?
另外在临床基因检测中应用最多的是SNP的发现和检测,同时其它基因组变异的筛查研究也特别多。我们举一些案例。这个是一个遗传病的panel,可以用来发现拷贝数的变异,右上直方图是父亲、母亲、孩子的拷贝数体现,能够发现显著的差异,蓝色的区域就是拷贝数的变化的量,这个能够确定拷贝数断点的位置。基因捕获技术还可以发现特别大片段基因的缺失,有些常规的分子生物技术还做不到。
这是展示的胰腺癌的一个样本中拷贝数变异,ERBB2的基因扩增是跟很多靶向药物用药相关联的,有助于协助医生判断对患者进行异病同治。
这个是我们做的一个panel,发现中国人群前列腺癌样本中的基因融合现象,因为基因融合有的时候比较复杂,它的融合点准确位置并不确定,而且有一些文献报道的也是欧美人群的数据。当你不知道这个融合点位置的时候,在设计引物和探针的时候非常困难。实际上这个是发现了一个比较典型的三基因融合的现象,就是Gene-1、Gene-2,包括这个ETV1的一个3基因的融合,在一代测序上面得到了验证。
这个是食管癌的panel检测案例,文献报道的有一个C1QTNF3-AMACR的基因融合。但是我们还发现了另外六个新的融合事件。Gene3和MECOM的融合,Gene4和VMP1的融合。这个也是刚才发现了更多复杂的融合的变异结构,通过生物信息可以把他们的基因的结构给复原出来。
艾吉泰康做了很多上游panel设计和开发,因此我们对panel基因检测本身的技术参数非常了解,我们也发现了产业内现存的一些质控问题。只有做好指控,并对技术指标的解读标准非常清晰,才能真正做到精准检测。
基因检测上游的测序技术,包括基因捕获技术在国内都处于发展早期和追赶期,行业标准也没有形成规范。我们长期和行业内企业合作,都是从原始数据到生物信息的各个层次的数据的整体交付,这样数据质量问题永远可追溯。跟我们打交道的大部分都是企业内的专业技术人员,好多像郝向稳先生、田埂博士这样的。他们会第一时间给我们反馈数据里面的问题。但是我们在做临床基因检测的时候,大部分的企业都是发布临床报告,医生并不能发现其中的数据质量上的一些瑕疵。所以需要我们这些从业者以职业道德去做好质控,每个技术指标标准都要非常清晰。
其实目前基因检测市场上还是良莠不齐,有很多由于数据质控造成的问题。这个案例就是测序质量的问题,测序质量低不筛除掉直接发报告导致了假阳性。测序质量不高的只有一个办法,就是重测。覆盖率,这个就是panel的问题,捕获区域完全没有覆盖完整,然后还直接去发临床报告,直接认定为阴性就传递给医生了。我们重新设计了这个panel保证了覆盖率,发现覆盖到的这个区域应该是阳性结果。这个是测序深度的问题。
刚才说到测序深度不够的时候,一开始是纯合突变,但是增加测序深度你会发现变成杂合突变了。这个数据可信度是指的均一性,当这个均一性不高的时候,我刚才做的一个比喻,它是像山峰一样,当你刚好你关注的突变点位于这个山峰的谷底的时候,这可能就是一个错误的结果,你去拿去验证,跟它的结果刚好相反。这个均一性,如果一个panel在一层、四层、十层、二十层的时候平均覆盖度分别是100%、100%、99%、99%这个下降程度,说明这个panel均一性很好,但如果覆盖度分别是90%、80%、70%、60%这个下降程度时,一般达不到临床级的应用,到不了95%以上的话可能都是要直接重做的。还有这个重复率的问题,这个结果重复率非常高,这个公司在做生物信息分析的时候的去重率标准放的特别宽,有了三条以上的重复它才去重。就会造成什么呢?他们真实的测序深度是假的,间接地造成了实际上因为重复率比较宽松,给你报告的达到100层了,但实际上才测了30层。30层就回到刚才那个问题,有的区域可能就不准吧,你测出来也是假阴性,这个机率非常大。所以最好还是在这些指标上要非常清晰的严格指控。
精准医疗基因检测是否精准?在中国目前还是一个任重而道远的问题。我们各个环节的从业者必须从技术创新、技术标准、技术质控,到后续的技术服务上用心去做,打造中国质造,才能达到真正的精准检测的终极目标。
服务模式探讨
我们提了一个概念叫“中国质造”,不光是能生产,最重要的是质量,在医疗应用场景中,我们技术指标可能达到了99.9%,但那0.01%到患者那儿,对他个体就是100%。这是我们的试剂盒及试剂盒里试剂的组成。过去一年我们和国内近80家机构订制开发了近一百个panel。
目前相对于那些国际竞品,我们现在的技术指标能够做到跟他们基本上不分伯仲。我们的采购链、制造基本都在国内,订制开发速度比较快,同时试剂盒交付时严格质控,同时交付实际捕获和NGS测序的质控结果。送测检测服务一般根据你的时间和不同成本的要求,从两周到一个月都有相关的服务。第一种就是说试剂和采购,基因列表提出来,我们通过设计开发质控完了以后,把试剂盒交付给大家,然后通过标准的protocol在自己的实验室进行操作。第二个合作模式是新技术的合作开发。就是因为有些产品比较新,确实我们标准服务里没有,但是我们对任何的产品开发都是一种比较开放的合作态度,以技术开发的形式进行合作。第三就是服务,你也可以送样服务,目前我们的测序通量还比较大,能够协助大家把时间和测序的成本降下来,测序成本优势比较明显。
来源:贝壳社,文/杭兴宜 2016-08-14 

服务热线:13692105196
本站由庹明生博士主办 版权所有 未经许可禁止转载