shenyukun

生命数字化:中美消费级(DTC)生物技术趋势
整理/张楠4月15日,贝壳社邀请碳云智能合伙人、高级副总裁覃璞,担任医健创业创新第一直播平台“贝壳说”的主讲嘉宾,...
扫描右侧二维码阅读全文
15
2018/06

生命数字化:中美消费级(DTC)生物技术趋势

整理/张楠
4月15日,贝壳社邀请碳云智能合伙人、高级副总裁覃璞,担任医健创业创新第一直播平台“贝壳说”的主讲嘉宾,介绍《生命数字化:中美消费级(DTC)生物技术趋势》。碳云智能倡议建立数字生命联盟,及其通过资本联盟斥资4亿美元投资的7家公司,涉及到美国生物技术明星企业PatientsLikeMe、SomaLogic、HealthTell,等等。
生命数字化已经展现出未来的曙光。覃璞表示,如果你是马拉松爱好者,智能设备持续心肺监测可以让你的私教在指导时更有针对性和随时调节训练进度,并根据肠道微生物模型,来建议指导训练期间适宜的营养补充方案;站在一面镜子前,转动身体摆几个pose,智能镜子就能快速告诉你外形体征的数十个参数,更频繁地反应你数月纤体锻炼期间的细微变化;智能马桶和尿液收集设备,未来不需要你将尿液样本寄回,就能便捷地采集数据,你可以上传到健康管理公司进行分析判读,以得到自己的代谢健康情况;细菌也并不都是有害的,有益处的氨氧化细菌能分解汗液,保持良性的皮肤微生物环境,现代生活中的你只是在大量化学杀菌产品的使用中,流失了这种天然屏障,而你可以洗脸后通过活菌喷雾把它们补充回来……
——个体生命数字化理念需要有哪些前沿技术支撑?目前来看,国内外各自发展到什么阶段了?
——数字化生命需要哪些机构共同参与完成呢?不同企业机构之间的配合与衔接有困难么,如何克服?
——对海量生命数据进行整合分析,这个准确度和科学依据来源哪里?
——请您分析下生命数字化健康管理行业现状?市场认可度高么?参与的用户画像以及参与后的效果如何呢?
——实现数字化生命,是未来必然的发展趋势么?真正实现生命数字化还需要多少年?行业发展的困局和关键点在哪?
覃璞演讲实录:
今天我和大家主要聊下消费级基因技术在中国和美国市场的情况,还有碳云智能的商业想法。我从几个维度谈下,一是碳云智能的数字生命联盟,包含八家公司的布局情况,再以联盟为点展开分析整个行业的情况,最后看消费级基因检测在中美两国有哪些前景,及具有怎样的市场。
简单讲下数字生命联盟,碳云智能从2015年成立后做了几件事,第一件是生物技术到消费者方案这之间的过程探索,做了很多商业模式的尝试。另一个事情是定义了产业的形态,描绘了数字生命的科学和产业链,并在数字生命的上下游作了资本布局,寻找到其他公司的小伙伴,构成数字生命联盟。
解析数字生命
我先解释下数字生命这个词的来历。实际上,今天试图向消费者解释纯粹的生物技术会非常抽象。但我们可以用一句话来简单的予以概括:为消费者最终提供一个在计算机里模拟的个人生命状态和规律,并且去通过去理解它的规律来做自我健康管理。为了模拟生命状态,至少要做三件事情:
第一部分,是用各种分子生物学技术,把生物样本放到机器里面做各种各样的测序,得到有机生命的数字化。再加上对生命行为、环境的持续测量,这部分我们称为数字生命的量化(生命数字化)。
第二部分是试图理解每个人的数据表达了什么样的健康状态,状态在行为事件下会发生什么样的改变,找到这样的个人规律即理解这个人的数字生命。
第三件事,是利用建好的模型去做很多健康管理类应用,选择更好的干预。
由此,我们将数字生命产业上下游定义为三类企业:
上游企业,采用各种技术做数字生命的生成,实现数字量化。以数字化生命联盟中的企业为例,不论基因组学、蛋白组学、免疫组学、生化测量的都是这一类,把健康的现状和行为做了数字量化,都属于我们的上游公司或上游合作伙伴。
中游企业是数字生命理解,主要工作是大量数据分析,数据挖掘,对状态变迁的规律做大量人工智能建模。
和我们平常的理解不同,并不是简单的将基因检测中的诊断试剂或检测芯片,进行市场上常见的消费级检测或疾病预测,更多的是将大量地、一段段的个体数字生命的视图,在每个时间节点上相互比较,这是我们最大的不同。换句话说,我们其实在看一个消费者所委托的不同生物样本,在不同时间点和不同事件前后发生的变化,我们看到的更像是一个生命的快照,相对一个干预或一个事件所发生的变化。
有了变化后,就可以在下游寻找另一类合作伙伴,做健康干预服务和产品的企业。
这样来说,碳云的八家公司也是这样来布局的,在美国的SomaLogic是专门做蛋白质组学检测,HealthTell是做免疫组的,属于上游企业,加上碳云自己在深圳的实验室也是做生物样本测序和量化的。这些上游公司除在一般的医学诊断和检测诊断外提供消费级功能,虽然和市面已有企业比较类似,但归置在碳云体系中,会稍微做一些不同的事情,每次输出的不一定是诊断报告,而更像是一次在数字生命银行里的“交易记录”。
中游企业不断面向数字化了的生命,做人工智能闭环学习系统,不断自我优化,尝试为这个委托人模拟其个人的生命规律的机制系统,这也是数字生命银行的计算内核。
关于什么算是个人的生命规律,我举个例子。我容易患有慢性鼻炎。鼻炎时间长会形成鼻窦炎,鼻窦炎时间久了,再加上环境空气不好,经常讲课大量说话有可能诱发咽喉炎,我的规律是鼻炎发展到鼻窦炎再到鼻咽炎,这是我个人的规律,并不是每一位鼻炎患者的规律。我生活在北京,冬天如果感冒,在那个环境下感冒会诱发这一连串的反应,很多年后,我总结出只要我冬天患感冒,经常是感冒几天好了,后续的鼻咽炎症状爆发,久久持续数周。所以对我个人而言,在秋冬两季,不想患鼻咽炎,就得预防感冒。如果有感冒的症状,我就得提前去买鼻炎的药做准备,这就是很小的一个个人健康模型。如果我去医院看感冒,医生肯定也不会知道我的情况,不会给我开鼻炎药,只有我告诉他这个情况才可能,如果我身上有很多这样的小毛病,就需要一个健康小助手。就像我们通过去哪网定机票的时候,小助手能很聪明的知道你喜欢哪个航空公司的航班,在搜索时可以往前排,主动推送入住酒店等等,通过很多次的交易记录,慢慢形成你的习惯,就是消费级大数据分析。在整个生命健康产业里,需要真正解决消费者痛点的其实就一件事,去学习每个人的健康规律,在每个人的日常生活和疾病的预防期间、疾病的治疗期间,形成可以参照的模型,这个和平常我们所熟知的基因检测诊断型、预防型还有稍许区别。数据挖掘的事情、模型训练的事情,都是理解数字生命,是中游企业的内容。
最后,下游这部分,是消费者能感受到的,管理和干预数字生命。用每一个训练得到的模型,帮我做选择或给出建议,即“我有了前面的知识,我在日常生活或消费某一类健康应用的时候该注意什么”。举例来说,喜欢跑马拉松的人,在中国,特别是沿海地区,中产阶级以上的白领中越来越多,这是很好的体育锻炼。但马拉松和其他长跑运动不同,在很长的长跑训练中,会经历几个阶段,不仅仅是看有没有耐力跑下来。其中一点,是腿部肌肉力量够不够,跑步姿势正确与否,前脚掌在跑步时着地面积,通过这些信息,我们就能知道这种跑法费腿力与否,会不会累,这是运动方面的数字量化,另外我们能看心肺功能强不强,心脏有没有足够的供血氧能力,也是数字生命的量化。
这两件事合在一起,就是市面上可见的马拉松教练训练的项目,如跑步姿势的观察,跑步行为,心率和心氧能力的评估,最后得到一条基线,就是类似中游企业做的事情,通过数字的量化得到的结果来建立用户模型。
上述例子,提到了两件数字生命的观察,一个是度量了运动姿势(运动生理学方面),另一个是心率情况(看生物机电和体适能方面),至此我们还没有用到任何分子生物学方面的知识。这种模式已经在市面上存在,为大家提供个性化生命健康管理,也就是需要更安全地完成某种健康体验的目标。这是我们假定的基本商业模式。
那么分子生物学技术知识能做什么呢?如果运用得当地话,我们可以将上述模型制作地更精细。举个例子,跑手的后期训练 38~42公里时候,所有跑手不论肌肉情况、心脏负荷如何,都会把身体内的糖原全部耗完,所以最后几公里的训练主要是营养代谢切换的训练,训练如何让身体习惯于燃烧脂肪,这个内容并不是仅仅靠跑来完成的,还要靠中间的营养训练,补充多少营养,吃何种能量棒,训练期间的饮食如何调配,和每个人的营养吸收有关系。而这件事情,在传统马拉松建模中是看不到的。今天我们可以用其他技术,如肠道微生物去绘制每个人的肠型,去看看不同肠型的人,在不同营养补给的计划下,对末段跑步支持的情况如何。
当分子生物学的手段加入后,马拉松跑手的科学指导,延伸到了更多维度,建议和调节也可以做得更个性化。从大数据角度来看,所有消费级生物技术都有一个特征,它提供数据点的量比临床观察和其他非分子生物学观察的数据通量要大很多倍。之前提到的携氧量或心率都是连续输出的波形,一个周期数据点最多大概几百万到几千万量级。但如果给一个人做基因检测、代谢物质谱检测、肠道微生物检测,数据量和关联关系可以庞大到几十甚至几百亿级别了。同样的模式,当没有分子生物学支持的时候,人工智能能发挥的作用很小,原先的很多个性化健康领域,所谓的大数据挖掘,其实没有那么多数据可挖,数据也不整齐。
目前数字化生命,是众多生物技术用于一个消费者,能够在一个时间点上,抓到一个时间快照,又通过不断地时间快照,度量一个人训练前、中、后之间的情况再比较,这时机器学习设计者和大数据挖掘分析者有很多事情可以做,因为数据模型的可计算空间大了很多。我们试图把一个已知的结果(这个人用什么方式训练跑下来最优的结果)相关的特征放到一个矩阵里面来寻找规律,一旦分子生物学加入以后,矩阵变得大,大到变为原来的几百万倍,大数据计算方面有很多数据和方法可以用了,这就是现在的数字生命管理方面最大的不同。
所以碳云系外围的很多公司,看上去既做了分子生物学检测,又做了人工智能计算,又做了大数据分析,实际上我们只做了一件事,使用分子生物学技术提供的高通量数据指纹,用这个委托客户的数据,去帮他记录健康方面的不同状态,帮他/她做出来自己关于健康应用方面的模型。
数字生命联盟的实质就是不同价值链区段的公司,在合起来做一件事情,有点像交响乐,我们联盟做的是让不同的乐器都能演奏起来。这里面就包含了人工智能的技术,大数据挖掘的技术,也有大量分子生物学技术和健康产品服务。
数字健康管理
直接面向消费者的生命技术到底处在何种市场环境中?简单地分解下这个行业。以基因检测子行业来举例说明,基因测的是人与生俱来的蓝图,基因检测是看蓝图上有无Bug,如果有,可能是单基因引起的疾病,如先天性耳聋、地中海贫血等等,这个场景可以用于无创早筛。相比唐氏筛查,它更精确不需要羊穿,准确度很高,但缺点是应用范围很窄,因为这种疾病只有很少的一部分。另外还可以用于肿瘤相关的临床分析,特别是一些靶向药物是否适用的诊断,因为很多靶向药相关的基因功能和表达是有应用条件的,有的基因位点变异的人群,在这个生物通路上不会走得通,所以这个药物会没有用。与其让人挨个尝试药物,不如用基因筛查的办法去看已知的常规药中,哪些合适有效。上述两种情况代表了很大一部分应用,本质都是生物标记物去做诊断,“如果有这个标志物,就会…….”这用于临床级别的诊断,本质是基因技术用于医疗的模式。
还有一类是基因的检测与疾病预防。基因序列的位点非常多,蛋白质组上也有大量的已知和未知的形态空间,我们能有大量可行的特征指纹,组学越多,特征指纹空间越大,疾病也很多,基本是多对多的数据矩阵。卫生统计学方法是用大量人群充高数据的丰度,去寻找其中的规律,做的最多的是队列研究。全球最大的队列研究是波士顿大学做的佛莱明翰队列,对相关人群做了长达60年的记录,我们知道的预防医学很多知识都是由这个队列做出来的,比如经常吸烟的人得肺癌的几率会很大,肥胖的人群更容易得心梗,这都是队列得出的结论。所谓“风险预测”的本质上做的就是,“有那样基因位点规律和蛋白某区间折叠规律的人,更容易得什么病”。这种结论既有用,但又不能作为诊断,只是种人群规律,是某一个侧面刻画了如果有某种规律,就有多大可能性得某种疾病。
所以消费级领域有两大难以逾越地障碍,一来是不像临床检验使用的特征(比如尿酸水平高导致痛风的规律,尿酸高是很容易刻画的,但在分子生物学领域没有这么简单,要发现一个规律,需要长期检测,大量数据稳定地积累)。二来是价格的混杂,目前消费级检测领域价格差别大,第一取决于采用什么技术,造成成本的区别;第二是用什么通路去解释,数据挖到第几层,做多少聚类,也要花不少精力,都会让数据的可读性有差别。这些差别就造成市场上成本不一样,再加上包装形式,最终这种基因检测到消费终端价格就会高低悬殊。
如果基因检测等分子生物学检测只做单次或一次性刻画,实际上没有太高权重去做类似临床的判断,在健康管理和预防方面也没有太强的作用。原因是这次检测只代表这一天,这一个时间点,这一次取样的时候,这个人高纬度的数据特征值,没有叠加后天健康过程。健康管理是在一个周期中考察整个历程,管理、预测、干预这个过程,才称为健康管理。
举例说明,健康管理可能用到的场景和技术。十年前我在澳大利亚一间医疗集团,当时做了和Google Health 和微软 HealthVault类似的事情,个人健康档案PHR。其中用到的大部分数据来源是问卷,是患者自己的报告,有慢病管理、腰肌劳损的背痛管理、压力管理、戒烟管理、体重管理等等,数据切片是各种各样的一套健康问卷,里面非常详细地有各种量表,用户交月费后,会得到大量分析量表,每天都要提交问卷。健康管理就是找到疾病的原因,在日常生活中发现干扰因素。量表中也会有很多具体要求,比如去健身房运动,锻炼某个动作,之后再询问同样的问题,有无改善等,所以基本模式和今天所说的数字健康管理模式是接近的。用量表把一个人在干预前后发生的变化进行对比,如果对比足够多,就能画出这个人的视图,
人工智能角度来说,是有初始状态和末端状态,中间经过某种黑盒子训练的一种数字抽象。在足够长的时间内,用足够多的可以比较地、标准化地训练方式,实现状态A到B的变化,就得到A1到An的多个初态,B1到Bn的多个末态,这个模型训练出来后就得到用户关于具体干预方式能缓解何种疾病的规律。今天不同的地是,加入很多分子生物学检测技术,不用填那么多问卷,可利用数据大了很多,结果也更客观。
总结一下数字生命驱动的健康管理模式,总体来说是三件事。一是量化,把生命特征用分子生物学检测手段记录下来,再配合其他由智能设备捕捉表型和特征,作为此时此刻健康状态的数字画像。二是理解,不断地在干预过程中去记录干扰条件下前后发生的变化,训练和理解数字生命的规律,得到自己的数字生命模型,最后是用已知的市面上的某种干预手段为用户做匹配和筛选,找到最合适的干预方法和优化健康体验。
中美消费级生物技术应用差别
接下来谈下中美市场在消费级生物技术领域各自的情况,需要哪种技术配合、生意配合才能完成刚才提及的蓝图。美国的生物技术公司很多和中国不太一样。在分子诊断方向,美国的一线基因检测和生物技术公司和中国相比有一定技术领先差距,美国东岸围绕波士顿地区的原研性、硬核科技的企业,基本都是技术导向型的,比如下一代测序,癌症靶向物识别和临床使用、重大疾病如癌症的数据积累,比中国超越了一大段。从人才密度来讲,美国这部分在东海岸较强,基因检测领域美国领先的企业会较多。
在评估和预防方向,与中国的差异体现在非技术的一些方面。中国民众与国外的相比,在用数据管理健康的需求、理解和痛点上都不同,造成刚需不同。中国人群所接受的Managed Care(管理保健服务)并不多,传统的模式是围绕大的医疗中心展开,欠缺预防管理,DRG(疾病诊断相关组)、慢病健康管理等都是近十年,政府才花大精力去做的。美国相对整个人群,富贵病比我们早10~20年时间,这类疾病的专注度会更高,院外预防管理也会非常详细。所以美国市场和大众意识都更成熟,且是有保险机构支付的,中国在院外的管理和干预方面成熟度不及美国。
这就造成中美民众对分子生物学技术检测出具报告的需求度不同。美国的连续监测血糖仪、心率贴都比中国普及率高,中国民众对使用健康管理数据的需求没有美国强烈。造成我们在健康管理干预包里单纯植入生物技术检测的机会并不多,美国人民更愿意为除了临床以外的健康数据的产生和分析买单,中国人更愿意为结果买单。
我们投资的SomaLogic和HealthTell为例,除了在美国进入FDA诊断试剂使用以外,也可作为合法的商业检测中心。所以同样的技术,一边在申请FDA,一边可以直接向消费者发售。从整个联盟的生态来讲,这是很关键的要素,这类公司作为健康管理中的度量标尺,可以做身体前后状态的对比,而不仅仅是生物标记物检测,而且是大数据、高通量的标尺,也能用于筛查。
碳云还在生态里持续寻求这类公司,都有原研的特征,对某一类数字生命里中的一个要素,不局限于单组学或基因组数据,可以生成某类数据指纹,该指纹可以用于健康管理的前后度量的精准对比。这样的公司我们投资了蛋白组、免疫组,自己也做基因组、微生物组和其他组学内容。
还有一类容易被忽略的公司,也在做生命数字化。这类公司能探测跟踪用户在整个干预过程中发生的事件,干了什么事情,不单是生物指纹,并将事件数字化。没有这类技术,AI在后台是没法方便地学习用户的生活规律的,这其中会有其他的一些技术,也是碳云正在开发和合作的,通常能简化或更高效地收集用户正在干什么这件事。
举例来说,以色列公司正在研发的技术,称为智能镜子。镜子上有标尺,用户在镜子前摆3个姿势,摄像头经过数字校准后,可以迅速得出肩宽、臂围、腰臀比等30个指标,并全部记录下来。这个技术在消费级量化方面一点都不复杂,甚至也不见得会比替代技术(皮尺测量)更准,但这个场景如果是在健康管理干预的情形下,就会方便地多,使得使用频次变高,能快速地获取身体外形的表性特征,能对照身体发生的其他内源性变化,可以找到其中的规律。我们需要设施设备,不一定是放在家里,可以在干预中心或社区等等环境中,作用是快速的取得某种表型。我们还设计了智能马桶,就是将容易获取的样本,如尿液检测的频次提高,因为它不用寄样品,只用返回实时的数据即可。虽然它没有突破检测的内核,但是把消费级检测的使用程度变高了,这是DTC在产业上需要做的事情,也和生物技术相关。另外健康管理需要注意的是行业痛点,是否成本高昂、花费时间、寄送采样方便与否等,可能导致检测频度下降,健康管理不细致,模型不精准,用户体验更不好,最终阻碍健康管理的实施。
所以我们需要把一些技术,和生物样本采集、保存、初步样本分析有关的内容也封装到消费级基因检测的产品中。所以类似智能马桶的设备虽然采用的技术相同,但重点不是用于诊断的,真正场景是在健康管理的长期实施中进行连续性监测。最终它们发回干预中心的已经不再是生物样本了,在现场把数据归集化,只把数字结果返回来,不用样本了,这种技术就是可用的,也是我们重点关注的合作对象,它属于一部分上游、一部分中游性质。还有智能镜子、智能手环的核心算法等,都是我们在以色列的团队所引导的。全球顶尖的人工智能核心算法研发基本集中于美国西海岸和以色列地区。
数字生命联盟中这类智能设备标准,是能连续地把原始数据返回来。反观现在市面上大部分智能设备,都是试图直接在APP端马上出报告的,但重点不是把原始数据送回云端,这和数字生命联盟企业所做的不同,数字生命联盟企业的智能设备相当于传感器,不需要那么快地出报告,只需要把数据放到关于个人的数字健康模型中就可以了。这类的技术是我们正在开发和联合开发的内容。
下游合作企业
最后讲下游的干预和管理到底在做什么。对这类生物健康技术也有要求,提供的解决方案的种类是否足够多且是否能配置,即在供给端,能否配置投放给精准人群。如果是,才是我们要找的合作通路。这类干预在消费级市场也有很多了,比如海外的细胞免疫疗法做的抗衰老的治疗,要提取个人的免疫细胞,经强化后再回输处理等。还有其他如菌群培养相关,我们在美国有两家企业专注该领域,其中一家是AOB,作氨氧化菌,该菌种的作用是将汗液里的氨变为氮和氧化氮,简单说能做无氨化处理。AOB菌是完全无害的菌种,能在人皮肤表面由汗液养活。这个菌繁殖后,会重新调整表皮微生物环境,抑制有害菌,是一种典型的微生物制品,也是消费级产品,也有临床价值,所有临床级FDA会同时申请。现在一共有8个方向,有几个已经进入一期和二期。
这类的干预手段作用机理能生产出消费级产品,在消费级应用中发现更准确的规律,如果它有更高的安全性,或比药物疗效更好,就具有一定的药物价值,药物价值是需要做更多人群的规律以后,才得到的统计性确定结果,用结果去申报FDA,所以消费级技术在政策监管角度来讲,美国很多一线检测公司和生物学技术公司都在做长线积累,除了做消费级产品盈利以外,也需要在健康管理场景中,采用稳定的技术去非常详细地记录用户数据,这样才能获得诊断级和药用干预级别FDA的支持。最近23 and me所过的临床批准,主要是一部分筛选报告方面的批准,代表其参照模型的可参照性和可披露性已经达到一定水平,并非指NGS等技术本身的水平是否合理。这也恰恰是国内创新企业容易忽略的问题,技术是不错,但资本驱动的压力,都着急变现,但在走向市场的过程中,完整闭环过程的科学设计会缺失,缺失后造成销售量虽好,但很难说该产品有多少作用,造成FDA,CFDA申报过程中的障碍。
数字生命联盟试图做的是,最终想把高大上的技术真正变为在健康管理中能实际应用的产品,而真正意义上健康管理和疾病检测,预防和治疗是一脉相承的,没有那么严格的区分,一定是有某种共通的技术,在不同的证据级别上具有不同的批准条件。我们能看到欧洲、美国的一些企业已经做了很好的布局,碳云希望在中国也有这样的公司,最终能建立起联盟,使得上中下游公司在相互配合的时候,能打穿DTC领域,并是相对科学,有实际硬核内容的产品,所以我们并没有把自己定义为做生物技术的公司,也不是代理别人技术的公司,我们的核心竞争力是做个人数字健康管家,用技术实力来管理数字生命。
58人喜欢
2人收藏

Last modification:June 15th, 2018 at 02:45 pm
If you think my article is useful to you, please feel free to appreciate

Leave a Comment