网易首页 > 网易科技 > 网易科技 > 正文

中国医疗数据创业有4大方向 可走出独有特色

0
分享至

(原标题:中国医疗数据创业的4大方向)

(本文来自微信公众号“峰瑞资本”(微信号:freesvc),本文作者谭验、王蕾)

医疗行业是数据密集型产业,数据积累亘古存在。然而,在数据的应用水平上,医疗行业远远落后于互联网、金融和电信等信息化程度更好的行业。

峰瑞资本生物医疗技术团队从数据产生、数据处理、数据消费的角度分析了医疗数据产业链。分析显示,医院、诊所等专业医疗机构和保险机构仍然是医疗数据产生的最重要来源,来自手机App和可穿戴设备的数据开始提升数据的完整性、连续性和准确性;数据处理是个系统工程,包括清洗、整理、分析等标准环节,对数据结 构化提出了更高要求;截至目前,为医疗数据买单的是B端的医疗机构、药企和保险公司,让C端的病人和医生为数据付费目前还不现实。

美国的医疗体制相对市场化,对医疗体系的投入巨大,使其在技术、服务和流程等支柱产业,都可以成为中国医疗产业发展的远景参照物。近几年,医疗数据产业在美国发展 迅速。峰瑞资本生物医疗技术团队挑选了4家有代表性的美国医疗大数据公司(Flatiron、IBM Watson Oncology、IMS Health Oncology、Palantir)做案例分析。

大数据产业的出现和医疗数据投资策略分析

▲ 医疗大数据的发展带来多重健康福利。

IBM用3V定义大数据

IBM最早提出了大数据的3V定义。3V是Volume,Variety,Velocity。

Volume比较好理解,因为大数据本身的 “大” 代表了数据数量的巨大。数据量越来越大的原因很多,其中一个是现在机器和网络每天都在生成大量的数据。据统计,我们现在每两天产生的数据量约等于自人类文明开始到2013年的数据量的总和。

第二个特征是Variety,多样化。多样化主要指不同的数据来源和种类。传统意义上的数据主要来自类似excel的表格和数据库。现在人类能够分析各种形式和类型的数据,比如电子邮件、图片、视频、音频、监控仪器,等等。

第三个特征是Velocity,即数据生成的速度。比如,互联网上数据的生成是以秒甚至毫秒来计算的。再比如,基因测序仪、网络监控的录像,都在随时随地产生大量数据。

以上3个V是公认的大数据定义。在2013年波士顿的大数据峰会上,Express Scripts的首席数据科学家Inderpal Bhandar提出了Veracity的概念。Veracity主要是指数据是否有偏差、数据噪声有多大,以及是否有异常值。当业界大量积累各种来源的数据时,数据是否准确变成一个非常重大的问题,否则最后就是 “Garbage in,Garbage out”。

峰瑞观点(freesvc):

从以上对大数据的描述可以发现,大数据对数据存储、数据传输和数据处理这3方面的能力提出了挑战。

企业在数据产生和处理端也逐渐出现了一些变化。企业开始存储海量数据,数据传输并分布式地存储到数据中心,数据在云端进行处理和分析,通过网络端进行数据的呈现并指导商业决策。

大数据的产业链分析

得益于计算能力的快速增长、数据传输能力的增长和成本的下降,以及数据储存成本的下降,大数据获得了极大的发展。

● 上游数据的产生

大数据产业的最上游是数据的产生,这包括了数据的定义和数据的搜集。数据的定义顾名思义就是定义哪些是数据。例如在搜索广告出现之前,用户点击链接本身并不产生任何价值,也就不被定义为数据。数据定义产生之后,就开始快速、准确、有效地收集数据。

● 中游数据的处理

大数据产业的中游是数据处理,其中包括了数据的准备,例如数据清洗和整合,以及数据分析,例如数据建模、可视化呈现,等等。

● 下游数据的消费

大数据产业的最下游是数据消费,例如利用数据指导商业决策,指导商业决策之后产生的结果本身又成为了新的数据,因此数据的消费和数据的产生形成了一个闭环。

在整个大数据产业的所有环节中都存在数据存储和数据管理,这两个技术贯穿了整个大数据的周期。

数据驱动型企业结构的分析

在一个通过数据驱动的商业环境中,企业组织或者技术组织结构一般分为以下3个逻辑板块。从底层到上层分别是Data engineering(数据工程),Data sciences(数据科学)和Decision sciences(决策科学)。

● 下层数据平台:通用性平台为主,完整解决方案,开源解决方案

最底层是工程性的工作,主要指对于数据底层的工程性技术解决方案,例如对原始数据进行清洗、验证和纠正,数据储存和调取。在这一层有很多的开源解决方案和系统集成服务商。

这一步的目的是收集和整理大量数据,把它变成便于数据科学家使用的方式。大部分企业或者工程师把80% 的时间花在了这一步 。美国财富杂志前几天公布的数据显示,美国企业每年在大数据服务上的花费是40亿美金左右,其中40% 花在了数据整合和清洗上。可以说,整个数据工程在时间和花费上都占据了很重要的位置。

● 中层算法和数据呈现:通用性算法接口,行业专业知识,开源解决方案

处于中间层的是数据科学,这可能是大家最常听到的一个领域。现在很热的人工智能、深度学习,都属于这一层。这一层的作用是通过数据建立起对某个问题的模型。比如说,通过历史数据建立起天气预报模型,或者通过大量病理数据建立起疾病的预测或者诊断模型。

开源社区的发展让很多非常复杂的算法模型变得非常容易使用,极大地促进了数据科学的发展。数据科学家可以很快地验证预测模型,并使用到实际的商业项目中。目前的解决方案主要是开源方案,一些商业API以及企业内部的私有数据计算框架等等。

● 上层商业决策:深入的行业专业知识,商业洞察,内部决策和外部咨询

第三层是决策科学,它是数据的最顶层,也是实际产生商业价值的。比如我们预测明天要下雨,这个预测的价值在于,得到这个信息的商家第二天可以把伞放到更明显的地方,以增加购买量。这样就产生了商业价值。

这只是一个简单的例子,实际情况要复杂很多。比如,很多游戏中,机器可以根据玩家玩游戏的时间、模式,来预测用户是否对游戏感兴趣,一旦发现玩家对游戏的兴趣正在减弱,就会自动进行一些奖励措施,比如奖励装备、奖励点数来留住玩家,都是商业决策的范畴。

▲ 大数据的产生和利用,天生就和商业决策联系紧密。

大数据企业的商业模式:在咨询和软件服务中徘徊

大数据的价值往往通过商业价值来体现,而不同公司的商业逻辑往往有很大的区别。因此,大数据公司往往在咨询模式和软件模式之间徘徊。

这两种商业模式不难理解,咨询有很强的可定制性,能够准确有效地解决公司的商业需求,但是需要大量和长期的人力支持,花费高,不容易规模化。软件服务则具有边际成本低、人力支持少、容易规模化的特点,但是它缺乏可定制性。很多时候企业并不能直接解决问题,所以面临难以销售的问题。

企业数据化的演化历程:传统信息化,在线化,云化,数据化

企业数据化的演化历程:传统信息化,在线化,云化,数据化。

各个行业的数据化发展程度,因其行业特点而不同。相较于传统零售、农业和制造业,医疗行业在数据积累上有领先优势,但是在数据的应用水平上,医疗行业远远落后于互联网、金融和电信等信息化程度更好的行业。

峰瑞观点(freesvc):

通过分析各个行业数据化的程度看到:

互联网化程度越高的企业数据化水平越高

数据变现越容易的企业数据化程度越高

个性化需求越高的企业数据化程度越明显

数据储备量越大的企业数据化趋势越快

行业的数据化:

受到商业变现能力和模式的驱动

依赖于底层基础设施的发展

依赖于行业数据的积累

医疗数据产业链

接下来我们从数据产生、数据处理、数据消费的角度来分析医疗数据产业链。

目前,医疗数据的产生最大的来源是医院、诊所等专业医疗机构以及保险机构。这些数据包含了病理、临床、诊疗和理赔数据。随着移动医疗和智能硬件行业的发展,越来越多的数据开始来自手机App记录以及可穿戴设备,这些数据主要包含了人体的生命体征和行为数据,等等。这些数据有助于提升数据的完整性、连续性和准确性,并开始得到重视。

医疗数据的处理不仅包含清洗、整理和分析等标准环节,它还有其特殊性。例如,临床数据往往来自于电子病历等以自然语言描述的文本文件,且不同医疗机构或者医生对临床症状的描述往往存在一些细微差别,这对数据结构化提出了较高的需求。

医疗数据的消费端比较明确,在C端主要是病人和医生,B端包括了医疗机构、药企和保险公司等。从目前的情况来看,通过C端来收费和变现比较困难,主要的商业模式还是围绕着B端开发。

美国Top医疗大数据公司产品分析

近几年,医疗数据产业在美国发展迅速。这归功于电子病历在过去10年的逐步普及,以及包括医院、药厂和保险等机构对数据分析价值的高度认可。 除了传统的数据巨头IMS Health,一些新型数据公司和数据分析公司纷纷涌现。我们挑出4家有代表性的公司(Flatiron、IBM Watson Oncology、IMS Health Oncology、Palantir)来分析。

它们分别代表了当前医疗数据领域发展的大方向:基于肿瘤临床数据的事实;肿瘤人工智能辅助决策;肿瘤全景数据;医疗公众资源数据。

我们把重点放到肿瘤数据上。这个领域的诊疗过程复杂、不确定性高、治愈率低,市场价值巨大,因而,数据在这个领域的作用和价值也得以突显和被重视。 其它疾病领域数据的方法论其实非常相似。 举例:

Flatiron

创立于2012年的Flatiron是一家基于肿瘤病患的医疗数据分析公司。它接连获得顶级投资机构和药厂的融资,抗癌药巨头Roche/Genetech的参与充分说明机构方认可癌症临床数据对药品研发和市场指导的作用。 Flatiron平台由行业领先的肿瘤学家、医生和工程师共同打造,在这个平台上医生可以记录、整理、追踪和分析自己病人的情况。

▲ FLATIRON的网站首页上写着:肿瘤治疗技术的新标准。

基于平台上收集到的信息, Flatiron打造了几款主要产品。

FLATIRON- ONCOEMR是一个癌症病人电子病历,它的主要使用方是医院和医生,药厂也会购买它后台的数据,然后自己做数据分析,或者通过第三方协议的形式由IMS Health帮助与其他数据进行整合。其它医疗数据分析和人工智能公司也是FLATIRON- ONCOEMR后台数据的使用者。

FLATIRON-ONCOANALYTICS主要基于数据做整理,并形成高质量的分析和总结。比如,某种类型的病人的增长、正在治疗的病人的增长、存活率的跟进,这类产品能对医院与医生管理诊疗工作和病人提供商业和运营上的见解,受到医疗机构的欢迎。

FLATIRON-ONCOBILLING在医保、商保发达的美国用途广泛。在医院和医生端,FLATIRON-ONCOBILLING清晰地了解治疗的付费情况、病人的保险组合,对各项治疗、各类病人的成本和收入,采用更合理有效的治疗流程和手段,以更好的控费;保险公司对这类产品的关注度更是毋庸置疑,大量数据能为控费和更好的理赔设计提供支持。

和Flatiron一样,也有一些平台基于电子病历的数据积累,建立起过往没有的诊疗过程的数据挖掘。尽管它们是基于样本医院的病历, 但是已经足够大到提供统计学上有意义的 “怎样做” 和 “为什么” 的见解。

IBM Watson Oncology

最大的私家癌症中心MSKCC与IBM合作,将临床专业知识、分子和染色体数据、以及大量癌症案例数据整合到一项循证解决方案中, 分析大量数据并从中提取重要信息,以制定出关键决策。

肿瘤学专家培训Watson,将患者的医学信息与大量的治疗方针、已发表的研究结果和其他洞察力信息相对比,为医师提供个性化的、基于置信度的建议。Watson的自然语言处理能力允许系统利用非结构化数据,例如杂志文章、医师的笔记、以及来自National Comprehensive Cancer Network (NCCN) 的指导方针和最佳实践信息。

IMS Health Oncology Analyzer

凭借庞大的用药和医生数据基础,结合丰富的医药咨询经验,医疗数据界的巨头IMS Health多年来一直在打造医药医疗全景数据图。没有任何一个数据源头能提供足够全面的信息,IMS除了拥有巨大的数据量,在数据拼接和整合上也有丰富的经验,随着电子病历数据的引入和增长,IMS致力于把药厂销量、销售到医疗机构的量、医疗机构用药治疗情况以及病人保险付费情况全部串联到一起。

并购了Quintile以后,IMS还能整合临床实验的数据。其咨询业务基于IMS自身汇拢的数据产生的见解,能够对数据业务带来良好正反馈。合并后近200亿美金的估值体现了市场对医疗数据价值的认可。

IMS在世界范围内不断复制其美国模式,逐步形成自己的垄断地位。

Palantir的模式在中国比较难于复制, 先不赘述。

峰瑞观点(freesvc):

了解了以上几家美国著名医疗数据公司后, 我们回顾下之前的报告(我们曾经对比过中美医疗数据市场阶段的差距),并结合中国现有医疗数据项目的重点, 我们总结出中国医疗数据创业项目的4大方向:

基于肿瘤临床数据的事实。大量创业项目从这个方向切入;

肿瘤人工智能辅助决策。现在相对较难,因为是建立在1的基础上;

肿瘤全景数据。和1类似,创业项目能获取到的其他数据比较少;

医疗公众资源数据。中国的数据基础弱,这个方向可能需要国家和上层推动。

相关推荐
热点推荐
伊朗和以色列的冲突,让全世界看到了真正的“纸老虎”长啥样!

伊朗和以色列的冲突,让全世界看到了真正的“纸老虎”长啥样!

翻开历史和现实
2024-04-23 13:27:27
名记曝恩比德遭遇面瘫选择保密治疗 医学专家担忧问题会愈发严重

名记曝恩比德遭遇面瘫选择保密治疗 医学专家担忧问题会愈发严重

厝边人侃体育
2024-04-26 11:04:35
连续2天逆跌,票房会破10亿?古天乐又要给港片杀出一条路来

连续2天逆跌,票房会破10亿?古天乐又要给港片杀出一条路来

靠谱电影君
2024-04-25 23:09:12
“给我的时间太短了!”前京东副总裁、渐冻人蔡磊病情加重

“给我的时间太短了!”前京东副总裁、渐冻人蔡磊病情加重

齐鲁壹点
2024-04-24 07:54:43
18年南京女孩患癌,医生说活不过6个月,她卖房求生:只为多活1天

18年南京女孩患癌,医生说活不过6个月,她卖房求生:只为多活1天

小金鱼的眼泪
2024-04-25 09:28:39
湖南醴陵市一烟花鞭炮厂车间发生爆炸事故,致3死2伤

湖南醴陵市一烟花鞭炮厂车间发生爆炸事故,致3死2伤

界面新闻
2024-04-26 14:03:33
攻守兼备!刘铮11中5拿到16分5板5断1帽 三分7中4

攻守兼备!刘铮11中5拿到16分5板5断1帽 三分7中4

直播吧
2024-04-26 22:06:21
4-2!日本踢疯了!杀进U23亚洲杯半决赛,国奥小组赛本可以赢他们

4-2!日本踢疯了!杀进U23亚洲杯半决赛,国奥小组赛本可以赢他们

体育世界
2024-04-26 01:05:33
周鸿祎吐槽800多万劳斯莱斯库里南:车牌值750万,40万国产车随便秒杀它!贵得伤天害理

周鸿祎吐槽800多万劳斯莱斯库里南:车牌值750万,40万国产车随便秒杀它!贵得伤天害理

和讯网
2024-04-24 10:28:45
独家视频丨美国国务卿布林肯抵达人民大会堂

独家视频丨美国国务卿布林肯抵达人民大会堂

国际在线
2024-04-26 16:39:28
孙颖莎又破防了!没有澳门夺冠真不知何时能浮出水面!林依轮佩服

孙颖莎又破防了!没有澳门夺冠真不知何时能浮出水面!林依轮佩服

娱乐圈酸柠檬
2024-04-26 16:48:59
刚刚汪妈曝光大小S吸毒,小S偷偷上线,大S妈妈留言求饶

刚刚汪妈曝光大小S吸毒,小S偷偷上线,大S妈妈留言求饶

娱乐八卦木木子
2024-04-26 17:55:19
膝盖疼?中医科学院教授:4个小方法让膝盖多用10年!(动态图指导)

膝盖疼?中医科学院教授:4个小方法让膝盖多用10年!(动态图指导)

今日养生之道
2024-04-24 05:05:33
男人老了,包包尽量不要背“双肩包”和“购物袋”,这些更时髦

男人老了,包包尽量不要背“双肩包”和“购物袋”,这些更时髦

潮人志Fashion
2024-04-25 08:31:13
“汽车零部件”第一龙头,手握720亿订单,有望从9元涨到86元

“汽车零部件”第一龙头,手握720亿订单,有望从9元涨到86元

芳市聊股
2024-04-24 20:45:03
祸害人三年的新冠消失了,四大奇怪现象却出现了,很多人没察觉

祸害人三年的新冠消失了,四大奇怪现象却出现了,很多人没察觉

李昕言温度空间
2024-04-19 21:12:55
突发!郭艾伦宣布最新决定,复出悬念揭晓

突发!郭艾伦宣布最新决定,复出悬念揭晓

徽派体育
2024-04-26 00:25:21
特朗普将校园示威与白人至上主义者暴力事件相提并论

特朗普将校园示威与白人至上主义者暴力事件相提并论

小小包工头阿汾
2024-04-26 21:51:37
陈昊宇在《如懿传》里是最好看的时候,现在瘦的两腮都凹进去了。

陈昊宇在《如懿传》里是最好看的时候,现在瘦的两腮都凹进去了。

娱乐八卦木木子
2024-04-25 16:03:09
《哈尔滨1944》直到宋卓武牺牲,宋卓文才明白,关雪为何不杀自己

《哈尔滨1944》直到宋卓武牺牲,宋卓文才明白,关雪为何不杀自己

娱乐倾城巷
2024-04-26 13:10:25
2024-04-26 23:10:44

科技要闻

车展观察|德系日系绝不能放弃中国市场

头条要闻

命案嫌疑人获不起诉 5年后新证据出现一审被判无期

头条要闻

命案嫌疑人获不起诉 5年后新证据出现一审被判无期

体育要闻

库里当选最佳关键球员 10项数据联盟第一

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

贾跃亭,真他娘是个人才

汽车要闻

2024北京车展 比亚迪的自驱力让对手紧追猛赶

态度原创

房产
教育
旅游
亲子
时尚

房产要闻

梅开三度!越秀底价拿下世界大观地块

教育要闻

特长生报名首日,多校重要提醒!

旅游要闻

白俄,中国人的快乐福地?

亲子要闻

儿童哮喘症状的五大特点微博健康说#健闻登顶计划# 儿科医生黄剑峰

不建议50+女人戴的帽子!自以为洋气,实际大妈味十足,油腻老气

无障碍浏览 进入关怀版
×