谷歌乳腺癌检测AI比医生更好?技术进步还没那么快

2020-01-18 18:50:35 来源: 网易智能 网易号 举报
0
分享到:
T + -

图:谷歌的健康部门团队、DeepMind部门和伦敦帝国理工学院使用了三个不同的深度学习神经网络,从上到下分别是Facebook AI的“RetinaNet”与谷歌的“MobileNetV2”结合体,中间部分是ResNet-v2-50,最后底层的ResNet-v1-50。每个神经网络都以不同的方式挑选出乳房X光照片中看起来可疑的区域,然后对发现进行汇总,以得出关于癌症或非癌症的概率决定

谷歌旗下健康部门Google Health、AI部门DeepMind联手伦敦帝国理工学院的研究人员日前在《自然》(Nature)杂志上撰文,描述了三个深度学习网络如何在某些情况下通过阅读乳房X光照片诊断癌症方面胜过人类放射科医生。但相关细则显示,这项技术还没有达到完全取代放射科医生的水平。

如果你得到“相当正确”的评价,也就是说正确多于错误,结果可能并不太令人满意。但如果你是个人工智能(AI)算法,你会为此得到很多赞誉。毕竟,AI程序不一定要给出明确的答案,只需要给出概率答案,或正确答案的可能性(百分比),无论是执行自然语言翻译还是诊断癌症任务。

AI取得概率成就的最新例子出现在本周的《自然》杂志上,题为“乳腺癌筛查AI系统的国际评估”,由来自谷歌健康部门、DeepMind和伦敦帝国理工学院的31名学者撰写,作者包括斯科特·迈耶·麦金尼(Scott Mayer McKinney)、马尔辛·西尼克(Marcin T.Sieniek)、瓦伦·戈德布尔(Varun Godbole)和乔纳森·戈德温(Jonathan Godwin)以及DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)等。

头条新闻是,谷歌的科学在事后数年的乳房x光检查中战胜了英国和美国的放射学家,并宣布是否存在癌症的诊断,表明“假阳性和假阴性的误报大幅减少。”这种AI技术甚至击败了一个由6名人类放射科医生组成的团队,他们受托执行这项任务,查看了500张乳房X光照片,并给出了诊断结果。

结果对AI工具发展方面做出了重要贡献,这可能对医生也非常有用。但这并不意味着它可以取代人类医生的诊断。仔细观察数据很重要,因为里面暗藏着许多鲜为人知的东西。

我们首先看下研究背景:科学家们从英国三家不同的医院收集了2012年至2015年间接受乳腺癌筛查的女性数据,这些女性符合某些标准,如年龄和检查,总共有13918名女性数据。这就是研究人员用来训练神经网络系统的东西。一旦系统经过培训,另有2.6万名女性数据被用于测试该系统。研究人员还对一家美国医院收集的数据进行了同样的处理,即西北纪念医院从2001年到2018年收集的数据,只是样本数量要小得多。

科学家们训练了巧妙的三种不同神经网络,每个神经网络都以不同的细节水平观察乳房X光照片。深度学习的这种设置细节令人着迷,也许代表了结合机器学习网络的最先进水平。其中一种神经网络是ResNet V-150,到目前为止是一种经典的图像识别方法,由何凯明博士及其微软同事在2015年开发。

第二个神经网络是RetinaNet,由Facebook AI研究学者于2017年开发。第三个是谷歌科学家去年发布的MobileNet V2神经网络。这是一个非常棒的混合方法,展示了代码共享和开放的科学出版物如何丰富每个网络的工作。详细信息包含在《自然》杂志主要论文底部的补充材料论文中。

现在,棘手的部分来了:经过训练的网络所判断的病例中,是否有乳腺癌病例经随后的活组织检查证实为“基本事实”。换句话说,诊断不仅仅是图像上的东西是什么样子的,还包括随后的医学测试通过明确地提取一块癌变组织而得出的结论。在这种情况下,对于癌症的存在,答案是明确的是或不是。

但上面描述的三个深度学习神经网络的完美结合,并不能给出是或不是的明确答案。它只会产生一个从0到1的分数作为一个“连续值”,而不是二元式的“非此即彼”判断。换句话说,AI诊断可能是绝对精确的,也可能是完全错误的,这取决于在任何给定的情况下,它离正确的值有多近或多远,是0还是1。

为了将概率分数与人类在做出判断时所做的事情相匹配,麦金尼和他的同事们不得不将AI的概率分数转换为二进制值。他们是通过一套单独的验证测试来挑选单个答案来做到这一点的。将“优越性”与人类判断进行比较,是AI在其产生的更广泛总答案集中精选出相对准确答案的方式。

正如作者解释的那样:“AI系统天生就会产生一个连续的分数,代表癌症存在的可能性,因此,为了支持与人类医生的预测进行比较,我们对这个分数进行了阈值划分,以产生类似的二元筛查决定,在这种情况下,阈值意味着选择一个单一的点进行比较。对于每个临床基准,我们使用验证集来选择一个不同的操作点,这相当于一个将正面和负面决策分开的分数阈值。”

与英国的数据相比,AI在预测某种东西是否是癌症方面几乎和人类一样好。正如报告中所说,这个术语是“非劣质的”,意思是它并不比人类的判断力差。AI网络做得明显更好的领域是所谓的“特异性”,这是一个统计学术语,意思是神经网络在避免假阳性方面做得更好。也就是说,在不存在的情况下预测疾病。这当然很重要,因为被误诊为癌症对女性来说意味着太多的压力和焦虑。

不过,值得注意的是,在这种情况下,人类得分来自医生,他们必须判断是否需要根据乳房X光检查进行进一步的检查,如活检。可以想象,在诊断的早期阶段,医生可能会做出过于宽泛的评估,以便推动患者进行进一步的测试,以避免发生未发现癌症的风险。这是医生决定病人下一步去哪里和机器猜测几年后结果的可能性之间的根本区别。

换句话说,坐在患者面前的医生通常不会试图猜测未来几年的结果概率,而是试图确定患者下一步要采取的关键步骤是什么?例如,即使AI在特定情况下根据乳房X光检查确定癌症的可能性很低,患者仍会希望他们的医生犯了错误,并开出活检处方,以确保安全而不留下遗憾。他们很可能会欣赏这种谨慎。

科学家们在总结部分写道,尽管AI发现了医生漏掉的病例,但也有好几个医生诊断的患癌病例被AI忽略。这在额外的“读数研究”中尤其明显,在这项研究中,6名人类放射科医生观察了500例癌症筛查。研究人员发现了“所有六位放射科医生都漏掉的癌症样本,但被AI系统正确识别出来”,而“六位放射科医生都发现了的癌症样本,却被AI系统漏掉了。”

有些令人不安的是,作者写道,目前还不完全清楚AI在每一种情况下成功或失败的原因。他们称:“尽管我们无法在这些情况下确定明确的模式,但这种边缘情况的存在表明,AI系统和人类医生在得出准确结论方面可能起到互补作用。”

可以肯定的是,人们想知道更多关于这三个深度学习神经网络是如何进行概率猜测的。比如说,它们看到了什么?这个问题,即神经网络代表什么的问题,没有在研究中得到解决,但对于AI在如此敏感的应用中来说,这是一个至关重要的问题。

综上所述,我们面临的一个大问题是:对于一个能够比许多必须进行初步评估的医生更准确地预测未来癌症发展概率的系统,我们应该付出多大的努力去开发?如果这些概率分数能够帮助医生在某些“边缘案例”中做出决定,那么,帮助医生使用AI的价值将是非常高的,即使在这一点上AI并不能真正取代医生。

顺便说一句,这项研究同时考察了英国和美国的数据,得出了一些关于比较医疗体系质量的令人困惑的发现。总的来说,从对测试的初步审查来看,英国医生的准确率似乎明显高于美国,他们正确地得出结论,即某些东西将被证明是癌症。

考虑到使用的数据集存在差异,即英国有13981名女性数据来自三家医院,而美国只有一家医院提供3097人的数据,真的很难知道如何得出这些不同的结果。显然,与AI同样有趣的是,在这两个不同医疗系统中医生的相对能力同样存在差异。(选自:zdnet 作者:Tiernan Ray 编译:网易智能 参与:小小)

廖子瑶 本文来源:网易智能 责任编辑:廖子瑶_NBJS10040
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车

上海女博士嫁"凤凰男" 丈夫病逝后 1500万遗产只给年幼儿子40万

新闻 遗嘱 立遗嘱
|
杭州日报
11小时前
219604 跟贴219604

台民众“开战感受度”创新高 岛内民众担忧民进党当局“走偏锋”

新闻 民进党 蔡英文
|
环球时报-环球网
12小时前
2358 跟贴2358

3000元一桌的“宫廷菜”被喷上热搜 店家:没办法

新闻 美食 狗不理包子
|
红星新闻
5小时前
1401 跟贴1401

中区军用码头今移交香港驻军,林郑月娥:具有重要宪制意义,对驻

新闻 林郑月娥 军用码头
|
界面新闻
12小时前
7606 跟贴7606

叙利亚雇佣兵被曝插手亚阿战争 月薪6000元

新闻 叙利亚 阿亚
|
界面新闻
7小时前
8226 跟贴8226

香港中联办发言人:国安法下绝不容许乱港者肆意妄为,确保香港市

新闻 国安法 香港
|
界面新闻
8小时前
2759 跟贴2759

老人假期出行不会用手机查健康码怎么办?官方回应

新闻 出行 交通运输
| 新京报
5小时前
0 跟贴0

孟晚舟再次出庭,华为:相信孟女士清白,相信加拿大司法系统能够

新闻 孟晚舟 加拿大
|
环球时报-环球网
14小时前
1014 跟贴1014

联播+丨习近平双节前主持的重磅会议 作出一个重大决定

新闻 习近平 联播+
|
央视网
5小时前
214 跟贴214

美空军"死神"无人机部队臂章暴露出对中国"野心"

新闻 mq-9无人机 无人机
|
环球时报-环球网
11小时前
43 跟贴43

"被父亲推下海骗保儿子"遗体找到 父亲:能拿保险吗?

新闻 骗保 犯罪
|
红星新闻
3小时前
5579 跟贴5579

习近平:建设中国特色中国风格中国气派的考古学

新闻 习近平 中国风格
|
新华网
7小时前
1187 跟贴1187

伊朗公布新款海军导弹 射程超过700公里

新闻 导弹 弹道导弹
|
环球网
6小时前
0 跟贴0

王毅没提一句美国 但传递的信号非常明显了

新闻 王毅 潘基文
|
观察者网
2小时前
0 跟贴0

伊万卡陷入危机 媒体曝出她与特朗普存在可疑交易

新闻 伊万卡 唐纳德·特朗普
|
上观新闻
14小时前
1215 跟贴1215

战事升级!土耳其派4000士兵支援阿塞拜疆 亚美尼亚限制男性出境

新闻 阿塞拜疆 土耳其
| 海外网
13小时前
25900 跟贴25900

印方在中印边界地区修建公路 外交部回应

新闻 外交部 中印
| 新京报
5小时前
4 跟贴4

《战狼2》原型,54岁的她,才是国民顶级偶像

新闻 埃博拉 病毒
| 网易槽值
7小时前
6 跟贴6

土耳其派出战机,亚美尼亚就要用伊斯坎德尔导弹?

新闻 伊斯坎德尔 亚美尼亚
|
环球网
12小时前
0 跟贴0

首都网警九岁啦! 感谢一路相伴!愿你我乘风破浪,未来可期!

新闻 网警 乘风破浪
|
首都网警
2小时前
0 跟贴0

拜登也有份!继特朗普后 拜登也获诺贝尔和平奖提名

新闻 拜登 诺贝尔和平奖
|
环球网
7小时前
1139 跟贴1139

韩海警认定被朝射杀公务员“弃韩投朝”

新闻 自杀 公务员
|
澎湃新闻
5小时前
0 跟贴0

美军无人机部队臂章惊现中国地图,什么意思?

新闻 无人机 美军
|
观察者网
6小时前
0 跟贴0

日本自卫队一黑鹰直升机发生故障 迫降高中校园

新闻 直升机 黑鹰
| 海外网
6小时前
0 跟贴0

轻松一刻:亚洲小姐十强诞生,颜值不好说身材真的辣

新闻 亚洲小姐 美女
| 轻松一刻
1天前
5976 跟贴5976

亚美尼亚和阿塞拜疆双方战损实录汇总(上)

新闻 阿塞拜疆 亚美尼亚
|
网易军事
1天前
0 跟贴0

"被父亲推下海骗保儿子"遗体找到 父亲:能拿保险吗?

新闻 骗保 犯罪
|
红星新闻
3小时前
5579 跟贴5579

河北马戏之王:江湖不易,我险些被脱衣舞厅干倒闭

新闻 马戏团 马戏
| 看客
1天前
0 跟贴0

重磅微视频|开放合作 众行致远

新闻 何平 众行
|
新华社
5小时前
2 跟贴2

被网文套路的4亿中国人,到底在看啥

新闻 社会 网文
| 网易数读
2天前
615 跟贴615

被曝曾想选女儿伊万卡当副总统 特朗普开怼:有病!

新闻 唐纳德·特朗普 伊万卡
|
环球网
8小时前
0 跟贴0

多少导演,在她的风情面前翻车

新闻 张爱玲 王佳芝
| 网易谈心社
4小时前
0 跟贴0

搜狗签订最终私有化协议

新闻 私有化 搜狗
|
界面新闻
2小时前
2016 跟贴2016

天津一公司负责人确诊!从广州入境!

新闻 广州 海关
|
每日新报
1天前
195 跟贴195

效仿“苹果税”谷歌也要强制征收30%抽成

新闻 谷歌 苹果
|
观察者网
10小时前
3095 跟贴3095

体能测试引发滑稽一幕:跳马决赛现最低难度动作

新闻 跳马 体测
|
观察者网
2小时前
0 跟贴0

习近平在中央政治局第二十三次集体学习时强调 建设中国特色中国

新闻 习近平 考古学
|
央视网
1小时前
24 跟贴24

百度史有才、李忠军被警方带走 或涉赌博网站推广

新闻 史有才 李忠军
|
澎湃新闻
12小时前
7725 跟贴7725

亚阿两国爆发新一轮交火:动用火箭弹大炮等重武器

新闻 亚美尼亚 阿塞拜疆
|
澎湃新闻
21小时前
4 跟贴4

北京石凤刚黑社会性质犯罪团伙覆灭记

新闻 石凤刚 村主任
|
法治进行时
1天前
3338 跟贴3338
+ 加载更多新闻
×

【TED】怎样学外语才最有效果?

热点新闻

态度原创

网易号

查看全部
阅读下一篇

返回网易首页 返回科技首页