人类丰满的AI梦,正在撞上冰冷的现实。
1 月 19 日,据《华尔街日报》援引知情人士报道,IBM 正在考虑出售 Watson Health 业务,可能的方案包括出售给私募股权公司、医疗行业企业或者与一家特殊目的收购公司(SPAC)合并。
Watson Health 部门主要负责将 AI 用于帮助医院、保险公司和制药企业处理数据。《华尔街日报》援引知情人士报道,该部门年收入大约为 10 亿美元,但目前仍未盈利。
IBM 在 2020 年 4 月迎来了新任 CEO 阿尔温德·克里希纳(Arvind Krishna)。上任后,克里希纳着手简化公司业务线,让云计算在市场中变得更加有竞争力。如若 Watson Health 真的被出售,对 IBM 的 AI 业务来说,无疑是一次不小的挫折。
曾想替人类解决肿瘤治疗
长久以来,Watson 都是 IBM AI 业务的一块招牌,也是人类最初充满野心的AI梦的代表。
2011 年,深度学习方法刚刚被重新定义,仍未掀起新一轮 AI 浪潮。但此时 IBM 的 Watson 就在美国最受欢迎的智力竞猜节目《危险边缘》中,击败了该节目历史上最成功的两位人类选手。
Watson 在比赛中展现了强大的自然语音理解能力。要赢得比赛,它必须解析大量文字找到线索,然后搜索大量文本数据库,以检索可能的答案。在击败两位人类冠军后的第二天,IBM 宣布了 Watson 的新职业目标:一名 AI 医生。
从逻辑上看,Watson 在竞猜节目上展现的能力,似乎可以移植到医学领域——都是先理解自然语言(患者的电子病历),然后检索文本数据库(治疗方案和最新医学文献),最终给出答案。这个方案的价值在于,每天有将近 8000 篇医疗文章发布,医生一篇篇读是不可能的,AI 能帮助医生阅读最新医学成果。
2013 年,IBM 更是将研究重心聚焦于肿瘤治疗这一最大的、人类尚无法攻克的医学挑战上。2015 年,IBM 成立了专门的部门—— Watson Health,可见其当时的决心。IBM 前 CEO 罗睿兰(Virginia Rometty)曾把 Watson Health 称之为公司的“登月计划”。
众所周知,AI 的基础是大量训练数据。为了获得这些数据,IBM 花费约 40 亿美元收购了 4 家医疗领域数据驱动型公司,分别是 Phytel、Explorys、Merge Healthcare 和 Truven Health Analytics。2016 年,成立仅两年的 Watson Health,员工规模已经达到一万多人。
在重点发力的肿瘤治疗领域, Watson Health 吸引了许多著名合作机构,包括安德森癌症中心、纪念斯隆-凯特琳癌症中心、梅奥医院、奎斯特诊断公司。2016 年 8 月,Watson Health 还进军中国,推出“健康中国”生态圈共赢计划。
声势壮大的宣传、数额庞大的并购、权威机构的合作,IBM 通过一系列举措让外界对 Watson Health 的预期提得非常高。毕竟,用最前沿的 AI 技术来解决最困难的医疗问题,这件事情听上去就非常性感。
不过,后来的发展事与愿违。安德森肿瘤中心曾与 IBM 合作,为肿瘤学家创建咨询工具。该工具利用自然语言处理技术来汇总患者的电子健康记录,然后匹配数据库提供治疗建议。安德森癌症中心在这个项目上投入了 6200 万美元,但最终结局却是双方在 2017 年 2 月终止了合作关系。
业界开始对 Watson Health 产生怀疑,它自己的问题也接踵而至。2018 年 5 月,美国媒体 The Register 报道,Watson Health 部门要解雇大约 50%-70% 员工,引发了巨大震动。不过后来科技媒体 IEEE Spectrum 的报道指出,被裁员工主要来自收购的三家公司 Phytel、Explorys 和 Truven。大量收购使得公司面临人员臃肿问题,为裁员埋下了伏笔。
但这些都是表面现象,归根到底,对 Watson Health 来说致命的问题在于,它的诊断结果不准确。
2018 年 8 月《华尔街日报》报道,没有任何已发表的研究表明,Watson 提升了患者的治愈率。有十几位使用过该系统的机构和医生反馈,其癌症应用收效甚微,某些情况下还会出错。并且,由于缺乏罕见病例数据,Watson 的更新速度跟不上癌症治疗的发展速度。
丹麦一个医院在一份研究中指出,Watson 给出的诊断方案,与专家给出的仅有 30% 重合度,因此拒绝采购 Watson 系统。德国媒体也曾报道,德国两家机构在实际应用中发现,Watson 对于那些症状特殊的病人会开出致命药物。2018 年 10 月,IBM Watson Health 当时的 CEO Deborah DiSanzo 宣布离岗。
一切都不可逆转地指向最终结局,如今终于传出 IBM 寻求出售 Watson Health 的消息,失去业界的信心,再丢掉雄厚资金的支持,这个人类最早的AI明星的前景,不再明朗。
AI 梦该醒了?
当前 AI 应用于医疗最普遍的场景是识别医疗影像,比如视网膜眼底影像。而 Watson 所挑战的是诊断问题,并且还是医学上难度最大的肿瘤治疗领域。在该问题上,Watson Health 面临着数据和 AI 智能的双重挑战。
在数据获取层面,大部分医疗数据是非结构化信息,比如医生撰写的病历和出院总结。虽然 AI 的自然语言理解能力进步飞快,但相比人类依然差很多。图灵奖得主约书亚·本希奥(Yoshua Bengio)曾表示,在医学文本文档中,AI 无法理解歧义,也无法找到人类医生会注意到的细微线索。
另一方面,有些罕见病例的数据往往难以获取。《中国工业和信息化》杂志 2020 年的一篇文章指出,在解析Watson的数据中发现,在罕见病例研究中,本来应该喂给 Watson 大量的真实数据从而找到新的治疗手段,由于罕见病例数据的极端匮乏,实际上 Watson 被灌了一堆没什么用的假想数据,而并不是真正的病人数据。这种通过假想数据学出来的 AI,准确性可想而知。这就出现了罕见病例中 Watson 的误诊情况。
全球领先的医学资讯平台 Medscape 在 2018 年一篇报道指出,Watson 在学习根源上有问题 —— 它并没有使用足够的真实病例进行学习,而负责训练它的人群,仅仅是纪念斯隆-凯特琳癌症中心的肿瘤学家和 IBM 自己的工程师。Watson 大量训练时间用于掌握上述肿瘤学家设计出的理想化病例和治疗方案。它用于训练的真实病例数量很小,最多的肺癌也仅有 635 例,最少的卵巢癌更是仅有 106 例。
IBM 在数据获取上曾做过努力,花费 40 亿美元收购了 4 家公司,但在数据融合上,IBM 低估了复杂度。上述《中国工业和信息化》杂志文章指出,IBM 前员工和前客户的医院管理人员说,虽然收购了大量数据,但在融合各种各样的数据时发现需要花费难以想象的人力物力,还没开始训练,就让人筋疲力尽。在巨大的经济压力和暗淡的前景面前,各个合作伙伴只能选择终止合作,留下一个烂尾楼。
AI 目前的智能程度,更是难以匹配肿瘤治疗的复杂性。AI 的本质是统计学,它所得出的结论局限于人类训练员提供的数据,而无法像一个专业医生一样,独立生成新的见解。
也就是说,Watson 只能比人类专家更快地给出相同的诊断结果,而无法治疗人类医生治不了的病。
在巨大的风险面前,医生只会将 Watson 的诊断结果作为参考,依然会进行大量临床研究。在 IBM 的宣传中,Watson 能够凭借着强大的计算能力发现人类看不到的模式。但事实证明,AI 的智能远未到这个程度。Watson 对医生的意义,也就大打折扣。
Watson Health 的挫折反映出 AI 应用在诊断上困难重重,但这并不意味着 AI 在医疗领域没有前景。在图像分析、基因分析和制药领域,都有不少公司在探索 AI 的应用场景。即使是在诊断领域,IBM 的 Watson 没做好,也不意味着其他人做不好。至少,后来者可以在 Watson 上学到一些经验。一名中国AI医疗企业的创始人就对品玩说,无论AI领域创业者,公司还是投资人,都在变得务实,按今天AI与医疗的现状,与其一上来就瞄准高精尖问题,倒不如先用自己的技术解决一下医院院长的痛点。这样自己的公司也能活下去,AI也真的能体现点价值。