医疗人工智能(AI)最受“吹捧”的承诺之一,就是它们能够帮助人类临床医生更精确地解读X光和CT扫描等图像,从而作出更准确的诊断报告,增强影像科医生的表现。
但实际情况确实如此吗?
美国哈佛大学医学院、麻省理工学院和斯坦福大学的合作研究表明,使用AI工具进行图像解读的效果,似乎因临床医生而异。
换句话说,有益还是无用,现阶段还是人类说了算。因为研究结果表明,个体临床医生的差异,会以AI专家们尚未完全理解的关键方式影响着人与机器之间的互动。该分析近日发表在《自然·医学》杂志上。
考虑医生个人因素
研究表明,在某些情况下,AI的使用可能会干扰放射科医生的表现,并影响他们解释的准确性。
虽然之前的研究表明,AI助手确实可以提高医生的诊断表现,但这些研究将医生视为一个整体,而没有考虑不同医生之间的差异。在临床上,每一位医生的判断,对患者来说都是100%的。
相比之下,这项新研究着眼于临床医生的个人因素——专业领域、实践年限、之前使用AI工具的经验,并分析这些因素如何在人机协作中发挥作用。
研究人员分析了AI如何影响140名放射科医生在15项X射线诊断任务中的表现,即医生需要可靠地发现图像上的明显特征并作出准确诊断。该分析涉及324名罹患15种病症的患者病例。
为了确定AI如何影响医生发现和正确识别问题的能力,研究人员使用先进的计算方法来获取使用AI和不使用AI时的表现变化。
结果显示,AI辅助的效果在放射科医生之间不一致且各不相同,一些放射科医生的表现因AI而提高,而另一些医生的表现则“恶化”。
英国皇家医学院布拉瓦尼克研究所生物医学信息学助理教授帕兰纳福·拉普科尔确认了研究团队这一发现,并表示“我们不应该将医生视为一个统一的群体,只考虑AI对其表现的‘平均’影响”。
不过,这一发现并不意味着应该阻止医生和诊所采用AI。相反,结果表明需要更好地了解人类和AI如何互动,并设计精心校准的方法来提高而不是损害人类的表现。
AI“助手”尚难预测
鉴于影像科被认为是能得到AI最大助力的临床医学领域,本次研究结果颇具代表意义。
此次发现中值得注意的是,在放射科,AI以令人惊讶的方式产生着影响人类医生的表现。
例如,与研究人员预期相反,放射科医生有多少年的经验、他们是否专门从事胸部放射科,以及他们之前是否使用过AI设备等因素,并不能可靠地预测AI工具对他们工作表现的影响。
另一项挑战普遍观点的发现是:基线表现不佳的临床医生,并不能持续稳定地从AI中得到帮助。总体而言,无论有或没有AI,基线表现较低的放射科医生的表现还是较低。对于基线表现较好的放射科医生来说也是如此——无论有没有AI,他们的总体表现始终良好。
但可以肯定的是,更准确的AI提高了放射科医生的表现,而水平一般的AI则会降低人类临床医生的诊断准确性。
这一发现的重要意义也在于:在临床部署之前,必须测试和验证AI工具的性能,以确保劣质AI不会干扰人类临床医生的判断,从而延误患者病情。
AI在医学影像科全流程应用场景中的研究进展
诊断前、诊断中及诊断后,这3个阶段贯穿患者在医学影像科就诊的整个流程,国内外学者均有开展部分研究,系统地将AI应用到这3个阶段中的研究尚不多见。
(一)AI在医学影像科“诊断前”流程中的应用研究
该阶段主要包含了预约登记、报到候诊、护理服务、图像采集、数据传输与存储、对比剂不良反应的预防与处理6个一级流程。AI的应用使得该阶段的工作更加高效,大大缩短病患就医的时间,同时也将降低服务人员和护理人员的工作量。
1.预约登记、报到候诊、护理服务及对比剂不良反应的预防和处理:高效的预约登记、及时的报到候诊及优质的护理服务是缩短患者就诊时间、提高患者就诊效率和提升服务质量的关键因素。Chong等[5]利用机器学习技术预测和减少门诊MRI预约缺席情况,并对缺席风险最高的患者进行电话提醒,结果显示在成功预测高风险缺席患者的同时,就诊患者的缺席率由19.3%下降至15.9%。Li等[6]开发了一种AI辅助模块,可以帮助门诊患者根据主诉自动安排影像检查,可显著减少患者检查等待时间,从而改善医院的门诊服务质量。对比剂在医学影像检查中应用广泛,然而不良反应的风险、对敏感器官的潜在损害及最近报道的钆对比剂在大脑中的沉积无法避免[7]。AI在对比剂领域的应用主要体现在虚拟增强技术。为了避免使用钆对比剂,Kleesiek等[8]应用贝叶斯深度学习架构来预测不同级别胶质瘤患者和健康对照组的虚拟对比增强图像,在定性和定量评估方面获得了良好的结果(灵敏度和特异度约为91%)。最近,Wang等[9]开发了一种生成对抗网络(generative adversarial network,GAN),从185例不同脑肿瘤患者的2D非对比增强液体衰减反转恢复(FLAIR)序列图像堆叠合成3D各向同性对比增强FLAIR图像,并且增加了超分辨率和抗锯齿任务,以解决MR伪影并创建各向同性3D图像,从而更好地显示肿瘤,合成图像与源图像具有良好的结构相似性指数。AI虚拟对比增强技术的应用成熟,可有效减少对比剂的暴露,尤其在儿科影像检查领域。AI已经广泛应用在临床护理工作中,然而,目前对于影像检查前的护理工作AI的应用尚为空白,笔者认为AI在影像护理服务方面的应用具有较广阔的研究空间。
2.图像采集与质控:快速、高效获取高质量的图像是影像诊断的前提。Li等[10]提出优化的人工智能神经网络模型进行辅助“一站式”高分辨血管壁成像检查,不仅大幅度提高成像速度,而且信噪比亦较大提升。Wang等[11]在CT设备上安装2D或3D摄像头,通过计算机视觉结合区域生成网络(region proposal network,RPN)在胸部CT扫描时实现自动识别起止点,减少不必要的扫描曝光范围,从而降低辐射剂量;更重要的是,在新型冠状病毒肺炎疫情期间,这一技术支撑了“隔室扫描技术”的实现,有助于降低医患交叉感染风险,缓解影像科工作人员的工作压力。同时,图像质控是医学影像科全流程管理中必不可少的环节,王继元等[12]利用深度学习在胸部DR自动判断患者体位是否正确、是否存在体外伪影及对图像进行评级,本研究可以向全身各系统推广,并有希望建立完整的影像AI质控体系。
3.数据传输与存储:当前,各家医院引进和自主开发了大量的医学影像人工智能平台,在影像数据交互上如果完全依靠医院临床影像归档与通信系统(picture archiving and communication system,PACS),会严重增加医院信息系统负担,影响正常的临床工作;另外,每个AI应用产生的结构化结果也不统一。为了解决这一问题,可以利用医学影像科现有的存储服务器,采用开源轻量化的PACS软件,打通各扫描机器的壁垒,搭建专用PACS,进一步构建影像数据平台,实现多中心数据分享,AI模型部署、数据流获取及结果汇总一体化,为医学影像AI推行提供有利条件。DICOM图像分析和归档(DICOM image analysis and archive,DIANA)系统是一个开源、轻量级和可扩展的Python接口,使用户能够与医院PACS交互以访问此类数据。研究表明,DIANA可以可靠地集成到现有的医院基础设施中,并改进研究人员/临床医师访问图像库数据的过程,这将简化大数据检索和AI模型临床集成的工作流程[13]。胡佳迎等[14]通过分析诊断报告中的关键信息并构造关键词对,使用3D-UNet神经网络将原始影像数据根据解剖学结构分割为不同的子区域,通过关键词对和预先设定的评分标准对子区域进行打分,按照优先级分数将其依次传输至用户前端,结果表明该方法能够在仅传输约1/10原始数据量的情况下满足医师的阅片、诊断需求,有效优化传统的传输流程。
(二)AI在医学影像科“诊断中”流程中的应用研究
该阶段主要包含了图像后处理与排版、辅助诊断和结构化报告生成。
1.图像后处理与排版:AI图像后处理与排版已在多个系统中得到应用。在神经系统中,利用AI技术对脑肿瘤进行精确分割和特征提取,不仅提高了诊断准确度,减少了漏诊,也为影像组学和AI研究提供了基础[15]。在宫内胎儿脑发育和疾病的应用中,Li等[16]提出了一种新的基于深度学习的两步法框架,浅层全卷积网络(fully convolutional networks,FCN)和超深多尺度FCN对二维胎儿脑MRI图像自动提取和分割,结果表明这种框架优于其他提取胎儿大脑的方法。在呼吸系统中,利用AI辅助对肺结节的良恶性分类,显著提高早期肺癌的检测率[17]。在循环系统中,Mu等[18]首次将深度学习方法应用在能谱CT冠状动脉CTA检查中,通过自动量化钙化积分,可以省去CTA前平扫,既降低了辐射剂量又可对CTA进行风险分类,具有重大的临床应用价值。
2.辅助诊断与结构化报告生成:AI在医学影像科全流程应用中,在影像诊断和报告生成流程中的应用最广泛、最成熟。在出血性脑卒中患者中,AI辅助诊断可自动分割血肿和周围脑组织,准确计算血肿体积及判断中线偏移程度[19]。在神经退行性疾病中,Hu等[20]利用基于深度学习方法区分额颞叶痴呆和阿尔茨海默病,这两种疾病的准确鉴别诊断对针对性干预和治疗具有重要的意义。在脑肿瘤领域,AI可以实现胶质瘤亚区的自动勾画、关键基因的预测、风险分层、治疗反应评估等方面。vander Voort等[21]通过胶质瘤患者多模态MRI影像,运用AI预测肿瘤的IDH基因突变和1p19q共缺失状态,在多中心外部验证中曲线下面积(AUC)可达0.90和0.85。在呼吸系统中,肺结节是早期肺癌筛查的着重点,AI技术在肺结节的精准检出、肺结节良恶性的鉴别、肺结节的分类及肺结节的组学分析已非常成熟,并且可自动生成结节位置、大小、性质及良恶性等的结构化报告,极大地提高了肺结节的检出率,减少了早期肺癌的漏诊和误诊。Xin等[22]基于深度学习提取肺部病灶的定量特征,构建模型,该模型在区分新型冠状病毒肺炎和社区获得性肺炎中有很好的鉴别诊断价值。AI技术在心血管系统的应用主要在心肌灌注、心功能评估、斑块成分分析、冠状动脉狭窄和心肌活动等方面[23,24]。在骨关节系统中的应用主要集中在肋骨骨折的自动检测、脊柱退变、关节畸形、骨密度测定、骨龄预测、骨转移瘤检测等方面[25,26]。Savage等[27]使用AI算法能够快速对患者的椎体CT影像进行直接标注以及骨密度测量,不仅能对骨质疏松高风险患者进行准确提示,而且省去了医师手动测量比对的麻烦。AI在该流程中的应用最广泛、最成熟,然而,目前大多数仅局限在单一疾病的辅助诊断方面,研发普适的算法、建设统一的平台将为AI更广泛、更方便的应用提供便利。
(三)AI在医学影像科“诊断后”流程中的应用研究
AI在医学影像科“诊断后”的应用主要包括图像和报告浏览打印、设备管理,可以进一步提高患者的就诊效率及患者的满意度。
1.图像和报告浏览打印:影像检查和诊断结束后,患者及时、有效地获取影像检查图像和报告是减少患者就诊时间、提高患者就诊满意度的有效途径。Wang等[28]利用深度学习方法开发了胸部CT胶片、图文报告系统,从肺结节筛查、胶片打印到最后关键图像的获取,全流程自动完成,将查找肺结节时间从平均16.86 s缩短至6.92 s,并且准确度接近100%,这项研究首次实现了胶片排版中自动排布肺结节关键图像,极大方便了临床医师和患者。将AI标注的关键图像发送至多媒体报告中,临床医师和患者可以及时、直观地在移动端查看报告和图像[29],极大提高了临床医师和患者的体验。
2.设备管理:医学影像设备是医疗器械中极其重要的组成部分,更是医院综合实力的重要体现,大型医疗设备的智能化管理和维护是保证影像科正常运转的前提。有研究者采用粗糙神经网络数据挖掘技术进行大型医疗设备故障智能化预警,可准确及时地甄别设备故障模式并进行预警[30]。
影响临床医学未来
临床医生拥有不同水平的专业知识、经验和决策风格,因此确保AI能反映这种多样性,对于有针对性地实施治疗至关重要。个体因素及变化,应成为确保AI进步的关键,而不是干扰并最终影响诊断的因素。
有意思的是,这一发现并没有解释AI为何会对人类临床医生的表现产生不同的影响,但随着AI对临床医学的影响越来越深远,理解其中原因就显得至关重要。关于这一点,AI专家依然在努力。
AI在医学影像科全流程应用场景中的研究进展
诊断前、诊断中及诊断后,这3个阶段贯穿患者在医学影像科就诊的整个流程,国内外学者均有开展部分研究,系统地将AI应用到这3个阶段中的研究尚不多见。
(一)AI在医学影像科“诊断前”流程中的应用研究
该阶段主要包含了预约登记、报到候诊、护理服务、图像采集、数据传输与存储、对比剂不良反应的预防与处理6个一级流程。AI的应用使得该阶段的工作更加高效,大大缩短病患就医的时间,同时也将降低服务人员和护理人员的工作量。
1.预约登记、报到候诊、护理服务及对比剂不良反应的预防和处理:高效的预约登记、及时的报到候诊及优质的护理服务是缩短患者就诊时间、提高患者就诊效率和提升服务质量的关键因素。Chong等[5]利用机器学习技术预测和减少门诊MRI预约缺席情况,并对缺席风险最高的患者进行电话提醒,结果显示在成功预测高风险缺席患者的同时,就诊患者的缺席率由19.3%下降至15.9%。Li等[6]开发了一种AI辅助模块,可以帮助门诊患者根据主诉自动安排影像检查,可显著减少患者检查等待时间,从而改善医院的门诊服务质量。对比剂在医学影像检查中应用广泛,然而不良反应的风险、对敏感器官的潜在损害及最近报道的钆对比剂在大脑中的沉积无法避免[7]。AI在对比剂领域的应用主要体现在虚拟增强技术。为了避免使用钆对比剂,Kleesiek等[8]应用贝叶斯深度学习架构来预测不同级别胶质瘤患者和健康对照组的虚拟对比增强图像,在定性和定量评估方面获得了良好的结果(灵敏度和特异度约为91%)。最近,Wang等[9]开发了一种生成对抗网络(generative adversarial network,GAN),从185例不同脑肿瘤患者的2D非对比增强液体衰减反转恢复(FLAIR)序列图像堆叠合成3D各向同性对比增强FLAIR图像,并且增加了超分辨率和抗锯齿任务,以解决MR伪影并创建各向同性3D图像,从而更好地显示肿瘤,合成图像与源图像具有良好的结构相似性指数。AI虚拟对比增强技术的应用成熟,可有效减少对比剂的暴露,尤其在儿科影像检查领域。AI已经广泛应用在临床护理工作中,然而,目前对于影像检查前的护理工作AI的应用尚为空白,笔者认为AI在影像护理服务方面的应用具有较广阔的研究空间。
2.图像采集与质控:快速、高效获取高质量的图像是影像诊断的前提。Li等[10]提出优化的人工智能神经网络模型进行辅助“一站式”高分辨血管壁成像检查,不仅大幅度提高成像速度,而且信噪比亦较大提升。Wang等[11]在CT设备上安装2D或3D摄像头,通过计算机视觉结合区域生成网络(region proposal network,RPN)在胸部CT扫描时实现自动识别起止点,减少不必要的扫描曝光范围,从而降低辐射剂量;更重要的是,在新型冠状病毒肺炎疫情期间,这一技术支撑了“隔室扫描技术”的实现,有助于降低医患交叉感染风险,缓解影像科工作人员的工作压力。同时,图像质控是医学影像科全流程管理中必不可少的环节,王继元等[12]利用深度学习在胸部DR自动判断患者体位是否正确、是否存在体外伪影及对图像进行评级,本研究可以向全身各系统推广,并有希望建立完整的影像AI质控体系。
3.数据传输与存储:当前,各家医院引进和自主开发了大量的医学影像人工智能平台,在影像数据交互上如果完全依靠医院临床影像归档与通信系统(picture archiving and communication system,PACS),会严重增加医院信息系统负担,影响正常的临床工作;另外,每个AI应用产生的结构化结果也不统一。为了解决这一问题,可以利用医学影像科现有的存储服务器,采用开源轻量化的PACS软件,打通各扫描机器的壁垒,搭建专用PACS,进一步构建影像数据平台,实现多中心数据分享,AI模型部署、数据流获取及结果汇总一体化,为医学影像AI推行提供有利条件。DICOM图像分析和归档(DICOM image analysis and archive,DIANA)系统是一个开源、轻量级和可扩展的Python接口,使用户能够与医院PACS交互以访问此类数据。研究表明,DIANA可以可靠地集成到现有的医院基础设施中,并改进研究人员/临床医师访问图像库数据的过程,这将简化大数据检索和AI模型临床集成的工作流程[13]。胡佳迎等[14]通过分析诊断报告中的关键信息并构造关键词对,使用3D-UNet神经网络将原始影像数据根据解剖学结构分割为不同的子区域,通过关键词对和预先设定的评分标准对子区域进行打分,按照优先级分数将其依次传输至用户前端,结果表明该方法能够在仅传输约1/10原始数据量的情况下满足医师的阅片、诊断需求,有效优化传统的传输流程。
(二)AI在医学影像科“诊断中”流程中的应用研究
该阶段主要包含了图像后处理与排版、辅助诊断和结构化报告生成。
1.图像后处理与排版:AI图像后处理与排版已在多个系统中得到应用。在神经系统中,利用AI技术对脑肿瘤进行精确分割和特征提取,不仅提高了诊断准确度,减少了漏诊,也为影像组学和AI研究提供了基础[15]。在宫内胎儿脑发育和疾病的应用中,Li等[16]提出了一种新的基于深度学习的两步法框架,浅层全卷积网络(fully convolutional networks,FCN)和超深多尺度FCN对二维胎儿脑MRI图像自动提取和分割,结果表明这种框架优于其他提取胎儿大脑的方法。在呼吸系统中,利用AI辅助对肺结节的良恶性分类,显著提高早期肺癌的检测率[17]。在循环系统中,Mu等[18]首次将深度学习方法应用在能谱CT冠状动脉CTA检查中,通过自动量化钙化积分,可以省去CTA前平扫,既降低了辐射剂量又可对CTA进行风险分类,具有重大的临床应用价值。
2.辅助诊断与结构化报告生成:AI在医学影像科全流程应用中,在影像诊断和报告生成流程中的应用最广泛、最成熟。在出血性脑卒中患者中,AI辅助诊断可自动分割血肿和周围脑组织,准确计算血肿体积及判断中线偏移程度[19]。在神经退行性疾病中,Hu等[20]利用基于深度学习方法区分额颞叶痴呆和阿尔茨海默病,这两种疾病的准确鉴别诊断对针对性干预和治疗具有重要的意义。在脑肿瘤领域,AI可以实现胶质瘤亚区的自动勾画、关键基因的预测、风险分层、治疗反应评估等方面。vander Voort等[21]通过胶质瘤患者多模态MRI影像,运用AI预测肿瘤的IDH基因突变和1p19q共缺失状态,在多中心外部验证中曲线下面积(AUC)可达0.90和0.85。在呼吸系统中,肺结节是早期肺癌筛查的着重点,AI技术在肺结节的精准检出、肺结节良恶性的鉴别、肺结节的分类及肺结节的组学分析已非常成熟,并且可自动生成结节位置、大小、性质及良恶性等的结构化报告,极大地提高了肺结节的检出率,减少了早期肺癌的漏诊和误诊。Xin等[22]基于深度学习提取肺部病灶的定量特征,构建模型,该模型在区分新型冠状病毒肺炎和社区获得性肺炎中有很好的鉴别诊断价值。AI技术在心血管系统的应用主要在心肌灌注、心功能评估、斑块成分分析、冠状动脉狭窄和心肌活动等方面[23,24]。在骨关节系统中的应用主要集中在肋骨骨折的自动检测、脊柱退变、关节畸形、骨密度测定、骨龄预测、骨转移瘤检测等方面[25,26]。Savage等[27]使用AI算法能够快速对患者的椎体CT影像进行直接标注以及骨密度测量,不仅能对骨质疏松高风险患者进行准确提示,而且省去了医师手动测量比对的麻烦。AI在该流程中的应用最广泛、最成熟,然而,目前大多数仅局限在单一疾病的辅助诊断方面,研发普适的算法、建设统一的平台将为AI更广泛、更方便的应用提供便利。
(三)AI在医学影像科“诊断后”流程中的应用研究
AI在医学影像科“诊断后”的应用主要包括图像和报告浏览打印、设备管理,可以进一步提高患者的就诊效率及患者的满意度。
1.图像和报告浏览打印:影像检查和诊断结束后,患者及时、有效地获取影像检查图像和报告是减少患者就诊时间、提高患者就诊满意度的有效途径。Wang等[28]利用深度学习方法开发了胸部CT胶片、图文报告系统,从肺结节筛查、胶片打印到最后关键图像的获取,全流程自动完成,将查找肺结节时间从平均16.86 s缩短至6.92 s,并且准确度接近100%,这项研究首次实现了胶片排版中自动排布肺结节关键图像,极大方便了临床医师和患者。将AI标注的关键图像发送至多媒体报告中,临床医师和患者可以及时、直观地在移动端查看报告和图像[29],极大提高了临床医师和患者的体验。
2.设备管理:医学影像设备是医疗器械中极其重要的组成部分,更是医院综合实力的重要体现,大型医疗设备的智能化管理和维护是保证影像科正常运转的前提。有研究者采用粗糙神经网络数据挖掘技术进行大型医疗设备故障智能化预警,可准确及时地甄别设备故障模式并进行预警[30]。
研究团队补充说,下一步,放射科医生与AI的交互,应该在模拟现实场景的实验环境中展开测试,测试结果需要反映实际患者群体的情况。而除了提高AI工具的准确性之外,培训放射科医生去及时检测不准确的AI、审查并质疑AI工具的诊断,也很重要。
换言之,在AI帮你之前,你需要先提高自身。
文章来源: 科技日报、中华放射学杂志
来源:贤集网