吴恩达团队公布最大医学影像数据集 MURA基于深度学习检测骨骼疾病

2025-08-23 17:19:00
miadmin
原创
8

雷锋网新闻,大方、高质地的数据集促进了深度研习范畴的繁荣。不日,斯坦福吴恩达团队开源了 MURA 数据库,蕴涵 14982 个病例的上肢肌肉骨骼X光片。每个病例蕴涵一个或众个图像,均由放射科医师手动标志。团队显露,为饱动医学影像诊断模子的提高,MURA 数据库可免得费运用。数据集地方为(数据集要2月才会颁发)

格外检测职责,也便是通过机合器官的 X 光片来确定机体的强壮情况,对患病境况实行直接诊断。环球赶过 17 亿人都有肌肉骨骼性的疾病,这也是导致长久疾苦和残疾最常睹的病因。据雷锋网知道,每年有 3000 万安排的急诊病例,这个数字还正在持续上涨。

MURA 是目前最大的 X 光片数据库之一,蕴涵源自 14982 项病例的 40895 张肌肉骨骼X光片。1万众项病例里有9067 例平常的上司肌肉骨骼和 5915 例上肢格外肌肉骨骼的 X 光片,部位囊括肩部、肱骨、手肘、前臂、手腕、手掌和手指。

外一:MURA 数据库蕴涵 9067 例平常和 5915 例格外肌肉骨骼影像学钻研,囊括肩部,肱骨,手肘,前臂,手腕,手掌和手指等上肢。MURA 是最大的大众影像数据集之一。

基于 MURA,咱们开采了一个有用的格外检测模子。将一个或众个 X 光片输入该模子来钻研上肢局限。通过 169 层的卷积神经收集预测每个 X 光片的格外概率,然后得出统一病例全数 X 光片格外概率的均匀值,动作 X 光片的格外概率输出。

图2.该模子输入一个或众个 X 光片,通过 169 层的卷积神经收集预测格外的概率,然后输非常外概率的均匀值。

为了有用地评估模子并得到放射科大夫对待模子的评议,咱们从 209 项连续跟踪的病例中挑选了 6 个病例,搜罗专业放射科大夫给出的诊断结果。将模子和大夫给出的诊断结果实行比拟,出现模子的诊断才力抵达了放射科大夫相当的水准。正在诊断手指和手腕格外时,模子检测格外的才力强于最好的大夫。然而,正在诊断膝、前臂、肱骨和肩部格外时,模子的阐扬不如大夫的阐扬。

机构审查委员会的准许之后,咱们通过斯坦福病院的PACS体系搜罗了被识另外、适当HIPPA的图像。咱们搜罗了来自12251名患者、14982项钻研的肌肉骨骼放射学数据集,共有40895个众视图的影像。每一个都属于七个规范的上肢放射学钻研类型之一:肘部、手指、前臂、手、肱骨、肩膀和手腕。外1总结了平常和格外钻研的分散境况。

斯坦福病院的放射科大夫将2001年到2012年的每项钻研手工标志为平常或格外。正在对DICOM图像实行疏解时,对起码300万像素的PACS医用级显示器实行知道释,此中最大亮度为400 cd/m2,最小亮度 1 cd/m2,像素尺寸为0.2,本机折柳率为1500 x 2000像素。临床图像正在折柳率和纵横比上有所差别。咱们将数据集拆分为锻练(11255名患者,13565个钻研,37111个图像)、验证(788例,1208项钻研,3225张图片)、测试(208个病人,209个钻研,559个图像)。数据集正在任何一组患者之间没有重叠。

为了评估模子并获得放射科大夫的牢靠验证,咱们从斯坦福大学那里搜罗了少少特殊的标签,这些标签囊括209个肌肉骨骼钻研。放射科大夫正在运用PACS体系的临床阅览室情况中,对每项钻研实行了记忆和标志,并将其标志为DICOM文献。放射科大夫均匀有8.83年的体验,从2年到25年不等。放射科大夫没有得到任何临床原料。标签被输入到一个规范化的数据录入体系中。

咱们评估了放射科大夫和模子正在测试集上的阐扬。钻研中,咱们从6名认证的放射科大夫那里搜罗了特殊的平常/格外的标签,拔取了此中三位来创筑一个金规范,运用其他三位来评估人类正在这项职责上的阐扬。

外二总结了放射科大夫和模子正在差别钻研类型和总体上的阐扬。放射科大夫正在腕部钻研(大夫2)或肱骨钻研(大夫1和3)上赢得了最高的收效,他们正在手指钻研上的阐扬最差。该模子正在腕部钻研中也抵达了最高的阐扬。正在腕部钻研中,模子阐扬与最好的放射科大夫阐扬相当。正在全数其他钻研类型中,模子的阐扬昭彰低于人类的阐扬。

大型数据集使得深度研习算法正在图像识别、语音识别和问答等职责中实行或亲切人类水准的功能。医学方面的数据集也助助科学家正在糖尿病视网膜病变、皮肤癌、心律异常、脑出血、肺炎和髋部骨折方面成为小半个“专家”。

外三:公然可用医学放射影像数据集(第二大的数据集是Pediatric Bone(预测骨龄);0.E.1是合于膝合节的数据集)

外3供应了大众可用数据集的摘要。之前的数据集比MURA要小,但迩来揭晓的ChestX-ray14除外,它是112120个正面的胸片、蕴涵14个胸科病理标签。然而,标签并不是直接由放射科大夫供应的,而是由他们的文本陈诉主动天生。

很少有公然可用的肌肉骨骼X光数据集。斯坦福大学的医学和成像人工智能项目供应了一个数据集,蕴涵了带有骨骼春秋(AIMI)的儿童手部X光片。据雷锋网知道,数据集是由差别春秋的儿童的左手影像构成,上面标有放射科大夫的骨龄读数。骨合节炎方面就得看0. E.1数据集了,此中蕴涵标有K&L品级的骨合节炎(OAI)的膝部放射照片。上述的几个数据集都蕴涵不到15000个图像。

骨骼肌x光片的格外检测具有紧急的临床操纵价格。最初,将格外检测模子用于作事列外的优先级排序。正在这种境况下,检测到的格外可能正在图像疏解作事流程中前置,让最告急的患者获得更速的诊断和医疗:

别的,主动格外定位可能助助缓解放射科大夫的疲困。医疗资源的分散不均加剧了这个题目,越发是正在医疗资源凑集的都市地域。固然疲困是全数医护专业职员时常面临的一个题目,但放射科大夫卓殊容易受到影响,进而恐怕会影响诊断的无误性。有一项钻研注明,放射科大夫正在当天作事终结时,骨折检测的功用与作事发轫时比拟有明显的消浸。

一个可能实行主动格外定位的模子可能特出显示模子中被识别为格外的局限,惹起临床大夫的留神。倘使有用的话,这将有助于更有用地助助大夫实行阅片,裁汰差错,并助助进步规范化质地。当然了,该模子还须要更众的钻研来实行评估,而且思虑怎么与其他深度研习模子正在临床情况中实行最优化的整合。