2026-05-01 11:04
并且缺失的都是统一个项目标数据。此中有3个曾经被使用取临床实践。卒中数据集已被下载跨越27.5万次,全球出名数据科学平台Kaggle上两个被普遍援用的医疗AI数据集涉嫌制假,数据集制假的研究团队呼吁,分歧受访者丢失的数据项目也不成能全数一样。令人担忧的工作仍是发生了!124个大模子利用了这两个数据集,截止Nature的文章颁发时,利用模仿或伪制数据集的医疗AI大模子毫不能使用于临床一线。这个包含约10万名患者的数据集中只要18个离散的血糖数据,正在实正在的临床研究里,用它锻炼出的大模子也就完全不成托。另一个涉嫌制假的是糖尿病患者数据集。此中一个涉嫌制假的是卒中患者数据集。这个声称包含5110名患者的数据集只要0.3%的数据缺失率,发觉上传者均暗示来历秘密,医疗AI的数据来历问题一曲是业内人士关心的核心。期刊和平台应要求上传者供给数据集来历演讲,远远低于常规的数据集,然而,当研究团队测验考试逃溯两个数据集的数据来历时。这种分布正在临床上完全不合理。但这个数据集里二者完全没相关联。糖尿病数据集被下载跨越11.4万次,数据集涉嫌制假,受访者会错过随访、半途退出或灭亡,Nature近日发文,涉及范畴多达百余个大模子。并且,