80萬條數據揭示隱患：AI正在污染病歷， 4949澳門免費資料大全特色你的診療數據越來越不靠譜

江蘇江大工程管理有限公司
2026-03-18

本研究是由新加坡國立大學劉鈿渤組博士生何洪宇領銜、包括哈佛大學、斯坦福大學、耶魯大學、谷歌公司、梅奧診所等機構共同完成的，研究團隊成員有醫學 AI、放射學、臨床醫學等各方面的專家，具有很強的跨學科研究背景和臨床實踐經驗。 2026澳門正版資料免費大全

隨著生成式人工智能在醫療領域的加速滲透，越來越多的病歷、影像報告及各類臨床文本正逐步納入 AI 參與生成的范疇。這一旨在提升醫療效率的技術革新背后，潛藏著威脅診斷安全性的深層隱患。

最近新加坡國立大學、哈佛大學、斯坦福大學等機構聯合團隊最新研究顯示，當 AI 生成的臨床文本被用作訓練新一代 AI 模型時，一些罕見但是重要的病理信息會在數據迭代的過程中悄悄地消失，從而使得醫療 AI 整體診斷可靠性在群體上不斷下降。

研究團隊對臨床文本生成、視覺-語言報告、醫學圖像合成這三個任務下的 80 多萬條合成數據進行了系統的分析（如圖 1 表示），首次證明了在沒有強制性人工驗證的情況下，多代自我訓練循環會使病理多樣性迅速消失，診斷可靠度急劇降低，并且醫師評估也表明臨床效用的退化。

最后研究團隊提出了可以直接融入到目前臨床工作流程中的緩解方法，在 AI 全面進入醫療之前給醫生提供一條安全的操作路線。

論文標題：AI-generated data contamination erodes pathological variability and diagnostic reliability
論文鏈接：https://arxiv.org/abs/2601.12946

圖 1 人工智能生成的數據污染造成的病理多樣性喪失、診斷安全性降低的現象以及緩解方法

現實困境：

醫療 AI 生成普及背后的隱形危機

人工智能正在改變全球醫療文檔系統，大型語言模型已經被廣泛地應用到臨床報告、出院小結、電子健康檔案等方面，AI 輔助診斷已經得到廣泛的應用。但是其中隱藏的風險是，原來依靠人工建立起來的醫療數據庫正在被大量的 AI 生成內容所取代，而且不斷保存在診療記錄中，從而成為下一代 AI 訓練的數據來源，形成了一個「生成-訓練-再生成」的自循環結構。

在其它領域，自我訓練循環被證明會造成「模型退化」，也就是輸出的多樣性以及保真度會降低。而醫學領域的特殊性使得該問題的危害更加嚴重。醫學診斷很大程度上依靠罕見病、非典型臨床表現、臨床分布尾部細微異常等信息的輕微流失都會造成系統性診斷盲區，增加漏診風險，加重醫療不公，影響疾病監測。更嚴重的是，目前醫療 AI 評價標準大多只看表面的語言質量，而沒有考慮診斷的準確性，導致這樣的模型和臨床應用出現退化很難被常規監測到。

核心發現：

多種任務下性能全面退化，

虛假信心掩蓋致命漏洞

研究團隊對 216307 份放射學報告、790 份臨床筆記、1000 份眼科病歷和 9781 張胸部 X 線片進行了多任務實驗，研究表明，AI 生成的數據污染造成模型性能退化甚至失效，并不是單一數據類型或者臨床任務造成的，而是貫穿臨床文本生成、視覺-語言放射學報告、醫學圖像合成這三個不同的真實臨床任務，采用多種代表性模型架構開展實驗并且各個任務都存在類似的退化邏輯，即自我訓練循環造成病理多樣性喪失、診斷可靠度降低，同時又被虛假的預測信心所掩蓋。為評估研究結果的臨床相關性，研究團隊通過對人工智能生成輸出進行結構化審查和編輯，并納入了醫師評估環節。

圖 2 人工智能生成的數據污染導致臨床筆記語言多樣性喪失和臨床知識退化

AI 生成的臨床文本隱患：

詞匯和知識的雙重流失以及敘事的碎片化

研究團隊首先用多種臨床文檔和人工智能模型架構，研究用合成臨床文本進行自我訓練會不會造成語言模型性能下降。圖 2 結果表明經過四代自我訓練之后，模型就會出現災難性的退化。放射學報告中印象部分的詞匯量由原來的 12078 個減少到現在的 200 個左右，減少了 98.9%；獨特醫學術語減少 66%，報告公式化趨勢明顯。類似的結論也可以用在更廣泛的臨床文書上，例如 790 份 i2b2 臨床數據庫。隨著 AI 模型對于自身產生的合成數據的信心越來越大，但它所具有的真實醫療語言的能力卻降低了到原來的四分之一，這給醫療人工智能的部署帶來嚴重的風險，虛假的信心會掩蓋患者文書記錄中的重大失誤。

圖 3 人工智能生成的數據污染造成基于視覺-語言模型的放射學報告生成出現語言多樣性的喪失和臨床知識的退化

視覺-語言報告：

圖像錨定失效，虛假安心率激增

人工智能在醫學影像生成報告的時候，語言退化仍然會發生。研究使用了 Swin-Transformer、Llama-2 的視覺語言模型 R2GenGPT，用真實的胸部 X 線片做輸入，只用合成報告來訓練。圖 3 結果說明即使有真實的圖像，模型也會出現嚴重的退化，報告的唯一性從原來的 96.2% 下降到現在的 0.9%，詞匯量從原來的 8186 個減少到現在的 94 個，減少了 98.9%。

更危險的是虛假的安心率急劇上升，當存在危及生命危險的病理情況時，「無急性發現」的錯誤比例從原來的 13.3% 上升到現在的 40.3%，但是模型本身的置信度很高，因此模型具有臨床危險性的結果，不能滿足患者的診療需求。

圖 4 人工智能生成的數據污染給醫學圖像合成造成的視覺質量下降、病理表征失真和人口統計學偏差變大

醫學圖像合成：

出現質量退化、偏見放大、弱勢人群代表性缺失

除此之外，人工智能生成的合成醫學影像也越來越廣泛地被用來進行研究、產品研發等，用以擴充訓練數據集、實現隱私保護型的數據共享。但是當這些合成影像被用來訓練后續的人工智能模型的時候，生成出來的影像很難體現真實患者人群的多樣性，為了探究影像生成會不會出現和文本模型一樣的退化模式，研究團隊在多輪自我訓練循環中，用胸部 X 光片來訓練人工智能影像生成模型。從實驗結果（圖 4）可知，由于人工智能合成的數據污染而產生的視覺退化、病理表征扭曲以及人口統計學偏倚等都會被加重。

納入醫生評估環節，

提出三種策略解決 AI 生成困境

為了評價研究結果的臨床相關性，對人工智能生成出來的輸出做了結構化的審查和編輯，并且加入了醫師評價的過程證實臨床效用的退化。另外，研究團隊對三種應對 AI 數據污染導致模型退化的策略進行了系統的驗證，分別為真實數據混合訓練為基本方案，當真實數據占比達到 75% 時，可以較好地保持病理的多樣性、語言的保真度，從而有效地減少人口統計學偏差；質量感知過濾是在有限真實數據的基礎上提高利用效率的一種方式，可以作為增效補充，但是不能代替高比例真實數據的作用；單純擴增合成數據不僅無效，還會加快模型退化、加重性別偏見，數據數量不能彌補質量缺陷。

結論與展望 2026年正版免費資料大全

研究團隊認為應該把數據溯源作為醫療 AI 部署的政策強制要求，實行強制的人工檢驗制度。僅僅依靠自愿監督是不夠的，隨著臨床 AI 應用規模的擴大，嚴格的機械驗證的經濟可行性會越來越低，如果沒有制度性的限制，醫療系統就會存在污染未來患者數字生理數據的風險。如果缺少政策強制的溯源機制，那么生成式 AI 部署后就會影響到它本身的醫療數據生態系統，進而引發安全問題。

香港精華區

80萬條數據揭示隱患：AI正在污染病歷， 4949澳門免費資料大全特色你的診療數據越來越不靠譜

出處：江蘇江大工程管理有限公司

歡迎向您的朋友推薦本站或本資料，一起交流！

香港精華區

80萬條數據揭示隱患：AI正在污染病歷， 4949澳門免費資料大全特色 你的診療數據越來越不靠譜

出處：江蘇江大工程管理有限公司

歡迎向您的朋友推薦本站或本資料，一起交流！

80萬條數據揭示隱患：AI正在污染病歷， 4949澳門免費資料大全特色你的診療數據越來越不靠譜