5月6日,醫(yī)療大模型評測平臺MedBench發(fā)布新版評測榜單,潤達醫(yī)療與華為基于華為云盤古大模型創(chuàng)新研發(fā)的潤醫(yī)醫(yī)療大模型以92.9分在自測榜單中拔得頭籌,在專業(yè)評測榜單中以85.2分榮膺桂冠。潤醫(yī)醫(yī)療大模型在醫(yī)學語言理解、醫(yī)學安全和倫理等核心測評維度中表現(xiàn)突出。
最新版MedBench榜單(2025年2月版)
MedBench作為中文醫(yī)療大模型權威評測平臺,由上海人工智能實驗室、上海市數(shù)字醫(yī)學創(chuàng)新中心聯(lián)合多家機構(gòu)打造,已成為全球醫(yī)療AI領域重要參照標準之一。目前,平臺已累計評測全球387個醫(yī)療大模型,從醫(yī)學語言理解、生成、知識問答、復雜推理及醫(yī)療安全倫理五大維度,提供客觀科學的性能評估。
潤醫(yī)醫(yī)療大模型能夠一舉斬獲雙料第一,甚至在自測榜單中,醫(yī)學語言理解、醫(yī)療安全和倫理維度分別斬獲122.1、103.1高分,及在專業(yè)評測榜中,醫(yī)學語言理解維度斬獲119.7高分,充分佐證了潤達醫(yī)療在醫(yī)療大模型研發(fā)領域深厚的技術積累與強大的創(chuàng)新硬實力。此外,在醫(yī)學復雜推理等高階復雜醫(yī)療場景中,模型也取得了領先的效果,凸顯了模型運用醫(yī)學知識進行復雜分析和嚴謹推理的能力,將在醫(yī)學輔助診療、提升醫(yī)療效率和準確率等方面發(fā)揮重要作用。
多維能力突出 重構(gòu)人機協(xié)同范式
潤醫(yī)醫(yī)療大模型在華為云盤古大模型L0層的基礎上,訓練使用了千億級高質(zhì)量的中英文醫(yī)學文獻、醫(yī)學指南、書籍,及千萬量級醫(yī)療健康檔案和知識圖譜等數(shù)據(jù),融合高質(zhì)量通用數(shù)據(jù),構(gòu)成了潤醫(yī)醫(yī)療大模型底座。
從技術特性來看,380億高參數(shù)量賦予模型強大的學習能力,使其能夠精準捕捉醫(yī)療數(shù)據(jù)中的復雜模式與內(nèi)在關系,顯著提升語言理解和生成能力,足以勝任各類復雜醫(yī)療任務。而支持32k序列長度,則確保模型具備卓越的長文本處理能力,能夠充分理解上下文語義,極大增強對復雜醫(yī)療文本的分析解讀效能,可在多輪對話、復雜病例分析等應用場景中優(yōu)勢明顯。作為大模型訓練的核心要素,海量高質(zhì)量數(shù)據(jù)為模型提供了豐富且準確的知識來源,可有效提升模型泛化能力,使其在各類實際醫(yī)療場景中能夠做出更精準的判斷與決策。
基于模型底座,潤達醫(yī)療還創(chuàng)新研發(fā)了循證推理引擎,通過構(gòu)建“動態(tài)權重分配、證據(jù)鏈追溯與不確定性量化”的“三位一體”臨床決策系統(tǒng)。其中,動態(tài)權重分配確保了模型可實時聚焦關鍵醫(yī)學信息;證據(jù)鏈追溯則通過知識圖譜,能夠驗證推理路徑;不確定性量化則對模糊信息進行概率評估。三項創(chuàng)新機制的協(xié)同運作,有效將模型幻覺率嚴格控制了在醫(yī)療級安全閾值內(nèi)。不僅如此,潤達醫(yī)療還打造具有雙向進化機制的可信AI大腦,在服務醫(yī)生的過程中持續(xù)學習臨床反饋,反向優(yōu)化自身推理路徑,重構(gòu)人機協(xié)同范式,讓AI成為醫(yī)生智慧的延伸,更精準地滿足醫(yī)生和患者的知識需求,真正成為醫(yī)療場景中可靠的智能助手。
得益于多項核心創(chuàng)新技術的有力支撐,潤醫(yī)醫(yī)療大模型在MedBench評測的多個維度中均展現(xiàn)卓越性能,尤其是語言理解與醫(yī)療安全和倫理維度。在醫(yī)學語言理解上,動態(tài)權重分配、證據(jù)鏈追溯與不確定性量化機制協(xié)同,可精準捕捉文本關鍵信息與邏輯。而在醫(yī)療安全與倫理維度,“循證推理+可信AI”架構(gòu)深度剖析復雜場景,嚴格審查倫理風險,為醫(yī)療質(zhì)效提升與合規(guī)安全筑牢雙重保障。
真實場景驗證 賦能醫(yī)療質(zhì)效革新
從技術突破到民生福祉,潤達醫(yī)療基于大模型和數(shù)據(jù)治理的智慧醫(yī)療解決方案,貫穿“防-治-管”全流程,提供覆蓋疾病預防、診斷治療、患者管理的全生命周期服務,已在智慧檢驗、病情分析、病歷生成與質(zhì)控、區(qū)域健康管理等多維度真實醫(yī)療場景中完成實踐驗證,成功實現(xiàn)智慧診療全場景落地應用。
基于潤醫(yī)醫(yī)療大模型,潤達醫(yī)療與美年健康共同孵化的國內(nèi)首款AI私人健康管理師“健康小美”,截至今年3月底,其智能主檢應用已在美年健康109家體檢中心上線應用,且審核并生成超39萬份體檢報告,重點指標精準率90%+。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )