2025-12-22 18:57:02 來源:techweb 作者: 摘要:12月16日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench4.0發(fā)布最新評(píng)測(cè)結(jié)果。
12月16日,中文醫(yī)療大模型權(quán)威評(píng)測(cè)平臺(tái)MedBench4.0發(fā)布最新評(píng)測(cè)結(jié)果。云知聲自主研發(fā)的“山海醫(yī)療大模型(UniGPT?Med)”展現(xiàn)出全面領(lǐng)先的技術(shù)實(shí)力,一舉斬獲醫(yī)療智能體、醫(yī)療大語言模型、醫(yī)療多模態(tài)大模型三項(xiàng)技術(shù)范式,成為本次評(píng)測(cè)中表現(xiàn)最為突出的“三冠王”。

其中,UniGPT?Med?U1在醫(yī)療大語言模型評(píng)測(cè)中以綜合得分65.7分登頂,力壓Grok-4(58.4)Claude-Sonnet-4.5、Gemini-2.5-Pro、GPT-5等一眾國際頂尖模型。同時(shí),在醫(yī)療智能體評(píng)測(cè)中以綜合得分94.6分的優(yōu)異成績,大幅領(lǐng)先第二名Claude-Sonnet-4.5(88.8)近6分;

MedBench4.0-醫(yī)療大語言模型評(píng)測(cè)榜單

MedBench4.0-醫(yī)療智能體評(píng)測(cè)榜單
UniGPTMedVL則在醫(yī)療多模態(tài)大模型評(píng)測(cè)中以綜合得分59.6分摘得桂冠,領(lǐng)先第二名GPT-5(53.7分)近6分,展現(xiàn)出絕對(duì)技術(shù)優(yōu)勢(shì)。

MedBench4.0-醫(yī)療多模態(tài)大模型評(píng)測(cè)榜單
MedBench評(píng)測(cè)平臺(tái)由上海人工智能實(shí)驗(yàn)室、上海市數(shù)字醫(yī)學(xué)創(chuàng)新中心聯(lián)合多家權(quán)威機(jī)構(gòu)共同打造,以其科學(xué)、公平、嚴(yán)謹(jǐn)?shù)脑u(píng)測(cè)體系著稱。2025年11月20日,該平臺(tái)全面迭代更新至4.0版本,成為全國首個(gè)且唯一面向垂直模型、專用模型及各應(yīng)用場(chǎng)景的醫(yī)療大模型評(píng)測(cè)與驗(yàn)證體系。本次升級(jí)聚焦實(shí)戰(zhàn)化評(píng)測(cè)突破與生態(tài)化開放共建兩大核心,全面覆蓋醫(yī)療大語言模型、醫(yī)療多模態(tài)大模型及醫(yī)療智能體三大技術(shù)范式,并深度對(duì)齊國家《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》,旨在為醫(yī)療AI從技術(shù)可行走向臨床可用搭建關(guān)鍵的驗(yàn)證橋梁。
基于嚴(yán)格的醫(yī)學(xué)標(biāo)準(zhǔn),平臺(tái)構(gòu)建了高質(zhì)量、多維度、覆蓋廣泛的評(píng)測(cè)集。其中,醫(yī)療大語言模型評(píng)測(cè)涵蓋5大能力維度、36個(gè)專業(yè)子集,約70萬條數(shù)據(jù);醫(yī)療多模態(tài)大模型評(píng)測(cè)聚焦3大核心能力、10個(gè)專業(yè)子集;醫(yī)療智能體評(píng)測(cè)則圍繞6大行動(dòng)維度設(shè)置了14個(gè)復(fù)雜任務(wù)集。在此嚴(yán)苛且全面的評(píng)估框架下,山海大模型能夠一舉奪得三項(xiàng)冠軍,充分彰顯了其極高的技術(shù)含金量與實(shí)用價(jià)值。
此次評(píng)測(cè)的卓越表現(xiàn),得益于山海醫(yī)療大模型最新版本完成的系統(tǒng)性核心升級(jí)。新版本致力于構(gòu)建業(yè)界能力維度最豐富的醫(yī)療AI技術(shù)支撐體系,其核心亮點(diǎn)在于實(shí)現(xiàn)了“醫(yī)學(xué)文本大模型”與“醫(yī)學(xué)多模態(tài)大模型”雙核心產(chǎn)品體系的深度融合,全面覆蓋從文本處理、智能體協(xié)同到影像解析的多元功能,形成了當(dāng)前能力維度最豐富的醫(yī)療AI技術(shù)架構(gòu)。
通過深度融合模擬臨床思維的復(fù)雜推理能力,模型實(shí)現(xiàn)了精準(zhǔn)的鑒別診斷與循證決策支持;同時(shí),原生內(nèi)化的任務(wù)規(guī)劃、工具調(diào)用與多智能體協(xié)作等核心能力,推動(dòng)其完成了從“醫(yī)學(xué)認(rèn)知大腦”向“自主醫(yī)療行動(dòng)者”的關(guān)鍵進(jìn)階,能夠高效適配并執(zhí)行復(fù)雜的真實(shí)醫(yī)療任務(wù)流程。
在多模態(tài)能力方面,新版本展現(xiàn)出對(duì)臨床場(chǎng)景的深度賦能。它不僅能夠精準(zhǔn)識(shí)別X光、CT、MRI等多種醫(yī)學(xué)影像中的病灶與解剖結(jié)構(gòu),高效提取醫(yī)療文檔關(guān)鍵文本信息,更支持跨模態(tài)語義對(duì)齊與聯(lián)合推理,能夠融合影像特征與臨床描述進(jìn)行綜合判斷,為臨床決策提供多源數(shù)據(jù)支撐的精準(zhǔn)建議。
權(quán)威榜單的成績是技術(shù)實(shí)力的顯性證明,而真正的價(jià)值在于臨床實(shí)踐的檢驗(yàn)與認(rèn)可。依托該模型,云知聲推出了覆蓋診療全流程的“智慧醫(yī)療產(chǎn)品矩陣”,涵蓋智能病歷生成與質(zhì)控、臨床輔助決策、醫(yī)療質(zhì)量監(jiān)管、醫(yī)保支付智能審核以及智慧患者服務(wù)等核心產(chǎn)品。這些產(chǎn)品已深入醫(yī)政管理、臨床診療、運(yùn)營管理和患者服務(wù)等關(guān)鍵環(huán)節(jié),并在全國部署近400家醫(yī)院,700余家醫(yī)院進(jìn)入測(cè)試階段。其中覆蓋北京協(xié)和醫(yī)院、北京友誼醫(yī)院、東南大學(xué)附屬中大醫(yī)院、青島大學(xué)附屬醫(yī)院等數(shù)百家國內(nèi)頂級(jí)三甲醫(yī)院。
在提升診療效率與質(zhì)量方面,落地案例成效顯著。例如,門診病歷生成系統(tǒng)能夠?qū)崟r(shí)捕捉醫(yī)患之間的對(duì)話內(nèi)容,智能提取關(guān)鍵問診信息,并自動(dòng)生成結(jié)構(gòu)化病歷。醫(yī)生僅需進(jìn)行簡單審核,即可完成病歷書寫工作。目前該系統(tǒng)已在北京友誼醫(yī)院順義院區(qū)廣泛應(yīng)用,單份病歷直接引用率接近90%,大幅降低了醫(yī)生文書負(fù)擔(dān);智能病歷質(zhì)控系統(tǒng)能夠精準(zhǔn)理解病歷內(nèi)容,并智能識(shí)別其中的書寫錯(cuò)誤與缺陷。系統(tǒng)對(duì)影像描述、專業(yè)術(shù)語進(jìn)行細(xì)致分析,并對(duì)檢查結(jié)果、檢查結(jié)論以及檢查依據(jù)進(jìn)行深度解讀,從而實(shí)現(xiàn)高效、精準(zhǔn)的病歷質(zhì)控;DRG/DIP醫(yī)保支付管理系統(tǒng)以智能提醒和數(shù)據(jù)分析兩種方式,從診療過程中、醫(yī)保結(jié)算前到醫(yī)保結(jié)算后,為醫(yī)生、質(zhì)控員、編碼員和醫(yī)保處提供全流程、全方位的醫(yī)保支付管理服務(wù)。該系統(tǒng)成功助力中國人保財(cái)險(xiǎn)完成核賠風(fēng)控AI醫(yī)療審核系統(tǒng)的全國性部署。
作為AGI技術(shù)的先行者,云知聲始終致力于以專業(yè)大模型和全棧自研AI技術(shù)解決產(chǎn)業(yè)核心問題。山海醫(yī)療大模型在三大核心評(píng)測(cè)維度的全能奪冠,標(biāo)志著其技術(shù)體系實(shí)現(xiàn)了從底層認(rèn)知、多模態(tài)理解到上層智能體執(zhí)行的全棧式、一體化突破,為醫(yī)療AI的深度臨床應(yīng)用樹立了新的標(biāo)桿。
未來,云知聲將繼續(xù)深耕醫(yī)療AI領(lǐng)域,持續(xù)推動(dòng)更加安全、可靠、智慧的醫(yī)療AI解決方案在廣泛場(chǎng)景中落地應(yīng)用,賦能醫(yī)療服務(wù)體系的質(zhì)量與效率升級(jí),為助力健康中國建設(shè)貢獻(xiàn)堅(jiān)實(shí)的科技力量。
剛剛,云知聲正式推出醫(yī)療領(lǐng)域?qū)<壹?jí)大模型全新力作——“山海?知醫(yī)大模型5.0”。
4分鐘前12月19日晚,順豐控股披露11月經(jīng)營簡報(bào),公司實(shí)現(xiàn)營業(yè)收入271.73億元,同比增長7.85%。
2天前AI技術(shù)與教育場(chǎng)景的深度融合已成為確定性趨勢(shì),政策支持與消費(fèi)升級(jí)共同催生教育智能硬件藍(lán)海市場(chǎng)。
3天前12月18日,由中國音像與數(shù)字出版協(xié)會(huì)游戲出版工作委員會(huì)主辦的2025產(chǎn)業(yè)趨勢(shì)發(fā)展論壇成功舉辦,游族...
3天前質(zhì)譜成像技術(shù)作為一種融合質(zhì)譜分析與影像解析的先進(jìn)分子成像方法,能夠在精準(zhǔn)獲取樣本化合物含量信息的同時(shí)...
2025-09-23作為此次與移拜騎行戰(zhàn)略合作的核心人物,萬俊雄先生的行業(yè)履歷與背后金沙江資本的實(shí)力,成為市場(chǎng)關(guān)注的焦點(diǎn)...
2025-09-23在全球經(jīng)濟(jì)格局充滿不確定性的2025年,貴金屬投資已成為眾多投資者避險(xiǎn)保值的重要選擇。
2025-09-23本次IPO上市公開發(fā)售部分,獲超額認(rèn)購約3316.5倍,市場(chǎng)認(rèn)購熱情凸顯投資者對(duì)公司發(fā)展前景的認(rèn)可。
2025-09-23兩天時(shí)間里,論壇吸引了來自42個(gè)國家的逾13,000名與會(huì)者,匯聚460余名政府官員、未來學(xué)家、城市...
2025-09-23Robo.ai Inc. (NASDAQ: AIIO)今日宣布與JW集團(tuán)在阿聯(lián)酋計(jì)劃合資設(shè)立商用車企...
2025-09-22十一黃金周不僅是旅游消費(fèi)的旺季,也正逐漸成為家居煥新的重要契機(jī)。
2025-09-22國無防不立,民無防不安。
2025-09-22今年早些時(shí)候,中東局勢(shì)開始升級(jí),市場(chǎng)整裝等候司空見慣的連鎖反應(yīng):先是引發(fā)對(duì)于供應(yīng)中斷的擔(dān)憂、接著原油...
2025-09-22投資家網(wǎng)(www.hbzbj.cn)是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。
