摘要:近日,多模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績(jī)登頂榜首,力壓GPT-4V,充分彰顯其硬核實(shí)力。
近日,多模態(tài)人工智能模型基準(zhǔn)評(píng)測(cè)集MMMU更新榜單,云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績(jī)登頂榜首,力壓GPT-4V,充分彰顯其硬核實(shí)力。

作為國(guó)內(nèi)權(quán)威多模態(tài)基準(zhǔn)評(píng)測(cè),MMMU由IN.AI Research等多家機(jī)構(gòu)聯(lián)合構(gòu)建,專注于考量人工智能在解決大學(xué)層次多學(xué)科問題時(shí)的多模態(tài)理解與推理能力。
該評(píng)測(cè)集涉及藝術(shù)與設(shè)計(jì)、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會(huì)科學(xué)、技術(shù)與工程等六個(gè)常見學(xué)科,包含 1.15 萬個(gè)精心選取的多模態(tài)問題,涵蓋 30 個(gè)不同的科目和183 個(gè)子領(lǐng)域。同時(shí),MMMU 中許多問題都需要專家級(jí)的推理能力,例如,使用傅立葉變換或均衡理論來推導(dǎo)問題的解,這在滿足評(píng)測(cè)內(nèi)容廣泛性的同時(shí),也確保了其深度。
此外,MMMU還提出了兩個(gè)獨(dú)特的挑戰(zhàn):一是其涵蓋多種圖像格式,從照片和繪畫等視覺場(chǎng)景到圖表和表格,可用于測(cè)試 LMM 的感知能力;二是MMMU的輸入形式是文本和圖像的混合,要求AI模型能夠?qū)D像和文本信息結(jié)合起來進(jìn)行深入理解,并在此基礎(chǔ)上執(zhí)行復(fù)雜推理。這不僅考驗(yàn)了模型的學(xué)科知識(shí)儲(chǔ)備,也對(duì)其綜合分析和應(yīng)用能力提出了更高要求。
評(píng)測(cè)結(jié)果顯示,云知聲山海多模態(tài)大模型UniGPT-mMed以總分57的優(yōu)異成績(jī)登頂榜首,并在健康與醫(yī)學(xué)細(xì)分賽道超越GPT-4V,力壓一眾大模型拔得頭籌,充分展現(xiàn)出其在擁有業(yè)內(nèi)一流的通用能力之外,更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

UniGPT-mMed是云知聲基于山海大模型底座構(gòu)建的多模態(tài)大模型。其通過分析和整合海量論文、書籍及網(wǎng)站數(shù)據(jù),利用精細(xì)化數(shù)據(jù)處理技術(shù),自動(dòng)識(shí)別并提取圖片及其相關(guān)文本描述,并通過多模態(tài)分析技術(shù)評(píng)估圖片的質(zhì)量和圖文之間的匹配度,篩選出最優(yōu)數(shù)據(jù)。與此同時(shí),系統(tǒng)能夠參考圖片和上下文信息對(duì)圖片進(jìn)行重新描述,使得圖文數(shù)據(jù)更加對(duì)齊。
通過預(yù)設(shè)問答場(chǎng)景,UniGPT-mMed能夠?qū)D文對(duì)齊數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的場(chǎng)景問答數(shù)據(jù)集,并采用思維鏈和自我反思技術(shù),進(jìn)一步優(yōu)化生成數(shù)據(jù),最終構(gòu)建起一個(gè)包含數(shù)億條高質(zhì)量圖文問答的數(shù)據(jù)集,進(jìn)而為用戶提供更加豐富、準(zhǔn)確和可靠的信息檢索和問答服務(wù)。
此次評(píng)測(cè),是云知聲在多模態(tài)大模型賽道持續(xù)深耕、不斷技術(shù)創(chuàng)新的成果體現(xiàn)。
作為中國(guó)AGI技術(shù)產(chǎn)業(yè)化的先行者,云知聲于2016年開始打造Atlas人工智能基礎(chǔ)設(shè)施,并以此為基礎(chǔ),構(gòu)建云知大腦(UniBrain)技術(shù)中臺(tái)——以山海(UniGPT)通用認(rèn)知大模型為核心,結(jié)合多模態(tài)感知與生成、知識(shí)圖譜、物聯(lián)平臺(tái)等智能組件,為云知聲智慧物聯(lián)、智慧醫(yī)療、智慧座艙、智慧交通等業(yè)務(wù)提供高效的產(chǎn)品化支撐,持續(xù)推動(dòng)“U(云知大腦)+X(應(yīng)用場(chǎng)景)”戰(zhàn)略布局,致力推動(dòng)千行百業(yè)的智慧化升級(jí)。
作為云知大腦的核心,山海大模型具備語言生成、語言理解、知識(shí)問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項(xiàng)通用能力及插件擴(kuò)展、領(lǐng)域增強(qiáng)、企業(yè)定制三項(xiàng)行業(yè)落地能力,能夠滿足更多場(chǎng)景的應(yīng)用需求。今年8月,云知聲推出山海多模態(tài)大模型,通過整合跨模態(tài)信息,山海多模態(tài)大模型能夠接收文本、音頻、圖像等多種形式作為輸入,并實(shí)時(shí)生成文本、音頻和圖像的任意組合輸出,帶來實(shí)時(shí)多模態(tài)擬人交互體驗(yàn),開啟AGI新范式。
目前,山海大模型已相繼在OpenCompass大模型評(píng)測(cè)、SuperCLUE中文大模型基準(zhǔn)測(cè)評(píng)、MedBench評(píng)測(cè)、Flageval大模型評(píng)測(cè)、SuperBench等多個(gè)權(quán)威評(píng)測(cè)中屢創(chuàng)佳績(jī),穩(wěn)居國(guó)內(nèi)大模型第一梯隊(duì);在醫(yī)療專業(yè)能力上,其基于山海大模型孵化的醫(yī)療大模型在CCKS 2023 PromptCBLUE醫(yī)療大模型評(píng)測(cè)中奪得通用賽道一等獎(jiǎng),并在MedBench評(píng)測(cè)中位列全球第一,各項(xiàng)指標(biāo)全面超越GPT-4。
登頂MMMU評(píng)測(cè)榜,充分印證了云知聲山海多模態(tài)大模型在通用能力、專業(yè)能力層面的突出實(shí)力,也將鞭策云知聲持續(xù)迭代多模態(tài)大模型技術(shù)底座,實(shí)現(xiàn)大模型技術(shù)在多領(lǐng)域場(chǎng)景下的滲透和應(yīng)用,以技術(shù)創(chuàng)新為各行各業(yè)帶來更多智能化變革。
2025我國(guó)AI核心產(chǎn)業(yè)將破萬億,現(xiàn)存相關(guān)企業(yè)超491萬家
1天前本次論壇的成功舉辦,正是張江機(jī)器人谷全鏈條產(chǎn)業(yè)生態(tài)與創(chuàng)新生態(tài)的集中體現(xiàn)。
4天前12月11日,華為正式公布兩項(xiàng)鴻蒙電腦新進(jìn)展——華為擎云 HM740以及鴻蒙電腦專業(yè)版操作系統(tǒng)發(fā)布。
2025-12-11iRobot深陷危機(jī)或易主中國(guó),國(guó)內(nèi)現(xiàn)存機(jī)器人相關(guān)企業(yè)超102.2萬家
2025-12-102025年07月16日-17日,以“穿越變革浪潮,共筑經(jīng)濟(jì)韌性”為主題的CFS 第十四屆財(cái)經(jīng)峰會(huì)暨2...
2025-07-24在娛樂內(nèi)容蓬勃發(fā)展的當(dāng)下,綜藝節(jié)目已成為品牌營(yíng)銷的重要陣地。
2025-07-24月11日至12日,由上市公司俱樂部主辦,銘辰集團(tuán)、東虹橋中心、初華資本等9家頂級(jí)機(jī)構(gòu)聯(lián)合協(xié)辦的「并購(gòu)...
2025-07-247月20日,“2025中牟郎酒品牌日”在河南中牟召開。中國(guó)郎七大戰(zhàn)略產(chǎn)品盛裝亮黃河之濱,近600名商...
2025-07-242025年7月22日,一場(chǎng)匯聚科技與法律智慧的盛會(huì)在北京百度總部拉開帷幕。
2025-07-24伴隨文化消費(fèi)市場(chǎng)持續(xù)升溫,文創(chuàng)產(chǎn)業(yè)正成為經(jīng)濟(jì)增長(zhǎng)新引擎。
2025-07-24盛夏,戶外熱浪翻涌,而杭州低碳科技館內(nèi)卻人潮涌動(dòng),一場(chǎng)別開生面的暑期科技之旅正在這里舉行。
2025-07-24投資家網(wǎng)(www.hbzbj.cn)是國(guó)內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺(tái)。為活躍于中國(guó)市場(chǎng)的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù),包括行業(yè)媒體、智庫服務(wù)、會(huì)議服務(wù)及生態(tài)服務(wù)。長(zhǎng)按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動(dòng),趕快行動(dòng)吧。
