摘要:10月17日消息,HuggingFace官網顯示,百度昨晚發布的自研多模態文檔解析模型PaddleOCR-VL,發布20小時內即登頂HuggingFaceTrending全球第一。
10月17日消息,HuggingFace官網顯示,百度昨晚發布的自研多模態文檔解析模型PaddleOCR-VL,發布20小時內即登頂HuggingFace Trending全球第一。
據了解,該模型核心參數僅0.9B,輕量高效,能以極低計算開銷精準識別文本、手寫漢字、表格、公式、圖表等復雜元素,支持109種語言。在權威榜單OmniBenchDoc V1.5中,它以92.6分獲綜合性能全球第一,四大核心能力全線SOTA,超越GPT-4o等模型,刷新OCR VL模型性能紀錄。
作為文心4.5衍生模型,PaddleOCR-VL融合了NaViT動態分辨率視覺編碼器與ERNIE-4.5-0.3B語言模型,實現精度與效率雙突破。

TCL科技(000100.SZ)今日公告,擬以現金60.45億元收購控股子公司深圳市華星光電半導體顯...
4小時前近日,在2025 Morketing Awards靈眸獎頒獎典禮上,歡聚集團(JOYY Inc.)旗...
4小時前12月15日,商湯科技基于在生成式AI與多模態交互領域的技術積累,正式發布Seko2.0——行業首個...
10小時前7月29日,2025世界人工智能大會(WAIC)期間,由是石科技主辦的“算力為基——并行優化與行業模...
2025-07-30此次戰略合作,雙方將充分利用健安適科研優勢與美團的渠道資源,深度協同、有機融合健康科技與生活場景,定...
2025-07-30投資家網(www.hbzbj.cn)是國內領先的資本與產業創新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創業企業、地方政府等提供專業的第三方信息服務,包括行業媒體、智庫服務、會議服務及生態服務。長按右側二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。
