摘要:12月3日,由「AI教母」李飛飛聯(lián)合創(chuàng)辦的WorldLabs發(fā)布了他們的第一個「空間智能」模型,只需一張圖,就可以生成一個逼真的3D世界。
12月3日,由「AI 教母」李飛飛聯(lián)合創(chuàng)辦的 World Labs 發(fā)布了他們的第一個「空間智能」模型,只需一張圖,就可以生成一個逼真的 3D 世界。
World Labs 是李飛飛老師和她的學生們在2024年初創(chuàng)辦的一家空間智能公司,致力于構建大型世界模型(LWM)來感知、生成 3D 世界并與之交互。
據(jù)介紹,對于輸入的圖像,這一「空間智能」系統(tǒng)可以估算出 3D 幾何圖形,填充場景中未見的部分,創(chuàng)建新的內(nèi)容,實現(xiàn)各個方位的 3D 世界構建。
大多數(shù)生成模型預測像素,而預測 3D 場景則有諸多好處。預測3D場景可以實現(xiàn)持久現(xiàn)實,世界一旦生成,就會一直存在,即使你把視線移開,再回來時,場景也不會改變;同時,預測3D場景可以實現(xiàn)實時控制,生成場景后,你可以在場景中實時移動,你可以留心觀察一朵花的細節(jié),也可以窺探某個角落,看看會有什么發(fā)現(xiàn);預測3D場景使得生成的世界擁有正確的幾何形狀,符合 3D 幾何的基本物理規(guī)則,它們具有一種實體感和深度感,這與某些人工智能生成視頻的不真實感形成了鮮明的對比。
與生成式 AI 工具生成的圖片或視頻等 2D 內(nèi)容不同,李飛飛的世界模型以 3D 形式生成的內(nèi)容具有更好的控制性和一致性。而且,該模型還可以適應各種場景類型和藝術風格,比如生成不同的相機效果、3D 效果以及經(jīng)典繪畫風格的 3D 內(nèi)容。
這將改變我們制作電影、游戲、模擬器和其他物理世界數(shù)字表現(xiàn)形式的方式。
世界模型的火熱應用場景
世界模型的潛在應用范圍極為廣泛,不同領域?qū)τ谄淅斫馀c預測能力有著差異化的要求。
以自動駕駛為例,世界模型需要實時精準地把握道路狀況,并對其變化趨勢進行精確預測,重點聚焦于對環(huán)境的瞬時感知以及復雜變化趨勢的預估判斷。在機器人技術領域,世界模型對于導航、物體識別檢測以及任務規(guī)劃等關鍵任務起著不可或缺的作用,要求其能夠精準地解析外部動態(tài)環(huán)境,并構建具有交互性和實體體驗感的環(huán)境場景。而在虛擬社會系統(tǒng)模擬方面,世界模型需要敏銳地捕捉并預測更為抽象的行為動態(tài),諸如社會交往互動以及人類決策制定等過程。
(一)泛機器人領域:技術創(chuàng)新引領變革
1、極佳科技:自動駕駛的先鋒力量
極佳科技致力于推動視頻生成和4D世界模型走向空間智能,是國內(nèi)最早開始探索和布局世界模型和空間智能方向的公司,在物理空間和虛擬空間兩方面都已取得顯著的技術和商業(yè)進展,獲得了行業(yè)廣泛的認可。
在自動駕駛領域公司斬獲了令人矚目的創(chuàng)新性成果。10月,公司官宣聯(lián)合中國科學院自動化研究所、理想汽車、北京大學、慕尼黑工業(yè)大學等單位提出DriveDreamer4D,是首個利用世界模型增強4D駕駛場景重建效果的工作。DriveDreamer4D可以大幅提升多種自動駕駛4D重建算法的效果,在user study實驗中獲得了超過80%的偏好投票,為走向空間智能和4D世界模型邁出了堅實的一步。
DriveDreamer4D可以為駕駛場景提供豐富多樣的視角(包括變道、加速和減速等)數(shù)據(jù),以增加動態(tài)駕駛場景下的閉環(huán)仿真能力。
DriveDreamer4D利用世界模型作為數(shù)據(jù)引擎,基于真實世界的駕駛數(shù)據(jù)合成新軌跡視頻(例如變道場景)。DriveDreamer4D不僅可以提升多種重建算法(PVG,S3Gaussian,Deformable-GS)的圖像渲染質(zhì)量,還可以提升駕駛前景(車輛)和背景(車道線)的時空一致性。
比如,它能夠全面精準地模擬車輛行駛過程中的各種物理運動、交通規(guī)則以及其他道路使用者的行為變化。不僅能夠精準預測前方車輛的行駛軌跡、行人的行動意圖,還能將周圍環(huán)境因素,如道路狀況、天氣影響等納入綜合考量范圍,基于極佳科技 4D 數(shù)據(jù)引擎訓練的自動駕駛算法都能迅速且精準地做出反應,有效避免事故發(fā)生,為駕乘者提供前所未有的安全保障。
憑借其在技術上的領先優(yōu)勢,極佳科技已成功與地平線、億咖通等頭部主機廠達成深度定點合作協(xié)議。這一系列合作不僅是對其技術實力的高度認可,更是其邁向更廣闊市場的堅實基石。
在近日舉辦的現(xiàn)代汽車集團創(chuàng)新計劃頒獎典禮上,極佳視界憑借其在4D世界模型和視頻生成領域的卓越創(chuàng)新,榮膺現(xiàn)代集團“燈塔”創(chuàng)新開放計劃“創(chuàng)新企業(yè)獎”。
2、51sim:傳統(tǒng)巨頭的轉(zhuǎn)型之路
51sim 在自動駕駛仿真技術領域擁有深厚的歷史積淀與廣泛的市場影響力。長期以來,其傳統(tǒng)仿真技術產(chǎn)品以成熟穩(wěn)定的架構和性能,為眾多自動駕駛研發(fā)企業(yè)提供了可靠的基礎測試環(huán)境與數(shù)據(jù)支持,在特定場景模擬與簡單算法驗證方面積累了豐富的實踐經(jīng)驗,也因此贏得了一大批忠實客戶的信賴。
然而,隨著自動駕駛技術的飛速發(fā)展,行業(yè)對仿真技術提出了更為嚴苛的要求,傳統(tǒng)仿真技術的局限性逐漸暴露無遺。在數(shù)據(jù)的實時性與準確性方面,傳統(tǒng)技術難以滿足日益復雜多變的自動駕駛場景需求。
此外,面對復雜環(huán)境與極端情況的模擬,傳統(tǒng)仿真技術更是顯得力不從心。諸如暴雨、大雪等惡劣天氣條件下的路況模擬,以及道路施工、交通事故等特殊場景的應對,傳統(tǒng)技術往往無法提供足夠真實、全面的虛擬測試環(huán)境,這在很大程度上制約了自動駕駛技術的進一步突破。
為了應對新興技術的沖擊與市場競爭的加劇,51sim 積極謀求轉(zhuǎn)型與創(chuàng)新。其現(xiàn)核心產(chǎn)品涵蓋智能駕駛與機器人仿真平臺 SimOne、數(shù)據(jù)閉環(huán)與合成數(shù)據(jù)平臺 DataOne、交通信息模型平臺 TIM。通過這些努力,51sim 致力于構建通用 AGI 合成數(shù)據(jù)與仿真訓練平臺,以更好地適應復雜多變的真實環(huán)境和高階且多元化的需求。
(二)泛元宇宙領域:多元競爭塑造未來
1、 極佳科技:工業(yè)級元宇宙的領軍者
在泛元宇宙領域,極佳科技憑借其工業(yè)級的新一代 4D 內(nèi)容制作引擎,穩(wěn)坐行業(yè)領軍者的寶座。這一引擎專為影視傳媒、游戲開發(fā)、工業(yè)設計等專業(yè)領域的嚴苛需求而量身定制,具備強大的大規(guī)模虛擬內(nèi)容創(chuàng)作能力,能夠輕松應對各種復雜的創(chuàng)作任務。
極佳科技的核心優(yōu)勢在于其對工業(yè)級應用的深度聚焦與精湛把控。在影視制作過程中,它能夠為創(chuàng)作者提供無與倫比的高精度虛擬場景構建服務,無論是繁華都市的車水馬龍,還是神秘外星的奇幻地貌,都能以極致的細節(jié)呈現(xiàn)。同時,其逼真的特效制作與細膩的角色動畫生成能力更是令人贊嘆不已。
例如,在制作一部史詩級科幻電影時,極佳科技的 4D 內(nèi)容制作引擎能夠精準地模擬光線追蹤、物理碰撞等特效,使影片的視覺效果達到以假亂真的境界,為觀眾帶來震撼人心的觀影體驗。
其與悟空傳媒、儒意傳媒等行業(yè)巨頭的戰(zhàn)略合作,更是進一步彰顯了其在影視傳媒領域的王者風范。通過強強聯(lián)合,極佳科技不僅推動了自身技術的廣泛應用,還引領了整個行業(yè)的內(nèi)容創(chuàng)作模式向智能化、高效化方向轉(zhuǎn)型升級,為影視行業(yè)的創(chuàng)新發(fā)展注入了強大動力。
2、 可靈:快手旗下的爆款生成器
可靈,作為快手公司精心培育的基于人工智能的視頻生成模型,在泛元宇宙的視頻生成領域可謂是一顆耀眼的明星。其最為突出的亮點在于超長視頻生成能力,能夠輕松生成長達 2 分鐘的視頻,這一卓越性能使其在眾多競爭對手中脫穎而出。
在生成 3D 動畫內(nèi)容時,可靈對細節(jié)的處理堪稱一絕。例如,在呈現(xiàn)動畫角色的毛發(fā)、紋理等細節(jié)時,能夠達到高度逼真的效果,仿佛賦予了虛擬角色鮮活的生命。據(jù)摩根士丹利專業(yè)分析,可靈的技術實力足以與日本的 Sora 模型相媲美,這無疑為其在市場競爭中贏得了極高的聲譽與強大的競爭力。
從業(yè)務數(shù)據(jù)來看,可靈 AI 成績斐然,實現(xiàn)了月活超 150 萬的亮眼成績,商業(yè)化單月流水更是突破千萬人民幣。在內(nèi)容創(chuàng)作實戰(zhàn)中,可靈 AI 為短劇《山海奇鏡之劈波斬浪》提供了深度技術支撐,該劇上線短短數(shù)日播放量便如火箭般突破 5000 萬,創(chuàng)造了短劇播放量的新奇跡。這充分展示了可靈在視頻生成與內(nèi)容創(chuàng)作方面的強大實力,也有力地證明了其對提升快手平臺用戶規(guī)模和活躍度的關鍵作用,成為快手在泛元宇宙領域布局的重要戰(zhàn)略棋子。
3、即夢:字節(jié)跳動的創(chuàng)意引擎
即夢,作為字節(jié)跳動重磅推出的 AI 創(chuàng)作平臺,以其豐富多樣的功能和便捷流暢的創(chuàng)作體驗,迅速吸引了廣大創(chuàng)作者的目光與青睞。該平臺匯聚了文生圖、文生視頻、圖生視頻等多種前沿創(chuàng)作功能于一體,為用戶精心打造了一站式的創(chuàng)意與藝術創(chuàng)作解決方案,仿佛一座創(chuàng)意的寶藏庫,等待用戶去挖掘探索。
尤為值得一提的是,即夢高度注重為用戶提供創(chuàng)作靈感源泉。通過提供豐富多樣的創(chuàng)意模板、素材庫以及智能靈感啟發(fā)工具,幫助用戶輕松突破創(chuàng)作瓶頸,激發(fā)無限創(chuàng)意潛能。即使是毫無專業(yè)創(chuàng)作經(jīng)驗的新手用戶,也能在即夢的助力下迅速將腦海中的奇思妙想轉(zhuǎn)化為令人驚艷的可視化作品。
盡管在視頻生成長度上暫時略遜于可靈,但即夢憑借其強大的綜合性創(chuàng)作功能和字節(jié)跳動的龐大平臺生態(tài)優(yōu)勢,在競爭激烈的市場中成功占據(jù)了一席之地。例如,用戶在其平臺上只需簡單輸入一段文字描述,即可借助先進的 AI 技術瞬間生成精美的圖片或視頻作品,無論是用于社交媒體分享、個人創(chuàng)意展示,還是商業(yè)宣傳推廣,都能輕松駕馭。
11 月 8 日,字節(jié)跳動自研的視頻生成模型 Seaweed 面向即夢平臺用戶正式開放,這無疑為即夢的創(chuàng)作工具庫增添了一把利器,使其在視頻生成領域的競爭力得到進一步顯著提升,續(xù)寫著字節(jié)跳動在人工智能創(chuàng)作領域的輝煌篇章。
4、其他消費級選手:個性化體驗的追求者
消費級的 sora、生數(shù)科技、愛詩科技等企業(yè)在泛元宇宙領域同樣展現(xiàn)出了各自獨特的魅力與創(chuàng)新活力。這些企業(yè)精準聚焦個性化的內(nèi)容創(chuàng)作和消費體驗提升,憑借先進的圖像生成、動畫制作等前沿技術,為用戶精心打造定制化的虛擬形象、獨具匠心的場景創(chuàng)作工具以及個性化的內(nèi)容生成服務,致力于滿足用戶對于個性化、新奇元宇宙體驗的不懈追求。
愛詩科技由前字節(jié)跳動視覺技術核心負責人創(chuàng)立,在技術研發(fā)創(chuàng)新的道路上一路疾馳。今年 10 月 29 日,其正式發(fā)布 Pixverse V3 版,彰顯了其強大的技術迭代更新能力。
生數(shù)科技作為國內(nèi)最早布局多模態(tài)通用大模型的先驅(qū)團隊之一,聯(lián)合清華大學重磅發(fā)布了國內(nèi)首款全面對標 OpenAI Sora 的視頻大模型 Vidu,并在 11 月迅速推出 Vidu 1.5 新版本,成功實現(xiàn)了對多樣化輸入的深度理解和“一致性”難題的重大突破。
這些企業(yè)在消費級市場中,通過持續(xù)不斷的技術創(chuàng)新和產(chǎn)品優(yōu)化,為用戶帶來了豐富多彩的個性化元宇宙體驗,但在大規(guī)模工業(yè)級應用的復雜場景與高精度要求面前,仍存在一定的差距。
總體來看,世界模型的構建絕非坦途,它面臨著諸多技術難題,如如何高效地整合多源異構數(shù)據(jù),怎樣構建精準且可擴展的知識表示體系,以及如何在有限的計算資源下實現(xiàn)復雜的推理與預測功能等。但這并不能阻擋世界模型成為人工智能發(fā)展的終極追求方向。它如同遠方的燈塔,吸引著眾多研究者與科技企業(yè)不斷探索創(chuàng)新,努力突破技術瓶頸。每一次對世界模型相關技術的攻克與優(yōu)化,都將使人工智能更接近能夠像人類一樣理解和融入世界的理想境界,為開啟智能時代的新紀元奠定堅實基礎。
2025年烏鎮(zhèn)青少年科技嘉年華·燃冬季于12月5日在烏鎮(zhèn)互聯(lián)網(wǎng)之光博覽中心正式啟幕。
2天前據(jù)悉,多模態(tài)AI企業(yè)智象未來近日完成A+輪融資,京東集團、金華市金婺賦能基金聯(lián)合參投,資金將用于核心...
2天前2025年12月,未來五年國際電動海事協(xié)會(IEMA)將與廣東省游艇行業(yè)協(xié)會(GYIA)以及廣東鴻威...
2天前近日,江西政安消防有限公司(以下簡稱“政安消防”)正式宣布完成2000萬元人民幣的A輪融資。
3天前簡訊,成都好獵優(yōu)科技有限公司(簡稱:好獵優(yōu))于2025年12月17日獲5000萬元天使輪融資,由國內(nèi)...
3天前當下全國流感進入高流行水平,兒童聚集性疫情占比超六成,呼吸道用藥需求激增。
5天前12月9日,奈雪的茶旗下明星單品“瘦瘦小綠瓶”蔬果茶獲全球咨詢機構CIC灼識權威認證,被正式授予“行...
5天前初冬時節(jié),涪陵區(qū)江北街道、珍溪鎮(zhèn)、百勝鎮(zhèn)等青菜頭主產(chǎn)區(qū)一派生機。
5天前2025年黃金、白銀等貴金屬作為傳統(tǒng)的避險資產(chǎn),正吸引越來越多國內(nèi)投資者的目光。
5天前TCL科技(000100.SZ)今日公告,擬以現(xiàn)金60.45億元收購控股子公司深圳市華星光電半導體顯...
5天前近日,在2025 Morketing Awards靈眸獎頒獎典禮上,歡聚集團(JOYY Inc.)旗...
5天前2025年12月14日,匯正財經(jīng)2026年度資本市場策略會在上海成功舉辦。
5天前30多歲的年紀,卻管理著十幾億資產(chǎn),還連續(xù)創(chuàng)造了全球頂尖的投資回報。
5天前投資家網(wǎng)(www.hbzbj.cn)是國內(nèi)領先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務,包括行業(yè)媒體、智庫服務、會議服務及生態(tài)服務。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。
