国产精品视频在线免费观看_免费久久久一本精品久久区_国产精品麻豆免费版_久久天堂国产精品_欧美日韩亚洲在线_日韩hmxxxx_国产有色视频色综合_国严精品久久久久久亚洲影视_色播亚洲婷婷_亚洲毛片aa

更多精彩 >

趨境科技發(fā)布,首創(chuàng)“以存換算”和“全系統(tǒng)推理架構(gòu)”,助力企業(yè)高趨境科技

2024-10-12 16:02:54   來源:投資家網(wǎng)  作者: 

摘要:隨著大模型,尤其是開源大模型的持續(xù)進化,具備復雜推理能力的模型正在逐步應用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。

隨著大模型,尤其是開源大模型的持續(xù)進化,具備復雜推理能力的模型正在逐步應用于各行各業(yè),并展現(xiàn)出超越人類專家的潛力。得益于此,未來的算力建設將更加聚焦于推理場景,而不僅僅是訓練算力。

華福證券的研究指出,到2027年,推理端的人工智能服務器預計將占整體工作負載的72.6%。同時,OpenAI o1 所代表的大模型推理場景的 Scaling Law 也進一步助推了這一趨勢的加速發(fā)展。

然而,盡管模型的效果有了顯著的提升,數(shù)百億參數(shù)、上百萬上下文的一線模型在實際部署中仍面臨高成本和低效率的挑戰(zhàn)。這一現(xiàn)象導致了難以破解的“不可能三角”。

 

image.png

 

為了應對這一困境,亟需新型推理架構(gòu),打破傳統(tǒng)主要為訓練場景設計,以高端 GPU 為中心的算力架構(gòu)設計思路。

在此背景下,趨境科技推出了“大模型知識推理一體機”,其搭載的業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)能夠通過協(xié)同存儲、CPU、GPU、NPU等多種設備,充分釋放異構(gòu)算力,將推理成本降低10倍以上。

 

image.png

 

這一創(chuàng)新為企業(yè)實現(xiàn)大模型的高效落地提供了全新選擇,開啟了通向“推理自由”的新途徑。

趨境大模型知識推理一體機不僅支持本地部署數(shù)百億級別的一線大模型,還提供開放的API接口,便于第三方靈活調(diào)用。同時,用戶可根據(jù)需求定制企業(yè)智能助手(assistant/copilot),實現(xiàn)真正的“開箱即用”。

協(xié)同 HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設備,充分釋放異構(gòu)存力和算力資源

與當前行業(yè)主要針對 GPU 算力利用率進行單點優(yōu)化的傳統(tǒng)方案相比,趨境科技大模型知識推理一體機采用了業(yè)界首創(chuàng)的全系統(tǒng)推理架構(gòu)。

 

image.png

 

其通過“以存換算”技術(shù)釋放存力作為算力的補充,降低對算力的需求;同時采用“異構(gòu)協(xié)同”的思路,緊密聯(lián)動 HBM/DRAM/SSD 和 CPU/GPU/NPU 全系統(tǒng)異構(gòu)設備,突破顯存容量的限制,充分釋放全系統(tǒng)的存力和算力。

這一創(chuàng)新方案突破了以往方案的理論優(yōu)化極限,實現(xiàn)了整合機器所有異構(gòu)算力資源的目標,使得推理吞吐量提升超過10倍,大幅降低了大模型的落地成本。

此外,據(jù)財通證券發(fā)布的行業(yè)深度分析報告統(tǒng)計顯示,國產(chǎn)GPU產(chǎn)品在單精度/半精度浮點算力、制程及顯存容量上都與英偉達有2-4倍的顯著差距。因此,僅依靠GPU單點優(yōu)化,短時間內(nèi)很難趕超英偉達GPU方案。

而采用全系統(tǒng)推理架構(gòu)可以大幅降低GPU性能差距的影響,顯著提升國產(chǎn)替代解決方案的競爭力,打破在大模型推理場景下國產(chǎn)GPU“卡脖子”的困境。

以存換算新范式,從“死記硬背”到“融合推理”

早期的大模型推理架構(gòu)將每次推理視為獨立請求,缺乏高效處理所需的“記憶”能力。盡管后續(xù)引入了近似問題緩存(Semantic Query Cache)和前綴緩存(Prefix KVCache Cache),但仍主要依賴于“死記硬背”。這些方案要求新問題與已處理問題高度一致才能利用緩存去降低算力需求。

針對這一問題,趨境科技創(chuàng)新性地設計了“融合推理(Fusion Attention)”技術(shù),即便是面對全新的問題也可以從歷史相關(guān)信息中提取可復用的部分內(nèi)容,與現(xiàn)場信息進行在線融合計算。這一技術(shù)顯著提升了可復用的歷史計算結(jié)果,進而降低了計算量。

 

image.png

 

通過這一新思路,趨境大模型知識推理一體機充分利用了存儲資源。采用“以存換算”的方式釋放存力作為對于算力的補充,在RAG場景中,響應延遲降低20倍,性能提升達10倍。

全系統(tǒng)異構(gòu)協(xié)同新架構(gòu),從GPU單點優(yōu)化到全系統(tǒng)協(xié)同優(yōu)化

除了通過“以存換算”降低算力需求外,趨境大模型知識推理一體機還進一步通過全系統(tǒng)異構(gòu)協(xié)同架構(gòu)設計,將來自存儲、CPU、GPU、NPU的算力高效融合,進一步提升大模型推理性能,降低成本。

此前,趨境科技與清華 KVCache.AI 團隊合作,開源了一部分異構(gòu)推理框架,項目名為“KTransformers”(GitHub鏈接:https://github.com/kvcache-ai/ktransformers),該開源框架僅需單個消費級 GPU 即可在本地運行 Mixtral 8x22B 和DeepSeek-Coder-V2 等千億級大模型,性能數(shù)倍于 Llama.cpp。

在長達 1M 的超長上下文推理任務中,成為業(yè)界首個僅需單 GPU 卡的高性能推理框架,生成速度達到 16.91 token/s,比 Llama.cpp 快10倍以上,同時維持接近滿分的“大海撈針”能力。

 

image.png

 

趨境科技大模型知識推理一體機采用的全系統(tǒng)推理架構(gòu)是基于“KTransformers”進一步完善的商業(yè)版本,在開源版的基礎上,協(xié)同性能更強,加入了多卡高并發(fā)調(diào)度、RAG支持等策略。經(jīng)過測試及客戶合作驗證,Prefill 和 Generate 性能大幅領(lǐng)先業(yè)界方案:

Prefill階段的 TTFT(響應延遲)相比業(yè)界方案快6倍以上

Generate階段的 TPOT(生成速度)相比業(yè)界方案快3.48倍以上

趨境x長亭:為安全大模型開啟千億大模型時代

國內(nèi)頂尖的網(wǎng)絡信息安全公司長亭科技,使用趨境科技提供的全系統(tǒng)異構(gòu)推理架構(gòu)技術(shù)策略,無縫銜接到其原有的“問津(ChaitinAI)安全大模型”、MSS 安全托管服務等產(chǎn)品中,問津(ChaitinAI)安全大模型升級為千億大模型,安全性能全方位升級:

核心指標攻擊識別準確率提升至95.8%,檢測時延降低至秒級。另外,其對漏洞的檢測能力增強,不僅提升漏洞發(fā)現(xiàn)數(shù)量,對應的修復建議也更準確,還能基于不同場景選擇更合適的工具和策略。同時,對不良內(nèi)容識別能力升級,準確率和召回率均有提升。安全報告內(nèi)容生成質(zhì)量和評分也顯著提高,綜合輸出更具健壯性和穩(wěn)定性。

此外,長亭科技的安全大模型的部署資源成本降低50%,助推其更多業(yè)務加入大模型能力。

技術(shù)的不斷進步和市場需求為大模型的未來發(fā)展提供了廣闊的空間。隨著算力基礎設施的不斷完善,提升算力的利用效率,使大模型能與更多的行業(yè)實踐結(jié)合起來,未來大模型將在更多行業(yè)中發(fā)揮更大的作用。

趨境目前也正在和更多的大模型應用廠商一同協(xié)作,希望助推全面智能化的到來。


猜你喜歡

2025我國AI核心產(chǎn)業(yè)將破萬億,現(xiàn)存相關(guān)企業(yè)超491萬家

天眼查智能+

2025我國AI核心產(chǎn)業(yè)將破萬億,現(xiàn)存相關(guān)企業(yè)超491萬家

6天前

商湯全面出擊,沖在「AI 國產(chǎn)化」第一線

商湯智能+

如果說 2025 年年初最火爆的 AI 話題是 DeepSeek R1,那么近日橫空出世的「摩爾線程...

2025-12-16

智能融合?協(xié)同共贏 | 卓益得全球合作伙伴大會暨張江機器人谷生態(tài)論壇圓滿舉辦

智能+張江機器人谷生態(tài)論壇

本次論壇的成功舉辦,正是張江機器人谷全鏈條產(chǎn)業(yè)生態(tài)與創(chuàng)新生態(tài)的集中體現(xiàn)。

2025-12-14

鴻蒙電腦專業(yè)版發(fā)布,智能安全開啟企業(yè)辦公效率新篇章

華為智能+

12月11日,華為正式公布兩項鴻蒙電腦新進展——華為擎云 HM740以及鴻蒙電腦專業(yè)版操作系統(tǒng)發(fā)布。

2025-12-11

iRobot深陷危機或易主中國,國內(nèi)現(xiàn)存機器人相關(guān)企業(yè)超102.2萬家

天眼查智能+

iRobot深陷危機或易主中國,國內(nèi)現(xiàn)存機器人相關(guān)企業(yè)超102.2萬家

2025-12-10

香港貴金屬交易平臺哪個最好?實力平臺有哪些?

金融科技貴金屬交易平臺

由于世界上的貴金屬儲量是一定的,所以貴金屬可以作為一種保值的工具。

2025-12-05

探路者發(fā)布第二代外骨骼:科技深耕與AI芯片賦能

上市公司探路者

當戶外探索遇上智能科技,行業(yè)邊界正被持續(xù)打破。2025年12月,探路者第二代下肢外骨骼在北京多家門店...

2025-12-05

華錫有色:深耕戰(zhàn)略金屬產(chǎn)業(yè),夯實高質(zhì)量發(fā)展根基

上市公司華錫有色

12月2日,由廣西北部灣國際港務集團有限公司(簡稱“北部灣港集團”)與廣西上市公司協(xié)會聯(lián)合主辦的“向...

2025-12-05

國內(nèi)交易期貨黃金的平臺哪個好?正規(guī)平臺開戶步驟解析

金融科技黃金交易平臺

全球通脹高企與經(jīng)濟波動加劇的2025年,黃金憑借其避險屬性與24小時交易機制,成為越來越多投資者資產(chǎn)...

2025-12-05

浩鯨科技”鯨智百應”獲甲子光年2025年度AI報告推薦

智能+浩鯨科技

在國內(nèi)知名科技產(chǎn)業(yè)智庫甲子光年主辦的「2025 甲子引力年終盛典」上,浩鯨科技憑借 AI Agent...

2025-12-05

AI中臺+智能體:賽博威以“生成式AI應用工廠”,驅(qū)動企業(yè)新增長

大消費賽博威

當一部分企業(yè)還在討論AI能做什么時,領(lǐng)先的大廠已經(jīng)悄悄完成了一場組織變革:HR、法務、營銷、財務等部...

2025-12-05

十年追光路,把腦機接口從實驗室?guī)У浆F(xiàn)實

智能+強腦科技

當前,腦機接口技術(shù)迎來爆發(fā)前夜。

2025-12-05

投資家網(wǎng)(www.hbzbj.cn)是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務,包括行業(yè)媒體、智庫服務、會議服務及生態(tài)服務。長按右側(cè)二維碼添加"投資哥"可與小編深入交流,并可加入微信群參與官方活動,趕快行動吧。

京杭對話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

京杭對話:杭州,憑什么吸引北京創(chuàng)新企業(yè)?

從一張精準的產(chǎn)業(yè)藍圖,到一個敏捷的創(chuàng)新操作系統(tǒng),再到一片豐沃的賦能土壤,杭州的生產(chǎn)性服務業(yè)正在這條路...

第19屆中國投資年會·有限合伙人峰會在滬成功舉辦

第19屆中國投資年會·有限合伙人峰會在滬成功舉辦

11月27日,由投中信息和投中網(wǎng)主辦的第19屆中國投資年會·有限合伙人峰會在上海舉辦。

“京杭聚勢,共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強音

“京杭聚勢,共啟新篇”:招商新路徑,奏響區(qū)域協(xié)同發(fā)展強音

在區(qū)域經(jīng)濟協(xié)同發(fā)展的大背景下,京杭兩地的經(jīng)濟協(xié)作正以一種全新的姿態(tài)加速推進。

第19屆中國投資年會·有限合伙人峰會即將在滬啟幕

第19屆中國投資年會·有限合伙人峰會即將在滬啟幕

作為中國股權(quán)投資領(lǐng)域備受矚目的年度盛會,第19屆中國投資年會·有限合伙人峰會定于2025年11月26...

投資家網(wǎng)主辦:“智造未來-人工智能與機器人”專場路演成功舉辦

投資家網(wǎng)主辦:“智造未來-人工智能與機器人”專場路演成功舉辦

投資家網(wǎng)聯(lián)合深圳市龍崗區(qū)人工智能(機器人)署于9月28日聯(lián)合主辦“智造未來——人工智能與機器人”專場...

正在播放一区二区三区| 日韩三级电影| 天天综合色天天综合色hd| 亚洲一区二区不卡视频| 欧美日韩综合网| 国产高清自拍一区| 91久久精品一区二区别| 中文字幕一区二区三区四区五区| 欧美福利一区二区三区| 亚洲欧洲国产精品久久| 97碰碰视频| 久久久久资源| 在线观看成人av电影| 国产精品一区二区三区在线观| 国产日本一区二区三区| 欧美日本韩国一区二区三区| 日韩精品一区二区三区色偷偷| 综合久久国产| 日本精品一区二区三区视频| 成人黄动漫网站免费| 欧洲成人一区二区| 国产精品视频入口| 在线精品亚洲一区二区| 日韩经典在线视频| 蜜桃视频在线观看成人| 成人动漫在线观看视频| 91精品入口蜜桃| 亚洲欧洲精品在线| 日本不卡一区二区三区在线观看 | 亚洲精品在线免费看| 日韩高清国产精品| 欧美日韩在线播放一区二区| 国产98在线|日韩| 97中文在线观看| 一区二区三区四区国产| 中文网丁香综合网| 成人91视频| 久久99精品久久久久久秒播放器 | ts人妖另类在线| 亚洲欧美日本国产有色| 在线一区亚洲| 椎名由奈jux491在线播放| 日韩精品一区二区三区色偷偷| 欧美一区免费视频| 国产伦精品一区二区| 午夜精品一区二区三区在线观看| 奇米影视首页 狠狠色丁香婷婷久久综合| 51国偷自产一区二区三区的来源 | 91免费看蜜桃| www日韩av| 蜜桃视频在线观看成人| 日韩中文一区二区三区| 99在线视频首页| 欧美日韩一区在线观看视频| 伊人久久婷婷色综合98网| 国产九色精品| 日韩免费av电影| 91久久精品一区二区别| 日本一区免费| 福利视频久久| 亚洲欧美日本国产有色 | 日韩理论片在线观看| 影音欧美亚洲| 日韩午夜视频在线观看| 不卡的av一区| 一个色的综合| 亚洲精品自在在线观看| 色狠狠久久av五月综合| 无遮挡亚洲一区| 日韩av电影免费在线观看| 开心色怡人综合网站| 九色综合婷婷综合| 久久久精彩视频| 狠狠色噜噜狠狠狠狠色吗综合| 自拍另类欧美| 国产高清一区视频| 精品中文字幕人| 国产精品对白一区二区三区| 成人欧美一区二区| 国产日韩欧美亚洲一区| 国内外成人免费视频| 久久99国产精品| 色999五月色| 99免费在线视频观看| 久久精品国产美女| 91精品国自产在线观看 | 国产高清精品一区二区三区| 粉嫩av四季av绯色av第一区| 国产精品手机在线| 欧美激情第一页在线观看| 欧美二级三级| 99re在线观看视频| 欧美一区二区综合| 国产伦精品一区二区三区免| 日韩精品一区二区三区外面| 国产精品污www一区二区三区| 蜜桃久久影院| 国产一区二区三区高清| 亚洲在线播放电影| 久久久一本精品99久久精品| 91在线播放视频| 日本一区二区在线| 蜜桃麻豆91| 欧美日韩免费高清| 精品国产二区在线| 成人激情直播| 一本一道久久a久久精品综合| 极品尤物一区二区三区| 一区二区日本伦理| 日韩啊v在线| 日韩一二三区不卡在线视频| 欧洲一区二区在线观看| 日本欧洲国产一区二区| 国产伦精品一区二区三区在线| 中文字幕中文字幕一区三区| 中文字幕欧美日韩一区二区三区 | 精品一卡二卡三卡四卡日本乱码 | 精品乱色一区二区中文字幕| 不卡一区二区三区视频| 亚洲一区二区三区在线观看视频| 亚洲bbw性色大片| 亚洲欧美日韩国产yyy| 成人国产一区二区| 欧美日本韩国一区二区三区| 一本久道久久综合| 久久国产一区| 91精品久久久久久蜜桃| 精品欧美国产| 91丨九色丨国产| 久久av一区二区| 天堂精品视频| 久久99蜜桃综合影院免费观看| 日本不卡二区高清三区| 国产亚洲精品美女久久久m| 日本一区二区三区免费看| 国产精品一区二区三区免费观看| 日韩成人av电影在线| 国产精品国产三级国产专区53| 久久综合中文色婷婷| 成人资源av| 91免费版网站在线观看| 亚洲 国产 欧美一区| 麻豆传媒一区二区| 精品伦理一区二区三区| 97久久夜色精品国产九色| 午夜欧美一区二区三区免费观看| 国产一区免费视频| 国外成人在线视频网站| 国产精品区一区二区三在线播放 | 亚洲欧洲一区二区福利| 欧美激情第一页在线观看| 激情小说综合区| 好吊色欧美一区二区三区 | 国产经品一区二区| 亚洲人成网站在线播放2019| 国产亚洲欧美一区二区三区| 91视频网页| caoporn国产精品免费公开| 波多野结衣精品久久| 国产原创精品| 精品国产乱码久久久久久108| 国产精品免费在线播放| 国产精品一区二区av| 国产一区在线免费| 欧美视频1区| 亚洲色图自拍| 九九九九精品九九九九| 亚洲精品一区二区三区av| 国产精品美女黄网| 亚洲一一在线| 日韩电影免费观看在| 国产不卡一区二区在线观看| 日本不卡免费新一二三区| 99影视tv| 91精品国产高清久久久久久91裸体 | 日韩尤物视频| 国产精品久久久久久久久久久久冷 | 神马影院午夜我不卡影院| 51精品国产人成在线观看| 国产一区不卡在线观看| 杨幂一区欧美专区| 色婷婷精品国产一区二区三区| 精品欧美日韩| 国产一区二区三区四区五区在线| 日韩久久久久久久久久久久久| 国产伦精品一区二区三区免费视频| 亚洲国产日韩综合一区| 日本一区二区三区视频免费看| 欧美成ee人免费视频| 久久国产精品精品国产色婷婷| 国产精品午夜av在线| 国产经典一区二区三区| 国产伦一区二区三区色一情| 动漫美女被爆操久久久| 国产精品99久久久久久久| 国产激情一区二区三区在线观看| av成人综合网| 精品日本一区二区三区在线观看| 国产欧美亚洲日本| 狠狠久久综合婷婷不卡|