AI應用在產(chǎn)業(yè)廣泛落地,正在推動推理需求暴漲和云基礎設施升級。
公司情報專家《財經(jīng)涂鴉》獲悉,9月16日,騰訊集團副總裁、騰訊云總裁邱躍鵬在2025騰訊全球數(shù)字生態(tài)大會中宣布,騰訊云依托異構(gòu)計算平臺整合多種芯片資源,向外界提供高性價比的 AI 算力,目前該平臺已全面適配主流國產(chǎn)芯片。
“目前,騰訊云正不斷升級云基礎設施,以支撐Agent規(guī)?;涞睾推髽I(yè)全球化發(fā)展”。他進一步表示,騰訊云已在推理加速、Agent Infra和國際化布局等方面取得突破,并將以更加開放的姿態(tài),助力企業(yè)把握時代機遇。
據(jù)悉,騰訊云基礎設施已覆蓋全球55個可用區(qū),部署3200多個加速節(jié)點,為上萬款游戲提供安全防護,在過去一年抵御了同比增長183%的DDoS攻擊。
此外,騰訊云還為中小企業(yè)和開發(fā)者提供了便捷的出海工具。比如,EdgeOne Pages結(jié)合AI編程,幾分鐘就能搭建電商網(wǎng)站。低代碼直播組件也大幅縮短了開發(fā)周期。
截至目前,騰訊云全球已經(jīng)設立 9 個技術支持中心,并獲得400 多項專業(yè)認證,計劃在日本大坂和沙特新建可用區(qū)。
以下為邱躍鵬演講全文:(根據(jù)表述需求有所刪減)
大家上午好!
大模型產(chǎn)業(yè)重心從訓練到推理的轉(zhuǎn)變,已經(jīng)成為行業(yè)共識。從騰訊自身的實踐,我們也看到了同樣的趨勢,同時客戶對于使用大模型和建設Agent迸發(fā)出強烈熱情,都帶來了推理需求的暴漲。這也意味著,我們的AI基礎設施,也要同步升級。
從技術角度來看,開源社區(qū)與推理相關的技術范式正在快速迭代。騰訊在推理加速上一直有非常多的積累,我們積極參與到社區(qū)貢獻中,共建推理加速技術生態(tài)。
今年2月,DeepSeek一口氣開源了五大代碼庫,為社區(qū)注入了前所未有的活力。其中,專注GPU通信的DeepEP,與我們長期積累的TRMT技術方向高度契合。我們在此基礎上優(yōu)化了 DeepEP,使其在IB網(wǎng)絡性能提升了30%,在數(shù)據(jù)中心常用的RoCE網(wǎng)絡環(huán)境中性能更是翻倍。DeepSeek在社區(qū)公開致謝并用“huge speedup”形容這次貢獻。
第二個重點是KV Cache優(yōu)化。隨著大模型參數(shù)規(guī)模激增,推理對顯存的需求急劇上升。同時,智能客服、代碼助手等場景,對上下文長度的要求不斷擴展,導致推理過程中產(chǎn)生的KV Cache線性增長,GPU顯存成為瓶頸。對此,我們將KV Cache逐層緩存至內(nèi)存、SSD及云端擴展存儲,充分利用整個推理集群節(jié)點上的存儲資源,以及外置擴展資源,以存換算,提高性價比和系統(tǒng),并極大降低TTFT等延遲指標。
為了解決分布式KV Cache和多級緩存的精細管理,并建起推理引擎到云存儲的橋梁,我們研發(fā)并正式開源了FlexKV。在知名SSD廠商“群聯(lián)電子”的測試中,F(xiàn)lexKV 將首字時延最高降低 70%,對話時延降低57%。
推理框架優(yōu)化對于提升推理效率也非常重要。圍繞用戶體驗、成本控制和應用拓展,我們貢獻了多項核心技術,補充到了不同社區(qū)框架中。
例如,我們集成了多token聯(lián)合預測 (MTP) 技術,讓模型一次運算生成多個token,將生成速度提升了35%。我們還幫助社區(qū)打通了注意力數(shù)據(jù)并行 (Attention DP) 功能,將量提升了30%。
此外,通過集成MoE-Chunk技術,成功使推理框架能夠處理超過256K的超長輸入,使其在長文檔分析、復雜代碼生成等場景中也能保持高效。
這些成果背后,是騰訊軟硬件協(xié)同全棧優(yōu)化的長期戰(zhàn)略投入,騰訊始終堅持積極參與和回饋開源社區(qū),并通過騰訊云異構(gòu)計算平臺的軟件能力,整合不同類型的芯片,對外提供高性價比的AI算力,目前我們已經(jīng)全面適配主流的國產(chǎn)芯片。
當Agen從前沿技術走向企業(yè)生產(chǎn)環(huán)境,如何確保其在一個安全可信的環(huán)境中高效運行成為新的挑戰(zhàn)。為此,我們推出了全新的Agent infra解決方案——Agent Runtime。
它集成了執(zhí)行引擎、云沙箱、上下文服務、網(wǎng)關、安全可觀測服務等多項產(chǎn)品和能力??梢哉f,Agent Runtime 為Agent提供了堅實可靠的“手”和“腳”,以及至關重要的安全隔離云端執(zhí)行環(huán)境,真正打通了Agent從技術到應用的最后一公里。
比如大家最關注的沙箱技術。云沙箱是 Agent Runtime 的核心組件,基于自研的Cube沙箱技術,通過“運行時快照”、“資源預創(chuàng)建池化”等多種技術手段,實現(xiàn)了 100毫秒的極速啟動,并能支持數(shù)十萬Agent實例同時并發(fā),這意味著Agent無需等待,隨時可以投入使用,具備卓越的資源彈性和秒級調(diào)度能力。
云沙箱也支持多種靈活的接入方式,無論通過 MCP、SDK 還是 API,都能快速集成,滿足不同業(yè)務場景的需求。我們還提供了全方位的安全保障,包括嚴格的身份權(quán)限管理和數(shù)據(jù)安全防護,確保每一個Agent都能在一個安全可信的環(huán)境中高效運行。
除了面向Agent升級基礎設施,我們也在思考如何將Agent能力應用在客戶的云上旅程,幫助客戶更好的用云、管云,很高興向大家介紹騰訊云的專家服務智能體——Cloud Mate。
Cloud Mate由一系列凝聚了各個云上領域經(jīng)驗的子Agent構(gòu)成,它不僅僅是一項技術,更是騰訊云海量實踐的匯總,能夠可視化治理云上架構(gòu)、前置攔截風險,并大幅提升問題處理效率,改變我們管理云的方式。
在云上架構(gòu)治理方面,具備Agent能力的智能顧問就像一個全能的數(shù)字架構(gòu)師,可以無縫集成超過90%的騰訊云產(chǎn)品,對整個云上架構(gòu)進行全面感知和可視化。
例如,在新游上線前必做的重保演練,它能將整個周期從原來的1周縮短至1天,目前,騰訊云智能顧問已經(jīng)為云上客戶提供,超過100萬次的智能架構(gòu)治理服務,是真正值得信賴的云上伙伴。
在風險防范場景,慢查詢或低SQL是長期困擾開發(fā)與DBA的難題,這種業(yè)務代碼一旦上線,可能嚴重拖慢數(shù)據(jù)庫性能,甚至導致服務宕機。
Cloud Mate非常擅長數(shù)據(jù)庫業(yè)務,能夠深入到代碼環(huán)節(jié),在開發(fā)提交代碼前,自動進行風險檢測與攔截,從源頭保障線上數(shù)據(jù)庫的安全穩(wěn)定。從內(nèi)部實踐看,Cloud Mate對風險SQL的攔截率高達95%,累計檢測了超過770萬行代碼。
在排障方面,Cloud Mate帶來的改變尤為顯著。當客戶云上業(yè)務系統(tǒng)日益復雜時,如何快速定位問題,是一個巨大的挑戰(zhàn)。過去,解決一個復雜問題平均需要30小時以上,并且高度依賴于個人經(jīng)驗和手動操作。
而現(xiàn)在,通過 Cloud Mate 強大的自動化和并行編排能力,我們能夠?qū)⑵骄耪蠒r間,從小時級縮短至分鐘級,最快僅需3分鐘。Cloud Mate 能夠自動執(zhí)行診斷工具鏈,并行處理多個任務,極大地提升了運維效率,讓故障定位不再是難題。
除了智能化升級之外,企業(yè)全球化的趨勢也勢不可擋。
騰訊云自研的星星海服務器從SA5到SA9持續(xù)迭代,通過硬件架構(gòu)創(chuàng)新,在有限空間內(nèi),最大化提升計算密度與能效,旗艦SA9單機規(guī)格,從前一代的512核進一步提升到768核。
目前,星星海服務器在全球累計部署核數(shù)已超2億,為客戶持續(xù)提供穩(wěn)定可靠的計算能力。
我們還推出了新一代架構(gòu)的TDSQL數(shù)據(jù)庫, 讓分布式數(shù)據(jù)庫像單機MySQ一樣好用,同時享受到單機數(shù)據(jù)庫的易用性,以及分布式數(shù)據(jù)庫的海量存儲與高并發(fā)能力,具備無限的TP擴展性與輕量AP能力。 同時,我們還將AI和數(shù)據(jù)庫的優(yōu)化器結(jié)合,在復雜查詢場景下,總時延能下降 80%以上。
專有云TCE在國內(nèi)政企客戶中備受好評,當我們推向國際市場,“高可用性”也得到了國際客戶的肯定。我們持續(xù)提升TCE容災切換的一致性、準確性和實時性,目前已經(jīng)達到RTO 2分鐘級別,具備近金融6級的容災能力。
游戲體驗的流暢性、穩(wěn)定性和安全性,直接決定著一款產(chǎn)品能否成功走向全球。在今年Omdia的報告中,我們與AWS、Google、Microsoft等企業(yè),一同被評為全球游戲云平臺的領導者。
為了讓精品游戲都能高效進入全球市場,我們不斷打磨基礎設施的健壯性。
目前,我們的服務已覆蓋全球55個可用區(qū),擁有超過3200個加速節(jié)點,確保游戲能夠以極低的延遲觸達全球玩家。
我們還為全球超過1萬款游戲保駕護航,成功抵御的DDoS攻擊次數(shù)同比增長了183%,為游戲的平穩(wěn)運營筑起了堅實的防線。同時,我們通過WeTest和ACE等一系列產(chǎn)品,為游戲開發(fā)者提供全方位的測試與安全服務,幫助他們在游戲上線前,就徹底排除潛在隱患。
以韓國頭部頭部游戲集團Com2uS為例,他們不僅是成功的游戲開發(fā)商,更打造了面向開發(fā)者的游戲后端服務平臺Hive。
借助騰訊云40多款云產(chǎn)品的支撐,Hive構(gòu)建了上百個游戲開發(fā)和部署組件,并被90多家游戲公司接入使用,成功支撐了250款游戲上線,服務全球超過9億游戲玩家。今年,他們準備從亞太啟航,進一步進軍北美市場,而騰訊云依然是他們最信賴的合作伙伴。
我們與創(chuàng)夢天地的合作也持續(xù)深化。他們的全新游戲《卡拉彼丘》在全球發(fā)行后,不到2小時就登頂Steam排行榜榜首,背后正是我們WeTest、大模型服務等能力保障的結(jié)果,大幅提升了游戲質(zhì)量優(yōu)化和多語言輿情處置的效率,讓創(chuàng)夢天地能夠更加專注于核心業(yè)務,擁抱全球市場。
面向AI時代,我們持續(xù)升級產(chǎn)品,助力客戶輕松進入低門檻的開發(fā)新時代。EdgeOne是我們面向國際市場推出的下一代安全加速產(chǎn)品,今年我們進一步將大模型與MCP Server結(jié)合,推出了EdgeOne Pages,當用戶使用Codebuddy、Cursor、VScode等AI編程工具時,可以便捷調(diào)用EdgeOne Pages的MCP,在幾分鐘內(nèi)完成涵蓋注冊、支付、加速和安全防護的完整電商網(wǎng)頁部署。產(chǎn)品上線三個月,已助力超過10萬用戶走向全球市場,成為中小企業(yè)和獨立開發(fā)者的出海首選平臺。
如果客戶希望進一步豐富產(chǎn)品的互動能力,我們提供低代碼、模塊化的互動直播組件,結(jié)合目前市面上主流的AI編程工具,可以將開發(fā)周期從月級壓縮至天級,同時支持千萬級規(guī)模的單房間直播。組件上線半年以來,客戶數(shù)增長超300% 。
我們致力于通過“邊加端”的AI整體方案,以極低門檻和極快速度,將創(chuàng)新想法落地為全球產(chǎn)品,釋放開發(fā)者的生產(chǎn)力。
產(chǎn)品技術的升級,也能讓騰訊云的用戶更從容應對全球化復雜場景,尤其是瞬時流量洪峰。
過去一年,我們成功護航了多個高并發(fā)場景。例如,騰訊云平穩(wěn)支撐了國家級大型活動的直播,支撐了全球超過8000萬觀眾同時在線觀看,直播平臺全程無卡斷。我們還支持并保障了亞太地區(qū)超過一半的正版英超直播。其中的智能媒體處理技術,為客戶實現(xiàn)了提質(zhì)增效,保障了音視頻全鏈路的流暢體驗。
在安全防護方面,騰訊云的防護容量相比去年增長了70%,達到了25T,帶寬儲備增長100%,達到400T。在服務某頭部潮玩企業(yè)火爆發(fā)售的過程中,我們成功應對了全球業(yè)務十倍級的流量突發(fā),并通過AI實時防刷引擎,將高峰時段黑產(chǎn)比例從80%大幅壓縮到0.2% 。
騰訊云在海外完善的基礎設施和本地化服務,也在吸引越來越多的海外本地企業(yè)跨云遷移。
GoTo是東南亞最大的科技集團,合并了印尼兩大獨角獸企業(yè)——負責即時配送和出行服務的Gojek和電商平臺Tokopedia。騰訊云負責的Gojek業(yè)務,是這場遷移中復雜度最高的部分,相當于把印尼的“滴滴+美團”云上搬家。
我們面對的,是一個超大體量的平臺:擁有超過1億的注冊用戶, 管理著超過10000臺云主機、730多個數(shù)據(jù)庫實例和1000多個微服務。同時,其系統(tǒng)極其復雜——四大核心業(yè)務線、九個工程子系統(tǒng),模塊間高度耦合。這無疑是一個世界級的云業(yè)務遷移挑戰(zhàn)。
面對如此復雜的項目,團隊駐扎雅加達現(xiàn)場,與GoTo緊密協(xié)作,高效完成了500多項定制化需求交付,讓客戶50多個產(chǎn)品模塊在遷移前后的體驗和功能無縫延續(xù)。為了確保萬無一失,進行了5輪全鏈路演練,制定了20多項應急預案。
更值得一提的是,為了滿足GoTo的高可用需求,我們僅用5個月就在印尼建成了第三個可用區(qū),為遷移提供了堅實的本地基礎設施保障。
過去一年,是騰訊云在海外快速發(fā)展的一年。我們在日本大坂和沙特新建了可用區(qū),并已在全球范圍內(nèi)設立9個技術支持中心,持續(xù)為本地客戶提供卓越服務。同時,我們通過了400多項專業(yè)認證,為企業(yè)在安全合規(guī)的前提下穩(wěn)健前行保駕護航。
全球化市場充滿挑戰(zhàn),也蘊藏著無限機遇。對于正在或即將出海的中國企業(yè)而言,如何穩(wěn)扎穩(wěn)打、因地制宜,抓住AI技術浪潮驅(qū)動創(chuàng)新提效,是每一步都需要認真思考的課題。騰訊云愿以扎實的準備和開放的心態(tài),幫助全球企業(yè)用好云,陪伴中國企業(yè)走得更穩(wěn)、更遠。
謝謝大家。
作者:蘇打
編輯:tuya
出品:財經(jīng)涂鴉(ID:caijingtuya)
本文作者可以追加內(nèi)容哦 !
本文來源:財經(jīng)涂鴉
來源:財經(jīng)涂鴉
重要提示:本文僅代表作者個人觀點,并不代表樂居財經(jīng)立場。 本文著作權(quán),歸樂居財經(jīng)所有。未經(jīng)允許,任何單位或個人不得在任何公開傳播平臺上使用本文內(nèi)容;經(jīng)允許進行轉(zhuǎn)載或引用時,請注明來源。聯(lián)系請發(fā)郵件至ljcj@leju.com,或點擊【聯(lián)系客服】
樂居財經(jīng)APP
?2017-2025 北京怡生樂居財經(jīng)文化傳媒有限公司 北京市朝陽區(qū)西大望路甲22號院1號樓1層101內(nèi)3層S3-01房間756號 100016
京ICP備2021030296號-2京公網(wǎng)安備 11010502047973號