永久939w75w75w乳液,在线观看亚洲区激情AV,亚洲综合一区二区三区无码 ,久久中文精品无码中文字幕

信息技術(shù)

AWS Bedrock負責人Atul Deo:更便宜AI與新型智能體的未來之路

發(fā)布于:2025-07-15 點擊量:316 來源:至頂網(wǎng)

Atul Deo的目標是讓人工智能軟件變得既便宜又聰明。

這位Amazon Web Services Inc.的Amazon Bedrock和生成式人工智能負責人,只有六個月時間證明這一目標的可行性,然后就要迎來該公司12月舉辦的年度re:Invent大會。

"AI領(lǐng)域發(fā)展的速度超過了我見過的任何事物,"Deo說道。"模型每隔幾周就在改進——但除非經(jīng)濟效益合理,否則客戶不會部署它們。"

技術(shù)飛躍與生產(chǎn)成本之間的這種緊張關(guān)系,正在重新定義云行業(yè)的下一階段。對AWS而言,這意味著不僅要銷售最準確的模型,還要提供能防止AI成本失控的基礎(chǔ)設(shè)施。

對于企業(yè)首席信息官來說,這意味著要從華而不實的聊天機器人轉(zhuǎn)向能夠執(zhí)行多步驟任務(wù)并證明其價值的"智能體"軟件。這些力量共同推動Bedrock——這個托管第三方和亞馬遜自研AI模型的兩年歷史服務(wù)——成為這個年收入1000億美元業(yè)務(wù)部門內(nèi)最受關(guān)注的產(chǎn)品之一。

模型的激增

自今年1月以來,Bedrock已添加了七個重要模型:Anthropic的Claude Sonnet 4和Opus 4、Meta的開源Llama 4、中國新興公司DeepSeek,以及亞馬遜自己的Nova系列的三個版本,包括Nova Premier。Deo稱Nova Premier具有"以折扣價格提供最先進的準確性"。每次發(fā)布都在社交媒體上引起可預(yù)期的轟動。不太顯眼的是讓AWS客戶能夠通過單一應(yīng)用程序接口在這些模型間切換的許可協(xié)議。

太多模型選擇就像利率一樣:每個人都有自己的看法,而且會在一夜之間改變。"我們的工作是為客戶提供選擇范圍,讓他們自己挑選,"Deo說。"我們看到了很多強大的模型。Sonnet 4和Opus 4真的很強大。我們推出的Nova Premier具有非常出色的性價比。"

這種選擇范圍現(xiàn)在包括Bedrock Marketplace,這是一個面向細分市場模型的"應(yīng)用商店":一個供制藥化學(xué)家使用,另一個專門用于呼叫中心錄音轉(zhuǎn)錄。分析師看到了亞馬遜成功的RDS數(shù)據(jù)庫策略的影子,它讓客戶可以在同一賬單上運行Oracle、PostgreSQL或公司自研的Aurora引擎。

工程化降低成本

但僅僅提供選擇并不能解決最讓財務(wù)主管頭疼的問題:推理成本,即每次模型產(chǎn)生答案時運行模型的價格。在這里,Deo列舉了新的解決方案:

提示緩存——存儲查詢中冗長的指令部分,避免重復(fù)計費。AWS稱客戶可節(jié)省高達90%的成本。

智能提示路由——將簡單問題發(fā)送給更便宜、更快的模型,將復(fù)雜問題發(fā)送給重型模型,全部實時進行。

批處理模式——以實時調(diào)用一半的單位費率,在夜間處理數(shù)百萬請求。

模型蒸餾——將大型模型的知識轉(zhuǎn)移到專門針對單一工作流程的精簡模型中。

這些功能綜合起來,旨在打破云計算懷疑者所稱的"Token跑步機",這是對AI系統(tǒng)消耗的文本基本單位的引用。更多Token意味著更多計算周期;更多計算周期意味著更大的賬單?,F(xiàn)在不再只是關(guān)注"首Token延遲"?,F(xiàn)在公司想要了解獲得答案或完成任務(wù)的總成本和時間。這正是Deo和Bedrock整個路線圖的重點。

從聊天機器人到智能體

成本控制也是AI下一步發(fā)展的前提:執(zhí)行跨越幾分鐘、幾小時甚至幾天任務(wù)的自主智能體。早期實驗已經(jīng)在進行中。一家抵押貸款初創(chuàng)公司現(xiàn)在使用Bedrock智能體收集文件、掃描錯誤并指導(dǎo)借款人完成承保流程,"從幾周縮短到幾天,"Deo說。房地產(chǎn)公司通過將盡職調(diào)查工作委托給類似的機器人,將房產(chǎn)銷售時間從三個月縮短到兩周。

發(fā)生了什么變化?兩個要素同時出現(xiàn)。首先,更大的模型——Claude Opus 4、DeepSeek——學(xué)會了"大聲思考",對自己的答案進行迭代,而不是返回單一的最佳猜測。其次,AWS推出了多智能體協(xié)作,這是一個Bedrock功能,將業(yè)務(wù)流程分配給由不同模型驅(qū)動的專業(yè)機器人。一個智能體可能使用Anthropic進行深度推理,另一個使用Nova Lite進行大量表單檢查,第三個使用專門針對房地產(chǎn)法的垂直模型。

"把它想象成一個項目團隊,"Deo先生說。"人力資源、財務(wù)、工程——每個智能體都有自己的角色。"

硬件護城河

如果云提供商因自身需求而窒息,這一切都無法實現(xiàn)。AI集群需要數(shù)萬個高端芯片和相應(yīng)的電力。據(jù)Deo介紹,這就是亞馬遜發(fā)揮其硅片產(chǎn)品組合優(yōu)勢的地方。用于傳統(tǒng)工作負載的基于Graviton的CPU和專為AI訓(xùn)練和推理定制的Trainium 2加速器。Deo說,Bedrock最新的Nova模型完全在Trainium 2硬件上訓(xùn)練,這是一個里程碑,減少了亞馬遜對英偉達稀缺GPU的依賴。

"定制硅片是我們改變曲線的方式,"他補充道。"這就是我們能夠在提升能力的同時降低價格的原因。"

競爭對手微軟已經(jīng)宣布了Maia AI芯片;谷歌云有TPU。然而,據(jù)分析公司Canalys稱,AWS在數(shù)據(jù)中心投資方面繼續(xù)花費最多的資金。

模型上下文協(xié)議:'AI的USB-C'

另一個新興支柱在技術(shù)上具有潛在的變革性:模型上下文協(xié)議(MCP)。Deo稱之為"AI的USB-C",這是一個標準,讓智能體能夠動態(tài)發(fā)現(xiàn)數(shù)據(jù)源和彼此,在調(diào)用間維護狀態(tài),并執(zhí)行安全策略。AWS已經(jīng)悄然為S3存儲和DynamoDB數(shù)據(jù)庫等流行服務(wù)發(fā)布了MCP服務(wù)器實現(xiàn)。

"如果你希望智能體一分鐘與工資單對話,下一分鐘與Salesforce對話,而無需硬編碼API,MCP就是握手協(xié)議,"theCUBE Research(SiliconANGLE的姊妹市場研究公司)首席分析師Dave Vellante說。

受監(jiān)管行業(yè)的防護欄

隨著智能體逐漸接觸醫(yī)療記錄和貸款審批,企業(yè)希望證明模型不會產(chǎn)生幻覺。Bedrock的答案是自動推理,這個功能運行一個獨立的驗證器——本質(zhì)上是一個邏輯證明引擎——來驗證每個響應(yīng)。如果驗證器無法達到99.9%的置信度,它會標記答案供人工審查。

這種技術(shù)借鑒了AWS自己的安全工具,如IAM訪問分析器。"我們多年來一直使用形式化方法來驗證權(quán)限,"Deo說?,F(xiàn)在AWS將它們應(yīng)用到語言上。

摩根大通首席信息官Lori Beer在去年AWS re:Invent會議上對我說,制藥和銀行業(yè)的CIO喜歡這個概念。"對我們來說,生成式AI只是另一個應(yīng)用程序——但它對網(wǎng)絡(luò)安全韌性的要求極高,"她說。

可觀測性:下一個前沿

即使有了證明機制,公司也必須審計誰——或什么——在何時做了什么。傳統(tǒng)的應(yīng)用性能監(jiān)控在API調(diào)用處停止;智能體需要對整個管道進行X射線般的透視。AWS在CloudTrail中記錄每個Bedrock提示和響應(yīng),但Deo承認這只是一個開始。"我們需要智能體評估、血緣追蹤、回滾工具——相當于自主工作流的Git歷史,"他說。

觀察者預(yù)期在re:Invent之前會有新服務(wù),用于可視化智能體流程并標記準確性或合規(guī)性的偏移。

三層堆棧

Deo的團隊將Bedrock定位為三層策略的中間層:

基礎(chǔ)設(shè)施——定制芯片(Trainium、Graviton)和Amazon SageMaker,供想要構(gòu)建或精細調(diào)整自己模型的客戶使用。

Bedrock平臺——現(xiàn)成的和第三方模型,以及提示緩存和多智能體協(xié)作等工具。

應(yīng)用程序——完全托管的軟件,如Q Developer和Q Business,讓程序員和業(yè)務(wù)分析師能夠用普通英語編寫查詢。

目標是:讓對沖基金量化分析師深入使用SageMaker,同時讓非技術(shù)保險理賠員將文件拖入Q Business并立即獲得理賠報告——兩者都由相同的Bedrock基元支撐。

獨角獸公司的單人創(chuàng)業(yè)

新堆棧最激進的含義或許是Deo所說的"單人創(chuàng)業(yè)獨角獸"。"你將看到由單個個人驅(qū)動的數(shù)十億美元公司——這是時間問題,而不是可能性問題,"他說。這些工具現(xiàn)在抽象化了基礎(chǔ)設(shè)施、編碼語法甚至業(yè)務(wù)流程連接。

這一前景讓風(fēng)險投資家興奮,讓現(xiàn)有企業(yè)緊張。這也解釋了亞馬遜的緊迫感:Bedrock每延遲一個月推出功能,就可能讓車庫創(chuàng)業(yè)公司選擇不同的云平臺。

規(guī)?;瘺_刺

AWS能否在承載萬億美元母公司利潤負擔的同時保持沖刺?六個月的云業(yè)務(wù)成果——七個模型、四個成本節(jié)約工具、兩個新協(xié)議——表明它可以做到。然而,谷歌和微軟將以自己的降價和智能體工具包作為回應(yīng)。從歐洲到華盛頓的監(jiān)管機構(gòu)正試圖監(jiān)管和理解AI供應(yīng)鏈。

Deo回到AWS的共同主題。"速度是我們的優(yōu)勢,"他說,呼應(yīng)了AWS首席執(zhí)行官Matt Garman的口號。"我們必須比客戶的想象力更快地交付硬件、成本控制、防護欄和創(chuàng)新。"

換句話說,世界上最大的云服務(wù)商必須表現(xiàn)得像一家初創(chuàng)公司——同時運營著小城市規(guī)模的數(shù)據(jù)中心。Atul Deo合上了他的筆記本;下周又有一個模型發(fā)布。

觀察者預(yù)期在re:Invent之前會有新服務(wù),用于可視化智能體流程并標記準確性或合規(guī)性的偏移。


【版權(quán)聲明】:本站內(nèi)容來自于與互聯(lián)網(wǎng)(注明原創(chuàng)稿件除外),如文章或圖像侵犯到您的權(quán)益,請及時告知,我們第一時間刪除處理!