使用 RAG 的 LLM 需要訪問高質(zhì)量的訓(xùn)練數(shù)據(jù)。然而,由于數(shù)據(jù)分散在不同部門、系統(tǒng)和格式中,確保數(shù)據(jù)的質(zhì)量和可用性往往具有挑戰(zhàn)性。
為了最大限度地發(fā)揮效果,使用 RAG 的 LLM 還需要連接到部門希望提取數(shù)據(jù)的來源 - 如客戶服務(wù)平臺、內(nèi)容管理系統(tǒng)和人力資源系統(tǒng)等。這類集成需要豐富的技術(shù)專業(yè)知識,包括數(shù)據(jù)映射和 API 管理經(jīng)驗。
此外,當(dāng) RAG 模型大規(guī)模部署時,會消耗大量計算資源并產(chǎn)生大量數(shù)據(jù)。這需要適當(dāng)?shù)幕A(chǔ)設(shè)施和部署經(jīng)驗,以及管理大型組織數(shù)據(jù)的能力。
RAGOps 是一種引起 AI 專家關(guān)注的主流化 RAG 方法,它是一種能夠以確保一致性同時降低復(fù)雜性的方式自動化 RAG 工作流、模型和接口的方法。
RAGOps 使數(shù)據(jù)科學(xué)家和工程師能夠自動化數(shù)據(jù)攝取和模型訓(xùn)練以及推理。它還通過提供基礎(chǔ)設(shè)施堆棧中的負載均衡和分布式計算機制來解決可擴展性難題。在 RAG 管道的每個階段都執(zhí)行監(jiān)控和分析,以幫助持續(xù)改進模型和運營。
例如,麥肯錫使用 RAGOps 幫助其 Lilli 生成式 AI 平臺篩選 10 萬份精選文檔。Lilli 已經(jīng)回答了超過 800 萬個由約四分之三的麥肯錫員工提出的關(guān)于運營洞察的問題。
智能代理 RAG 的時代即將到來
作為組織尋求從生成式 AI 實施中獲取更多價值的運營模式,RAGOps 有望在已經(jīng)實踐過其他運營框架 (如 DevOps 或 MLOps) 的組織中得到良好應(yīng)用。
然而,一些組織可能會采取更新穎的方法,即順應(yīng)生成式 AI 行業(yè)的發(fā)展方向:將 RAG 與智能代理 AI 結(jié)合,使 LLM 能夠適應(yīng)不斷變化的環(huán)境和業(yè)務(wù)需求。
設(shè)計用于以最少人工干預(yù)執(zhí)行數(shù)字任務(wù)的代理正引起尋求將更多數(shù)字操作委托給軟件的企業(yè)的興趣。根據(jù)德勤研究,到 2025 年將有 25% 的組織實施企業(yè)代理,到 2027 年將增長到 50%。
具有 RAG 的智能代理 AI 將包括多種方法和解決方案,但許多場景可能會共享一些共同特征。
例如,單個代理將評估和總結(jié)來自單個文檔的問題答案,甚至比較多個文檔之間的答案。元代理將協(xié)調(diào)這個過程,管理單個代理并整合輸出以提供連貫的響應(yīng)。
最終,代理將在 RAG 框架內(nèi)工作,進行多步分析、規(guī)劃和推理,在執(zhí)行任務(wù)時學(xué)習(xí)并根據(jù)新輸入調(diào)整其策略。這將幫助 LLM 隨著時間的推移更好地響應(yīng)更細微的提示。
至少在理論上是這樣。
總結(jié)
生成式 AI 技術(shù)的未來一片光明,它將從研究實驗室流向企業(yè) AI 工廠,成為蓬勃發(fā)展的企業(yè) AI 領(lǐng)域的一部分。
例如,模型的占用空間將縮小,同時變得更加優(yōu)化,能夠在本地和邊緣的 AI PC 等設(shè)備上高效運行。RAG 標(biāo)準(zhǔn)化,包括軟件庫和現(xiàn)成工具,將繼續(xù)增長。
無論您的組織是采用 RAGOps 還是采用智能代理 AI,都正在出現(xiàn)解決方案來幫助組織擴展 RAG 實施。
例如,當(dāng)應(yīng)用于醫(yī)療保健時,基于 NVIDIA 的 Dell AI Factory 的智能代理 RAG 有助于協(xié)調(diào)使用結(jié)構(gòu)化數(shù)據(jù) (如患者日程和檔案) 和非結(jié)構(gòu)化數(shù)據(jù) (如醫(yī)療記錄和影像文件) 的挑戰(zhàn),同時保持對 HIPAA 等要求的合規(guī)性。
這只是一個光明的選擇。更多解決方案正在涌現(xiàn),為正在進行生成式 AI 之旅的組織指明方向。
了解更多關(guān)于基于 NVIDIA 的 Dell AI Factory 的信息。
由戴爾科技集團為您呈現(xiàn)。