由 NVIDIA 后訓(xùn)練的全新 Llama Nemotron 推理模型,為代理式 AI 提供業(yè)務(wù)就緒型基礎(chǔ)
埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、IQVIA、微軟、SAP 和 ServiceNow 與 NVIDIA 合作,率先推出推理 AI 智能體,改變工作方式
美國(guó)加利福尼亞州圣何塞 —— GTC —— 2025 年 3 月 18 日 —— NVIDIA 今日發(fā)布具有推理功能的開(kāi)源 Llama Nemotron 模型系列,旨在為開(kāi)發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜任務(wù)的高級(jí) AI 智能體。
NVIDIA Llama Nemotron 推理模型系列基于 Llama 模型構(gòu)建,提供按需 AI 推理功能。 NVIDIA 在后訓(xùn)練期間對(duì)該推理模型系列進(jìn)行了增強(qiáng),以提升多步數(shù)學(xué)運(yùn)算、編碼、推理和復(fù)雜決策能力。
與基礎(chǔ)模型相比,這種增強(qiáng)過(guò)程將模型的精度提高多達(dá) 20%;與其他領(lǐng)先的開(kāi)放推理模型相比,優(yōu)化推理速度達(dá)到了 5 倍。推理性能的提高意味著模型可處理更復(fù)雜的推理任務(wù),增強(qiáng)決策能力,并降低企業(yè)運(yùn)營(yíng)成本。
包括埃森哲、Amdocs、Atlassian、Box、Cadence、CrowdStrike、德勤、IQVIA、微軟、SAP 和 ServiceNow 的領(lǐng)先智能體 AI 平臺(tái), 正在這一全新推理模型和軟件上與 NVIDIA 進(jìn)行合作。
“推理和代理式 AI 的采用速度非常驚人,” NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,“NVIDIA 的開(kāi)放推理模型、軟件和工具為世界各地的開(kāi)發(fā)者和企業(yè)構(gòu)建高效的代理式 AI 團(tuán)隊(duì)提供了堅(jiān)實(shí)基礎(chǔ)。”
NVIDIA 后訓(xùn)練為企業(yè)推理提高準(zhǔn)確性和可靠性
Llama Nemotron 模型系列專為提供生產(chǎn)就緒型 AI 推理而打造,以 NVIDIA NIM? 微服務(wù)形式提供,包括 Nano、Super 和 Ultra 三種規(guī)模,每種規(guī)模都針對(duì)不同部署需求進(jìn)行了優(yōu)化。
Nano 模型可在 PC 和邊緣設(shè)備上提供最高準(zhǔn)確性;Super 模型能夠在單個(gè) GPU 上提供最佳的準(zhǔn)確性和最高的吞吐量;而 Ultra 模型將在多 GPU 服務(wù)器上實(shí)現(xiàn)最高代理準(zhǔn)確性。
NVIDIA 在 NVIDIA DGX? Cloud 上采用高質(zhì)量精選合成數(shù)據(jù)進(jìn)行大量后訓(xùn)練,該合成數(shù)據(jù)由 NVIDIA Nemotron? 模型和其他開(kāi)源模型,以及 NVIDIA 共同創(chuàng)建的其它精選數(shù)據(jù)集生成。
用于開(kāi)發(fā)模型的工具、數(shù)據(jù)集和后訓(xùn)練優(yōu)化技術(shù)將全面開(kāi)放,為企業(yè)提供靈活性,以構(gòu)建自己的自定義推理模型。
代理式平臺(tái)與 NVIDIA 合作為各行業(yè)增強(qiáng)推理能力
代理式 AI 平臺(tái)行業(yè)領(lǐng)導(dǎo)者正在使用 NVIDIA Llama Nemotron 推理模型,為企業(yè)提供先進(jìn)推理能力。
微軟將 Llama Nemotron 推理模型和 NIM 微服務(wù)集成到 Microsoft Azure AI Foundry 中。 此舉擴(kuò)展了 Azure AI Foundry 模型目錄,為客戶提供增強(qiáng)服務(wù)的選項(xiàng),如針對(duì) Microsoft 365 的 Azure AI Agent Service。
SAP 正利用 Llama Nemotron 模型,推動(dòng) SAP Business AI 解決方案和 SAP 智能副駕 Joule 的發(fā)展。 此外,它還采用 NVIDIA NIM 和 NVIDIA NeMo? 微服務(wù),提高了 SAP ABAP 編程語(yǔ)言模型的代碼補(bǔ)全精度。
“我們正在與 NVIDIA 合作,將 Llama Nemotron 推理模型整合到 Joule 中,以增強(qiáng)我們的 AI 智能體,使其更加直觀、準(zhǔn)確且具有成本效益?!?SAP 全球 AI 負(fù)責(zé)人 Walter Sun 表示,“這些先進(jìn)的推理模型將優(yōu)化和重寫(xiě)用戶查詢請(qǐng)求,使我們的 AI 能夠更好地理解問(wèn)題,并提供更智能、更高效的 AI 體驗(yàn),從而推動(dòng)業(yè)務(wù)創(chuàng)新?!?p>
ServiceNow 正利用 Llama Nemotron 模型構(gòu)建 AI 智能體,提供更高的性能和準(zhǔn)確性,從而提升各行各業(yè)的企業(yè)生產(chǎn)力。
埃森哲已經(jīng)在其 AI Refinery 平臺(tái)上提供 NVIDIA Llama Nemotron 推理模型,包括今日發(fā)布的全新行業(yè)智能體解決方案 —— 可助力客戶快速開(kāi)發(fā)和部署定制 AI 智能體,以應(yīng)對(duì)行業(yè)特定挑戰(zhàn),加速業(yè)務(wù)轉(zhuǎn)型。
德勤計(jì)劃將 Llama Nemotron 推理模型納入其近期發(fā)布的 Zora AI 代理式 AI 平臺(tái),該平臺(tái)旨在通過(guò)包含深度功能性、特定行業(yè)業(yè)務(wù)知識(shí)以及具備透明度的智能體,為人類決策和行動(dòng)提供支持。
NVIDIA AI Enterprise 為代理式 AI 提供必要工具
開(kāi)發(fā)者可借助新的 NVIDIA 代理式 AI 工具和軟件,部署 NVIDIA Llama Nemotron 推理模型,簡(jiǎn)化高級(jí)推理在協(xié)作 AI 系統(tǒng)中的應(yīng)用。
作為 NVIDIA AI Enterprise 軟件平臺(tái)的組成部分,最新的代理式 AI 構(gòu)建模塊包括:
NVIDIA AI-Q Blueprint 助力企業(yè)將知識(shí)導(dǎo)入可自主感知、推理和行動(dòng)的 AI 智能體。這一藍(lán)圖由 NVIDIA NIM 微服務(wù)構(gòu)建,集成 NVIDIA NeMo Retriever? 用于多模態(tài)信息檢索,使用開(kāi)源 NVIDIA AgentIQ 工具包將智能體和數(shù)據(jù)連接并優(yōu)化,同時(shí)實(shí)現(xiàn)公開(kāi)透明。
NVIDIA AI 數(shù)據(jù)平臺(tái)為新型企業(yè)基礎(chǔ)設(shè)施提供的可定制參考設(shè)計(jì),集成了使用 AI-Q Blueprint 構(gòu)建的 AI 查詢智能體。
為復(fù)雜代理式 AI 應(yīng)用優(yōu)化推理的全新 NVIDIA NIM 微服務(wù),可實(shí)現(xiàn)持續(xù)學(xué)習(xí),并實(shí)時(shí)適應(yīng)任意環(huán)境。微服務(wù)可確保對(duì)來(lái)自領(lǐng)先模型構(gòu)建商,包括 Meta、微軟和 Mistral AI 的最新模型進(jìn)行可靠部署。
NVIDIA NeMo 微服務(wù)提供高效企業(yè)級(jí)解決方案,以快速建立并維護(hù)具有魯棒性的數(shù)據(jù)飛輪,讓 AI 智能體持續(xù)學(xué)習(xí)人類和 AI 生成的反饋。用于構(gòu)建數(shù)據(jù)飛輪的 NVIDIA AI Blueprint 為開(kāi)發(fā)者提供一個(gè)參考架構(gòu),使開(kāi)發(fā)者可以利用 NVIDIA 微服務(wù)輕松構(gòu)建和優(yōu)化數(shù)據(jù)飛輪。
可用性
NVIDIA Llama Nemotron Nano、Super 模型和 NIM 微服務(wù)的托管應(yīng)用編程接口,可通過(guò) NVIDIA 官網(wǎng) 和 Hugging Face 獲取。NVIDIA 開(kāi)發(fā)者計(jì)劃成員可免費(fèi)訪問(wèn),用于其開(kāi)發(fā)、測(cè)試和研究工作。
企業(yè)可在加速數(shù)據(jù)中心和云基礎(chǔ)設(shè)施上借助 NVIDIA AI Enterprise 在生產(chǎn)環(huán)境中運(yùn)行 Llama Nemotron NIM 微服務(wù)。開(kāi)發(fā)者可以提前注冊(cè),以便在 NVIDIA NeMo 微服務(wù)發(fā)布時(shí)及時(shí)收到通知。
NVIDIA AI-Q Blueprint 將于 4 月發(fā)布。NVIDIA AgentIQ 工具包現(xiàn)可前往 GitHub 下載。
上一篇:英飛凌推出專為AI服務(wù)器優(yōu)化的新型48 V熱插拔控制器, 擴(kuò)展其XDP?數(shù)字保護(hù)產(chǎn)品系列
下一篇:NVIDIA Blackwell RTX PRO 提供工作站和服務(wù)器兩種規(guī)格,助力設(shè)計(jì)師、開(kāi)發(fā)者、數(shù)據(jù)科學(xué)家和創(chuàng)作人員構(gòu)建代理式 AI 并進(jìn)行協(xié)作
- 熱門(mén)資源推薦
- 熱門(mén)放大器推薦
- 貿(mào)澤即日起開(kāi)售適用于數(shù)據(jù)中心和網(wǎng)絡(luò)應(yīng)用的 全新TE Connectivity QSFP 112G SMT連接器
- Proximus Global旗下公司BICS與Epic Malta合作,為2G/3G網(wǎng)絡(luò)退役后保障旅行者漫游連接
- 蘋(píng)果被曝考慮放棄自研模型 轉(zhuǎn)而與Anthropic或OpenAI合作
- ?百度文心4.5來(lái)襲!英特爾Day0即支持端側(cè)部署
- 韓國(guó)政府投資6454億韓元發(fā)展量子技術(shù),推進(jìn)1000量子比特計(jì)算機(jī)研發(fā)
- ?擁抱基礎(chǔ)設(shè)施變革,抓住人工智能的萬(wàn)億美元機(jī)遇
- 摩爾斯微電子的Wi-Fi HaLow技術(shù)正式獲得Matter 認(rèn)證
- Nordic Semiconductor 收購(gòu) Memfault,推出首個(gè)互聯(lián)產(chǎn)品生命周期管理的 “芯片到云”完整平臺(tái)
- 安森美AI數(shù)據(jù)中心系統(tǒng)方案指南上線 全面支持助力能耗優(yōu)化與綠色轉(zhuǎn)型
- cdsj relay
- 用于 LED 照明的 DC 到 DC 單路輸出電源
- 使用 MCP1631 高速脈寬調(diào)制器和 +5.5V 至 +16.0V 輸入的典型應(yīng)用電路
- AD8532ARMZ-REEL單電源直接接入調(diào)制解調(diào)器的典型應(yīng)用
- 用于無(wú)線的 2.8 至 5.5V 差分放大器
- NSI45025ZT1G 用于基本交流應(yīng)用的恒流 LED 驅(qū)動(dòng)器的典型應(yīng)用
- 使用 ROHM Semiconductor 的 BD45425 的參考設(shè)計(jì)
- 使用 ON Semiconductor 的 ILC7080 的參考設(shè)計(jì)
- 使用 ON Semiconductor 的 CS5203A-2G 的參考設(shè)計(jì)
- OP484ESZ 3V 單電源、50Hz 至 60Hz 有源陷波濾波器和假接地的典型應(yīng)用
- 福州大學(xué)發(fā)明新機(jī)器視覺(jué)傳感器 可使機(jī)器人對(duì)極端光照做出超快反應(yīng)
- 蘋(píng)果獲沉浸式虛擬顯示器相關(guān)的專利
- 英特爾汽車(chē)“折戟”,十年布局一夜歸零
- 寶馬自動(dòng)充電機(jī)器人概念驗(yàn)證成功,引領(lǐng)無(wú)人充電新時(shí)代
- 智駕模式下LQR最優(yōu)算法在EPS中的應(yīng)用研究
- 6月超17款人形機(jī)器人新品推出
- 《軟件定義汽車(chē)》 —— 電子電氣架構(gòu)(EEA)的演進(jìn)
- 恩智浦: 中國(guó)造的車(chē)規(guī)芯片,正在反向輸出全球
- 汽車(chē)線束:電動(dòng)化智能化下的機(jī)遇與市場(chǎng)格局
- "智能汽車(chē)芯片大戰(zhàn)升級(jí):高通最新方案為何獲中國(guó)車(chē)企追捧?
- 送餐機(jī)器人將引領(lǐng)餐飲新時(shí)代
- 日本研發(fā)投籃機(jī)器人 投球命中率接近100%
- 機(jī)器人發(fā)展將帶給中國(guó)經(jīng)濟(jì)社會(huì)變化
- 未來(lái)若機(jī)器人與人類共存 那么該如何相處
- 掃地機(jī)器人已經(jīng)出現(xiàn)了 你家里有嗎
- 夏普斥資11億 買(mǎi)東芝PC部門(mén)
- 感測(cè)/邊緣/云端創(chuàng)綜效 制造業(yè)成本降三成
- 臺(tái)積電第3季有可能旺季不旺,聯(lián)發(fā)科憑借Helio P系列翻身?
- 英特爾從五個(gè)方面實(shí)現(xiàn)PC創(chuàng)新
- 透過(guò)COMPUTEX看臺(tái)灣芯片廠商如何發(fā)力
- 關(guān)于激光器和光電轉(zhuǎn)換器的封裝
- 關(guān)于DSP的boot mode / boot loader /上電順序 /在線升級(jí)等問(wèn)題的總結(jié)
- 【Silicon Labs BG22-EK4108A 藍(lán)牙開(kāi)發(fā)評(píng)測(cè)】 III. 修改范例工程,實(shí)現(xiàn)雙路PWM輸出
- 有兄弟有那個(gè)平衡球的例程嗎?就是乒乓球在圓形平板上滑動(dòng)永遠(yuǎn)不會(huì)掉下來(lái)~
- 請(qǐng)教直接驅(qū)動(dòng)TFT的固件庫(kù)在哪有下載
- micropython更新:2020.5
- 誰(shuí)有NEC-78KOS系列的中文資料上傳一點(diǎn)
- ZigBee求救~
- 急求ccs無(wú)法打開(kāi)的問(wèn)題
- 【課程推薦】+C2000入門(mén)基礎(chǔ)