AI 晶片巨擘輝達 (NVDA-US) 日前發表最新 AI 模型 Llama-3.1-Nemotron-70B-Instruct,性能超越業界領先的 OpenAI 的 GPT-4o 跟 Anthropic 的 Claude3.5,此舉意味著 AI 領域競爭格局的重大變化。
這款模型在知名 AI 平台 Hugging Face 上發布,雖然沒有太大的宣傳,但憑藉其在多個基準測試中出色的表現,迅速引起業界關注。
根據輝達的報告,該模型在關鍵評估中取得優異成績,包括在 Arena Hard 基準測試中得 85 分,在 AlpacaEval 2 LC 中得 57.6 分,以及在 GPT-4-Turbo MT-Bench 中得 8.98 分。這些成績超過 OpenAI 的 GPT-4 和 Anthropic 的 Claude 3.5 Sonnet 等備受推崇的模型,使輝達在 AI 語言理解和生成方面迅速崛起,成為業界新領導者。
Llama-3.1-Nemotron-70B-Instruct 的發表,除標誌著輝達的關鍵時刻外,也代表輝達戰略擴張的開始,可能會改變 AI 行業的格局,挑戰傳統的軟體公司在大語言模型 (LLM) 開發中的主導地位。
輝達開發 Llama-3.1-Nemotron-70B-Instruct 的方式是,利用先進的訓練技術,包括「從人類反饋中學習的強化學習」(RLHF),對 Meta(META-US) 的開源 Llama 3.1 模型進行優化。這種方法使 AI 能 0 從人類的偏好中學習,可能會帶來更加自然和符合語境的回應。
輝達 Llama-3.1-Nemotron-70B-Instruct 不僅性能優異,且能處理複雜查詢,無需額外的提示或特定的標記。在一次演示中,它正確地回答「草莓裡有多少個 r?」,展現自身對語言的深刻理解和提供清晰解釋的能力。
這些結果的特別重要之處在於強調「對齊」(alignment) 的概念,這一 AI 研究術語指的是模型輸出與使用者需求和偏好的匹配程度。對企業來說,這意味著減少錯誤、提供更有幫助的回應,最終提高客戶滿意度。
為了支持企業探索 AI 解決方案,輝達還透過 build.nvidia.com 平台提供免費的託管推理服務,並且兼容 OpenAI 的 API 接口,使先進 AI 技術變得更易於獲取,幫助各行各業的公司進行實驗和實施。
儘管如此,輝達也提醒使用者,這款新模型在數學或法律等特殊領域的應用上可能存在一定的風險,企業需謹慎使用,以防止錯誤或濫用。
隨著開發者對 Llama-3.1-Nemotron-70B-Instruct 的測試,可能很快就會看到該模型在醫療、金融、教育等領域的新應用出現。它的成功將最終取決於是否能將令人印象深刻的基準得分,轉化為實質解決方案。
輝達發表新模型標誌著 AI 系統開發的競爭進入了一個新的階段,輝達的舉動將迫使其他科技公司重新考慮他們的策略,並加速研發進程。這一切發生在輝達推出 NVLM 1.0 系列多模態模型之後,其中包括 72 億參數的 NVLM-D-72B。
這些最新的發佈,尤其是開源的 NVLM 專案,顯示輝達 AI 雄心不僅僅是與競爭對手抗衡,還有具備挑戰市場主導者的能力。