3月18日消息,今日,OpenAI推出GPT-5.4 mini和GPT-5.4 nano模型。這兩款模型針對快速、大批量AI工作負載設計,屬于低成本的大語言模型產品。澳門一碼一肖一特一中中什么號碼
適用于AI工作流的小型模型
對許多AI工作流而言,高效的模型通常需要在性能、響應速度及工具調用能力之間取得平衡。
OpenAI表示:“這些模型專為對延遲敏感的工作負載設計,在此類場景中,延遲直接影響產品體驗。例如:需要快速響應的編程助手、執行輔助任務的子智能體 (Subagents)、捕捉并解讀屏幕內容的計算機操作系統,以及能對圖像進行實時推理的多模態應用。”
該公司指出:“在這些應用場景中,適用的模型往往并非參數規模最大的,而是響應迅速、能穩定調用工具,且在專業任務中表現正常的模型。”
相較于GPT-5 mini,GPT-5.4 mini在編程、推理、多模態理解及工具使用方面有所提升,運行速度約為前者的兩倍。
GPT-5.4 nano則是體積更小、速度更快的版本,主要針對分類、數據提取、排序及較簡單的編程輔助任務。
性能表現
在評估體量較小、成本較低的模型時,性能和性價比是主要參考指標。OpenAI列舉了新模型相較于舊模型的測試數據:
? 在SWE-bench Pro基準測試中,GPT-5.4 mini得分為53.40%,而GPT-5 mini為45.69%。
? 在Terminal-Bench 2.0測試中,GPT-5.4 mini達到59.30%,而GPT-5 mini為38.20%。
? 在GPQA Diamond測試中,GPT-5.4 mini得分為85.48%,接近GPT-5.4的93.00%。
? OSWorld-Verified結果顯示,GPT-5.4 mini得分為70.60%,高于GPT-5 mini的42%。
測試結果顯示,GPT-5.4 mini的通過率接近GPT-5.4的水平,且執行速度更快。在衡量模型正確解決問題能力的基準測試中,輕量級的GPT-5.4 mini與全功能版GPT-5.4表現相近。
GPT-5.4 nano的表現則介于上述兩者之間。例如,其在SWE-bench Pro上得分為52.39%,在Terminal Bench 2.0上為46.30%。數據低于GPT-5.4 mini,但高于GPT-5 mini。
子智能體與多模態任務
在智能體生態系統中,AI的架構可以模擬現實中的協作模式。例如,將能力較強的AI模型(如GPT-5.4 Thinking)與速度較快、低成本的模型(如GPT-5.4 mini)結合使用,類似于資深工程師帶領初級工程師協同工作。
智能體系統可組合不同規模的模型,由大模型負責任務規劃,小模型負責執行子任務。在此語境下,GPT-5.4 mini可承擔子智能體的工作,例如搜索代碼庫、審查文件及處理文檔。
OpenAI表示:“GPT-5.4 mini具備多模態任務處理能力,適用于涉及計算機使用的任務。該模型能解讀密集型用戶界面的截圖,以輔助完成計算機操作任務。”
可用性與定價
GPT-5.4 mini現已通過API、Codex和ChatGPT多個版本提供。免費版和Go級用戶可通過附加菜單中的“Thinking”選項調用GPT-5.4 mini。OpenAI表示:“對于其他所有用戶,GPT-5.4 mini將作為GPT-5.4 Thinking 觸發速率限制后的備選模型。”
該公司表示,針對程序員,GPT-5.4 mini 已覆蓋Codex 應用、命令行界面 (CLI)、集成開發環境 (IDE) 擴展及網頁端。OpenAI 指出,這款mini 模型“僅消耗GPT-5.4配額的30%,讓開發者能在Codex 中以約三分之一的成本處理簡單編程任務”。此外,Codex 還可將任務委托給GPT-5.4 mini 子智能體,從而讓推理強度較低的工作在低成本模型上運行。
成本對比數據如下:
? GPT-5.4 mini 定價為每百萬輸入Token 0.75美元,每百萬輸出Token 4.50美元,擁有40萬詞的上下文窗口 (Context Window)。
? GPT-5.4 nano 僅通過 API 提供,價格為每百萬輸入 Token 0.20美元,每百萬輸出 Token 1.25美元。
相比之下,GPT-5.4的定價為每百萬輸入 Token 2.50美元,每百萬輸出 Token 15.00美元。
客戶測試反饋
科技公司 Hebbia 致力于開發幫助專業人士利用自然語言處理文檔庫的工具。其產品主要應用于金融、法律和科研等需要同時分析多份文檔的領域。
Hebbia 首席技術官 Aabhas Sharma 表示:“在同類模型中,GPT-5.4 mini 提供了較為穩定的端到端性能。在我們的評估中,它在部分輸出任務和引用召回率上的表現達到了預期,且成本有所降低。此外,其端到端通過率和來源歸因能力在部分測試中高于體量更大的 GPT-5.4模型。”
數字工作區 Notion 是一款常用的生產力工具(本文即在 Notion 中撰寫)。該軟件為結構化和非結構化數據提供了統一平臺,用戶可利用其構建零代碼的信息管理微應用,用于追蹤文章創作、內部項目等。
Notion AI 工程負責人 Abhisek Modi 表示:“GPT-5.4 mini 在處理定義明確的任務時,表現出較高的精準度。在頁面編輯方面,它處理復雜格式的能力接近 GPT-5.2,而算力消耗相對較低。”
Modi 補充道:“此前,通常只有旗艦模型才能穩定處理智能體工具調用 (Agentic Tool Calling)。目前,像 GPT-5.4 mini 和 nano 這樣的小型模型也具備了相關能力。這將便于用戶在 Notion 上構建自定義智能體 (Custom Agents) 時選擇合適的模型。”(易句)
(本文由AI翻譯,網易編輯負責校對)澳門天天彩免費資料大全免費查詢
王鳳枝 本文來源:網易智能 責任編輯: 王鳳枝_NT2541