<legend id="p2s3f"></legend>

    1. <kbd id="p2s3f"><rp id="p2s3f"></rp></kbd>

      俺来也俺也啪www色,亚洲国产中文乱,欧美中文字幕精品人妻,亚洲精品成人,午夜诱惑,亚洲原创无码,亚洲中文国产字幕,全亚洲精品成人

      OpenAI上新GPT-5.4 mini與nano, 澳門六開獎結(jié)果2026開獎記錄查詢 性能逼近旗艦,成本僅需三分之一

      3月18日消息,今日,OpenAI推出GPT-5.4 mini和GPT-5.4 nano模型。這兩款模型針對快速、大批量AI工作負(fù)載設(shè)計,屬于低成本的大語言模型產(chǎn)品。澳門一碼一肖一特一中中什么號碼

      適用于AI工作流的小型模型

      對許多AI工作流而言,高效的模型通常需要在性能、響應(yīng)速度及工具調(diào)用能力之間取得平衡。

      OpenAI表示:“這些模型專為對延遲敏感的工作負(fù)載設(shè)計,在此類場景中,延遲直接影響產(chǎn)品體驗。例如:需要快速響應(yīng)的編程助手、執(zhí)行輔助任務(wù)的子智能體 (Subagents)、捕捉并解讀屏幕內(nèi)容的計算機操作系統(tǒng),以及能對圖像進(jìn)行實時推理的多模態(tài)應(yīng)用。”

      該公司指出:“在這些應(yīng)用場景中,適用的模型往往并非參數(shù)規(guī)模最大的,而是響應(yīng)迅速、能穩(wěn)定調(diào)用工具,且在專業(yè)任務(wù)中表現(xiàn)正常的模型。”

      相較于GPT-5 mini,GPT-5.4 mini在編程、推理、多模態(tài)理解及工具使用方面有所提升,運行速度約為前者的兩倍。

      GPT-5.4 nano則是體積更小、速度更快的版本,主要針對分類、數(shù)據(jù)提取、排序及較簡單的編程輔助任務(wù)。

      性能表現(xiàn)

      在評估體量較小、成本較低的模型時,性能和性價比是主要參考指標(biāo)。OpenAI列舉了新模型相較于舊模型的測試數(shù)據(jù):

      ? 在SWE-bench Pro基準(zhǔn)測試中,GPT-5.4 mini得分為53.40%,而GPT-5 mini為45.69%。

      ? 在Terminal-Bench 2.0測試中,GPT-5.4 mini達(dá)到59.30%,而GPT-5 mini為38.20%。

      ? 在GPQA Diamond測試中,GPT-5.4 mini得分為85.48%,接近GPT-5.4的93.00%。

      ? OSWorld-Verified結(jié)果顯示,GPT-5.4 mini得分為70.60%,高于GPT-5 mini的42%。

      測試結(jié)果顯示,GPT-5.4 mini的通過率接近GPT-5.4的水平,且執(zhí)行速度更快。在衡量模型正確解決問題能力的基準(zhǔn)測試中,輕量級的GPT-5.4 mini與全功能版GPT-5.4表現(xiàn)相近。

      GPT-5.4 nano的表現(xiàn)則介于上述兩者之間。例如,其在SWE-bench Pro上得分為52.39%,在Terminal Bench 2.0上為46.30%。數(shù)據(jù)低于GPT-5.4 mini,但高于GPT-5 mini。

      子智能體與多模態(tài)任務(wù)

      在智能體生態(tài)系統(tǒng)中,AI的架構(gòu)可以模擬現(xiàn)實中的協(xié)作模式。例如,將能力較強的AI模型(如GPT-5.4 Thinking)與速度較快、低成本的模型(如GPT-5.4 mini)結(jié)合使用,類似于資深工程師帶領(lǐng)初級工程師協(xié)同工作。

      智能體系統(tǒng)可組合不同規(guī)模的模型,由大模型負(fù)責(zé)任務(wù)規(guī)劃,小模型負(fù)責(zé)執(zhí)行子任務(wù)。在此語境下,GPT-5.4 mini可承擔(dān)子智能體的工作,例如搜索代碼庫、審查文件及處理文檔。

      OpenAI表示:“GPT-5.4 mini具備多模態(tài)任務(wù)處理能力,適用于涉及計算機使用的任務(wù)。該模型能解讀密集型用戶界面的截圖,以輔助完成計算機操作任務(wù)。”

      可用性與定價

      GPT-5.4 mini現(xiàn)已通過API、Codex和ChatGPT多個版本提供。免費版和Go級用戶可通過附加菜單中的“Thinking”選項調(diào)用GPT-5.4 mini。OpenAI表示:“對于其他所有用戶,GPT-5.4 mini將作為GPT-5.4 Thinking 觸發(fā)速率限制后的備選模型。”

      該公司表示,針對程序員,GPT-5.4 mini 已覆蓋Codex 應(yīng)用、命令行界面 (CLI)、集成開發(fā)環(huán)境 (IDE) 擴展及網(wǎng)頁端。OpenAI 指出,這款mini 模型“僅消耗GPT-5.4配額的30%,讓開發(fā)者能在Codex 中以約三分之一的成本處理簡單編程任務(wù)”。此外,Codex 還可將任務(wù)委托給GPT-5.4 mini 子智能體,從而讓推理強度較低的工作在低成本模型上運行。

      成本對比數(shù)據(jù)如下:

      ? GPT-5.4 mini 定價為每百萬輸入Token 0.75美元,每百萬輸出Token 4.50美元,擁有40萬詞的上下文窗口 (Context Window)。

      ? GPT-5.4 nano 僅通過 API 提供,價格為每百萬輸入 Token 0.20美元,每百萬輸出 Token 1.25美元。

      相比之下,GPT-5.4的定價為每百萬輸入 Token 2.50美元,每百萬輸出 Token 15.00美元。

      客戶測試反饋

      科技公司 Hebbia 致力于開發(fā)幫助專業(yè)人士利用自然語言處理文檔庫的工具。其產(chǎn)品主要應(yīng)用于金融、法律和科研等需要同時分析多份文檔的領(lǐng)域。

      Hebbia 首席技術(shù)官 Aabhas Sharma 表示:“在同類模型中,GPT-5.4 mini 提供了較為穩(wěn)定的端到端性能。在我們的評估中,它在部分輸出任務(wù)和引用召回率上的表現(xiàn)達(dá)到了預(yù)期,且成本有所降低。此外,其端到端通過率和來源歸因能力在部分測試中高于體量更大的 GPT-5.4模型。”

      數(shù)字工作區(qū) Notion 是一款常用的生產(chǎn)力工具(本文即在 Notion 中撰寫)。該軟件為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)提供了統(tǒng)一平臺,用戶可利用其構(gòu)建零代碼的信息管理微應(yīng)用,用于追蹤文章創(chuàng)作、內(nèi)部項目等。

      Notion AI 工程負(fù)責(zé)人 Abhisek Modi 表示:“GPT-5.4 mini 在處理定義明確的任務(wù)時,表現(xiàn)出較高的精準(zhǔn)度。在頁面編輯方面,它處理復(fù)雜格式的能力接近 GPT-5.2,而算力消耗相對較低。”

      Modi 補充道:“此前,通常只有旗艦?zāi)P筒拍芊€(wěn)定處理智能體工具調(diào)用 (Agentic Tool Calling)。目前,像 GPT-5.4 mini 和 nano 這樣的小型模型也具備了相關(guān)能力。這將便于用戶在 Notion 上構(gòu)建自定義智能體 (Custom Agents) 時選擇合適的模型。”(易句)

      (本文由AI翻譯,網(wǎng)易編輯負(fù)責(zé)校對)澳門天天彩免費資料大全免費查詢

      王鳳枝 本文來源:網(wǎng)易智能 責(zé)任編輯: 王鳳枝_NT2541

      出處:江蘇江大工程管理有限公司

      歡迎向您的朋友推薦本站或本資料,一起交流!