OpenAI發布最強模型GPT-5:“可與任何領域的專家交談”
關鍵詞: GPT-5 OpenAI 人工智能 微軟 推理能力
北京時間8月8日凌晨1點,OpenAI正式推出最新大型人工智能模型GPT-5。
GPT-5是OpenAI推出的最新旗艦人工智能模型,被認為是迄今為止最強大的模型之一。它結合了GPT系列的快速響應能力和o系列模型的推理能力,形成一個“統一”的AI系統。GPT-5在多個基準測試中表現出色,包括編程、數學、健康領域和創意寫作等方面。此外,GPT-5在減少“幻覺”(即AI生成不真實信息)方面也有所改進。
GPT-5的發布標志著OpenAI在實現通用人工智能(AGI)道路上的重要一步。OpenAI CEO Sam Altman在發布會上強調,GPT-5的發布標志著“與任何領域的專家交談”的體驗,甚至被描述為“世界上最好的模型”。
據悉,GPT-5在多項基準測試中創下新高,包括數學(AIME 2025無工具得分94.6%)、編碼(SWE-bench Verified 74.9%,Aider Polyglot 88%)、多模態理解(MMMU 84.2%)和醫療(HealthBench Hard 46.2%)。這些成績表明GPT-5在多個領域的表現顯著提升。
在減少“幻覺”方面,GPT-5在匿名ChatGPT流量測試中,回答包含事實錯誤的概率比GPT-4o低45%,推理模式下比OpenAI o3低80%。
在LongFact(長文本事實核查)和FActScore(細粒度事實評分)等基準測試中,GPT-5(帶推理模塊)的幻覺率僅為o3模型的六分之一。長文本生成中,傳統模型易因上下文丟失或注意力分散導致“事實漂移”,而GPT-5通過優化注意力機制和分塊處理策略,確保長篇回答的連貫性和準確性。
OpenAI還引入了“安全完成”訓練,模型在處理模糊或雙重用途問題時提供高層次、安全的回答,并透明解釋拒絕原因,欺騙率從4.8%降至2.1%。
OpenAI還在GPT-5開發過程中進行了廣泛的安全評估,包括5000小時的持續測試。OpenAI稱,GPT-5不會直接拒絕回答可能存在風險的問題,而是采用“安全完成”策略,提供符合安全限制的高層次回答,以避免潛在危害。
值得一提的是,GPT-5現通過ChatGPT向所有用戶開放,包括免費、Plus、Pro和Team用戶,而企業用戶和教育用戶將在未來一周內獲得訪問權限。
其中,免費用戶首次體驗推理模型,達到限額后切換至GPT-5 mini。Plus用戶享有更高使用限額,Pro用戶可無限制訪問GPT-5及更強大的GPT-5 Pro。
此外,OpenAI還為開發者提供GPT-5、GPT-5 mini和GPT-5 nano三種API版本,滿足不同需求。
GPT-5的發布也引發了微軟等科技巨頭的積極反應,微軟已宣布將其整合到其產品線中,包括Microsoft 365 Copilot、面向消費者的Copilot以及供開發者將AI模型融入第三方應用的Azure AI Foundry。
微軟首席執行官薩蒂亞·納德拉(Satya Nadella)表示:“難以相信當前距奧特曼在雷德蒙德向世界首次展示GPT-4僅過去兩年半時間,技術進步之快令人驚嘆?!?/p>
企業文件管理公司Box首席執行官亞倫·列維(Aaron Levie)也表示,以往AI模型在處理復雜數學或長文檔邏輯時常失敗,但GPT-5是“徹底的突破”。他認為:“該模型能保留更多信息,并運用更高水平的推理和邏輯能力進行決策。”
盡管GPT-5在多個方面表現出色,但也有報道指出其在某些基準測試中并未完全達到頂尖水平,例如在某些復雜任務中表現不如其他前沿AI模型。
GPT-5的發布標志著AI領域的一個重要里程碑,它不僅在技術上取得了顯著進步,也在用戶體驗和應用層面帶來了新的可能性。
