OpenAI發布最強模型GPT-5：“可與任何領域的專家交談”

2025-08-08 來源：電子工程專輯原創文章

北京時間8月8日凌晨1點，OpenAI正式推出最新大型人工智能模型GPT-5。

GPT-5是OpenAI推出的最新旗艦人工智能模型，被認為是迄今為止最強大的模型之一。它結合了GPT系列的快速響應能力和o系列模型的推理能力，形成一個“統一”的AI系統。GPT-5在多個基準測試中表現出色，包括編程、數學、健康領域和創意寫作等方面。此外，GPT-5在減少“幻覺”（即AI生成不真實信息）方面也有所改進。

GPT-5的發布標志著OpenAI在實現通用人工智能（AGI）道路上的重要一步。OpenAI CEO Sam Altman在發布會上強調，GPT-5的發布標志著“與任何領域的專家交談”的體驗，甚至被描述為“世界上最好的模型”。

據悉，GPT-5在多項基準測試中創下新高，包括數學（AIME 2025無工具得分94.6%）、編碼（SWE-bench Verified 74.9%，Aider Polyglot 88%）、多模態理解（MMMU 84.2%）和醫療（HealthBench Hard 46.2%）。這些成績表明GPT-5在多個領域的表現顯著提升。

在減少“幻覺”方面，GPT-5在匿名ChatGPT流量測試中，回答包含事實錯誤的概率比GPT-4o低45%，推理模式下比OpenAI o3低80%。

在LongFact（長文本事實核查）和FActScore（細粒度事實評分）等基準測試中，GPT-5（帶推理模塊）的幻覺率僅為o3模型的六分之一。長文本生成中，傳統模型易因上下文丟失或注意力分散導致“事實漂移”，而GPT-5通過優化注意力機制和分塊處理策略，確保長篇回答的連貫性和準確性。

OpenAI還引入了“安全完成”訓練，模型在處理模糊或雙重用途問題時提供高層次、安全的回答，并透明解釋拒絕原因，欺騙率從4.8%降至2.1%。

OpenAI還在GPT-5開發過程中進行了廣泛的安全評估，包括5000小時的持續測試。OpenAI稱，GPT-5不會直接拒絕回答可能存在風險的問題，而是采用“安全完成”策略，提供符合安全限制的高層次回答，以避免潛在危害。

值得一提的是，GPT-5現通過ChatGPT向所有用戶開放，包括免費、Plus、Pro和Team用戶，而企業用戶和教育用戶將在未來一周內獲得訪問權限。

其中，免費用戶首次體驗推理模型，達到限額后切換至GPT-5 mini。Plus用戶享有更高使用限額，Pro用戶可無限制訪問GPT-5及更強大的GPT-5 Pro。

此外，OpenAI還為開發者提供GPT-5、GPT-5 mini和GPT-5 nano三種API版本，滿足不同需求。

GPT-5的發布也引發了微軟等科技巨頭的積極反應，微軟已宣布將其整合到其產品線中，包括Microsoft 365 Copilot、面向消費者的Copilot以及供開發者將AI模型融入第三方應用的Azure AI Foundry。

微軟首席執行官薩蒂亞·納德拉（Satya Nadella）表示：“難以相信當前距奧特曼在雷德蒙德向世界首次展示GPT-4僅過去兩年半時間，技術進步之快令人驚嘆?！?/p>

企業文件管理公司Box首席執行官亞倫·列維(Aaron Levie)也表示，以往AI模型在處理復雜數學或長文檔邏輯時常失敗，但GPT-5是“徹底的突破”。他認為：“該模型能保留更多信息，并運用更高水平的推理和邏輯能力進行決策。”

盡管GPT-5在多個方面表現出色，但也有報道指出其在某些基準測試中并未完全達到頂尖水平，例如在某些復雜任務中表現不如其他前沿AI模型。

GPT-5的發布標志著AI領域的一個重要里程碑，它不僅在技術上取得了顯著進步，也在用戶體驗和應用層面帶來了新的可能性。

行業動態

OpenAI發布最強模型GPT-5：“可與任何領域的專家交談”

無人機巨頭也“跨界”，首款掃地機器人起售4699元

從國產突圍到全球領跑——解密英迪芯微的八年發展之路

熱讀文章

苗圩出席統籌推進疫情防控和產業轉型升級促進制造業通信業穩定發展發布會

一圖讀懂2020年《政府工作報告》

工業富聯：擬7763萬美元收購鴻海精密美國子公司相關資產

国产动作大片中文字幕-久久成人a毛片免费观看网站-日韩亚洲欧美中文高清-亚洲黑人巨大videos-亚洲国产欧美在线观看的

OpenAI發布最強模型GPT-5：“可與任何領域的專家交談”