【生活中心/綜合報導】人工智慧新創公司OpenAI今天推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。這款模型能以人類思考方式回答問題,專門應對數學和科學這類需要邏輯推理的任務。

OpenAI指出,OpenAI o1能正確解答83%的國際數學奧林匹亞競賽題目,相較之下,今年5月上線的GPT-4o僅能正確解答13%的題目。不過,GPT-4o在資訊檢索方面表現更為出色;OpenAI o1則是專門應對需要邏輯推理的任務,且在回答問題前會花更多時間思考題目,「就像人類一樣」。

o1上線後,會在回答問題前,先仔細思考,而不是立即跑出答案。OpenAI員工以「系統1」和「系統2」思考,來區分o1系列與之前模型的區別,ChatGPT 已經從僅使用系統 1(快速、自動、直觀、易出錯),進化到可使用系統 2 思維(緩慢、深思熟慮、有意識、可靠)。

OpenAI首席科學家帕喬基(Jakub Pachocki)和技術研究人員席多(Szymon Sidor)示範用OpenAI o1技術解決一個「博士級」的化學問題並根據患者的症狀和病史詳細報告,診斷出疾病。

帕喬基表示:「使用ChatGPT早期模型時,你問它一個問題,它會立即開始回答。但推理模型(OpenAI o1)需要時間。它能夠用英文思考問題,嘗試將問題拆解並尋找解決角度,努力提供最佳解答」。

OpenAI執行長山姆·阿特曼 (Sam Altman)透露,OpenAI o1在2024國際資訊奧林匹亞競賽(IOI)中,在每題嘗試50次條件下取得了213分,屬於選手中前49%的成績。「如果允許它每道題嘗試1萬次,就能獲得362.14分,是高於金牌選手門檻,可獲得金牌。」

目前Google和Meta等公司也在開發類似的推理技術;微軟(Microsoft)和其子公司GitHub,正致力將OpenAI的新系統整合到產品中。

這次發佈的o1系列分為三個型號:o1,新的大模型天花板,過於強大,目前不方便對外公開;o1-preiview,o1的早期版本,可以立即提供給ChatGPT付費用戶和API用戶;o1-mini,速度更快、性價比更高,適用於需要推理和無需廣泛世界知識的任務。

ChatGPT Plus和ChatGPT Teams的用戶,即日起可以使用OpenAI o1preview和o1-mini。

OpenAI推出能夠解決複雜推理的新版ChatGPT,定名OpenAI o1。取自OpenAI YouTube