(資料圖片僅供參考)
9月13日,OpenAI發布具有推理能力的人工智能模型“o1”,備受行業矚目。o1通過模仿人類的思維過程,強化學習和“思維鏈”技術,引導模型自主解決問題。這一特點在解決復雜問題,尤其是在科學、編碼和數學等領域,展現出了超越以往模型的強大能力。據了解,o1和GPT系列模型最大的區別主要在于,該系列模型是在思考之后回答用戶問題,輸出高質量的內容,而非迅速回應無效答案,即用模仿人類思維過程的“慢思考”代替過去追求快速響應的“快思考”,這與國內一家大模型企業在近兩個月前提出的觀點不謀而合——早在今年7月底舉辦的ISC 2024大會上,360集團創始人周鴻祎就宣布,360將“用基于智能體的框架打造慢思考系統,從而增強大模型的慢思考能力”,并在近期多次強調,將“利用智能體框架,讓大模型從快思考轉成慢思考模式,把多個大模型組合起來解決業務問題”。
對于o1的推出,周鴻祎在其最新發布的短視頻中表示,過去建立在大參數、大數據量的模型技術演進終于找到了新的突破方向,也為下一個階段人工智能的進步和應用開辟了巨大的空間。“o1不是像大模型一樣用文字來訓練,而是像自己和自己下棋一樣,通過強化學習來實現這種思維鏈的能力”,周鴻祎說。
周鴻祎用“快思考”和“慢思考”兩項人類具備的能力對思維鏈強大的原因進行了解讀。他指出,快思考的特點是快速直覺、無意識,反應很快但能力不夠強。GPT類大模型通過訓練大量知識,主要學習的是快思考能力,這也是為什么GPT類大模型脫口而出的答案質量不夠穩定,“就像人一樣,不假思索出口成章而不出錯非常難實現”;慢思考的特點則是緩慢、有意識、有邏輯性,需要分很多步驟,類似寫一篇復雜的文章,要先列提綱,根據提綱去搜集數據,收集素材,根據素材進行討論,再把文章寫出來,還要進行潤色和修改。“這一次o1擁有了人類慢思考的特質,在回答問題前會反復地思考,拆解、理解、推理,可能會自己問自己1000遍,然后才能給出最終的答案。”
不過,盡管在“慢思考”能力上取得了巨大突破,o1依然難稱完美。據媒體報道,目前的o1-preview版本依舊存在幻覺問題、運行速度較慢及成本高昂等諸多局限性,限制了其應用范圍。與之相比,更早提出“慢思考”概念的360通過其首創的CoE(Collaboration of Experts,專家協同)技術架構及混合大模型對“慢思考”進行落地實踐,該技術架構已落地在360 AI搜索、360 AI瀏覽器等多款產品中。AI助手通過CoE架構還接入了很多小參數專家模型,在回答簡單問題時調用更精準的“小模型”,在獲得高質量回答的同時還能節約推理資源、提升響應速度,實現對“慢思考”過程中速度過慢等問題的改進。
據了解,近期有國內技術團隊通過將思維鏈優化為CoE協同工作模式,使用任意三個模型協同工作達到了和OpenAI o1-preview類似的反思決策效果。經過21道復雜邏輯推理題測試結果顯示,其效果與OpenAI o1-preview相當,完全超越GPT-4o,有時還能超越o1-preview。
“所以,以后比的不是多快能給你答案,而是給的答案完不完整,這也會改變人工智能服務的業態,人工智能到最后還是要參考人類大腦的組成來構造工作模式”,周鴻祎說。
標簽: