OpenAI 於 2026 年 3 月 4 日正式推出 GPT-5.4 Thinking 與 GPT-5.4 Pro,為 ChatGPT 帶來一次相當明顯的技術升級。相比 GPT-5.2 與 GPT-5.3,新一代模型在長鏈推理( Long-Chain Reasoning )、長上下文處理能力( Long Context )、人工智能代理( AI Agent )以及電腦操作能力( Computer-Use )等方面均有顯著提升,同時加入全新的思考模式( Thinking Mode ),讓 AI 在處理複雜任務時可以先建立分析框架,再輸出完整結果。這些改變意味 ChatGPT 不再只是聊天或內容生成工具,而是逐步轉型為能處理研究分析、數據整理與自動化工作的 AI 平台。然而新版本推出短短數日,網上評價已迅速出現分歧:不少開發者與專業用戶形容 GPT-5.4 是「AI 工作流程的大升級」,但亦有不少日常聊天與創作型用家批評模型語氣較為機械、回應速度較慢,甚至認為整體體驗不如 GPT-5.3 Instant 自然有趣。這種兩極反應,亦反映 GPT-5.4 的設計方向已明顯由「聊天 AI」轉向「工作型 AI」。


長鏈推理與長上下文能力大幅提升
複雜任務 Benchmark 表現明顯進步現更強
GPT-5.4 最核心的升級之一,是針對長鏈推理與長上下文任務處理進行優化。過去 AI 在處理多步驟問題時,往往容易出現邏輯斷裂、遺漏條件或忽略前文資訊的情況,而 GPT-5.4 在長對話與複雜任務中能更穩定保持上下文一致。例如在市場研究、政策比較、產品分析或旅行規劃等情境中,模型可以同時整合多個資料來源並維持清晰推理結構,令整體分析更加完整。多個 AI Benchmark 測試亦顯示,新模型在知識型任務與電腦操作工作流程中的表現明顯提升,甚至在部分 Benchmark 中超越人類基準。對不少開發者與研究人員而言,這種能力意味 AI 在 數據分析、研究報告與專業文件整理方面的可靠度已有明顯進步。

思考模式改變 AI 工作流程
先建立計劃再生成完整結果
GPT-5.4 Thinking 的另一個重要改變,是引入更接近人類思考方式的思考模式。在處理較複雜任務時,模型不會立即輸出最終答案,而是先生成一個簡短的分析框架或工作計劃,例如研究方向、比較結構或任務步驟。用戶可以先檢視並修改這個計劃,再要求 AI 生成完整內容。這種「先規劃再輸出」的方式,可以有效避免 AI 一開始走錯方向,也能減少反覆修改 Prompt 的情況。對於撰寫商業報告、整理政策資料或建立研究架構等需要長時間整理資訊的工作而言,這種流程比過去直接生成答案更有效率,也更貼近現實世界的工作方式。

AI 代理與電腦操作能力升級
AI 開始能真正完成工作任務
GPT-5.4 另一項重要升級,是整合更完整的 AI 代理與電腦操作能力。模型不但能理解 Screenshot 或應用程式介面,還可以生成滑鼠與鍵盤操作步驟,甚至輸出自動化腳本來執行任務,例如整理資料、操作 SaaS 工具或跨平台執行工作流程。這意味 AI 的角色正逐漸由「回答問題」轉變為「協助完成任務」。對不少開發者而言,這種能力尤其重要,因為它讓 AI 可以直接參與整個數碼工作流程,而不再只是生成文字內容。隨著工具整合能力與 API 生態逐步完善,AI 代理未來有機會成為企業自動化與數碼工作流程的重要部分。


專業用戶高度評價工作能力
日常聊天用家卻批評語氣與速度
然而在 GPT-5.4 推出後,網上討論亦迅速出現兩極化。許多開發者與企業用戶普遍給予正面評價,認為新模型在 Coding、數據分析與文件處理方面的表現明顯提升,有人甚至形容 GPT-5.4 是目前最適合用於 專業工作流程 的 AI 模型之一。不少早期使用者亦指出,新模型在長上下文任務中的穩定度更高,錯誤率亦有所下降。不過另一方面,不少日常聊天與創作型用戶則提出批評,認為 GPT-5.4 的語氣較為正式甚至略顯機械,創意寫作表現不如 GPT-5.3 Instant 或早期模型自然。部分用戶亦指出思考模式在複雜任務中雖然更準確,但生成速度相對較慢,對於日常聊天或簡單問題未必方便。

ChatGPT 模型定位逐漸分工
聊天助手與 AI 工作平台並存
隨著 GPT-5.4 推出,ChatGPT 的模型定位亦逐漸清晰。GPT-5.3 Instant 仍然主打速度與自然語氣,適合日常聊天、簡單寫作與快速問答;而 GPT-5.4 Thinking 與 GPT-5.4 Pro 則更偏向處理長研究、技術文件、Coding Workflow 及自動化任務等需要較高推理能力的情境。換言之,OpenAI 正逐步把 ChatGPT 分為兩個角色:一個是快速聊天助手,另一個則是能處理複雜工作流程的 AI 工作引擎。對於開發者、研究人員與企業用戶而言,GPT-5.4 的推出代表 AI 在專業工作領域的能力再次向前邁進,但對於一般聊天用戶而言,最適合的模型或許仍然是更快速與自然的 Instant 版本。

訂閱全新生活著數優惠平台「港角」電子報,及關注「港角」 Facebook 及 Instagram ,即時收到最新生活資訊及著數優惠!想聯絡我們讓更多觀眾了解你的品牌資訊,即刻電郵我們。






