GPT-5.4超越人類!OpenAI最新模型在桌面任務基準測試中首次超越人類表現
- 吳雨涵

- May 6
- 1 min read
【記者 吳雨涵/科技報導】
2026年3月5日,OpenAI發布了GPT-5.4,這款模型搭載100萬Token的上下文視窗,並具備在軟體環境中自主執行多步驟工作流程的能力。在OSWorld-V基準測試——一個模擬真實桌面生產力任務的評估系統——中,GPT-5.4得分75%,略高於人類基準的72.4%,成為首款在此類測試中超越人類表現的AI模型。

從聊天工具到自主數位工作者
GPT-5.4的發布標誌著AI發展的一個重要里程碑。過去,AI主要被定位為對話工具,用戶需要明確指示每一個步驟;而GPT-5.4能夠自主規劃和執行複雜的多步驟任務,包括在不同應用程式之間切換、處理文件、執行程式碼,以及根據中間結果調整策略。
在知識工作場景中,GPT-5.4在大多數測試中達到或超越了專業人員的表現水準,這意味著AI正在從「輔助工具」向「自主數位同事」的角色轉變。這一轉變對勞動市場、工作流程設計和企業組織架構都將產生深遠影響。
OpenAI的商業里程碑
伴隨GPT-5.4的發布,OpenAI同期宣布年化收入已突破250億美元,並正在評估上市計畫,最快可能於2026年底進行IPO。競爭對手Anthropic的年化收入也接近190億美元。這些數字清楚表明,先進AI模型的市場已迅速成長為科技行業增長最快的領域之一。




Comments