top of page

GPT-5.4超越人類!OpenAI最新模型在桌面任務基準測試中首次超越人類表現

【記者 吳雨涵/科技報導】

2026年3月5日,OpenAI發布了GPT-5.4,這款模型搭載100萬Token的上下文視窗,並具備在軟體環境中自主執行多步驟工作流程的能力。在OSWorld-V基準測試——一個模擬真實桌面生產力任務的評估系統——中,GPT-5.4得分75%,略高於人類基準的72.4%,成為首款在此類測試中超越人類表現的AI模型。

OpenAI GPT-5.4示意圖

從聊天工具到自主數位工作者

GPT-5.4的發布標誌著AI發展的一個重要里程碑。過去,AI主要被定位為對話工具,用戶需要明確指示每一個步驟;而GPT-5.4能夠自主規劃和執行複雜的多步驟任務,包括在不同應用程式之間切換、處理文件、執行程式碼,以及根據中間結果調整策略。

在知識工作場景中,GPT-5.4在大多數測試中達到或超越了專業人員的表現水準,這意味著AI正在從「輔助工具」向「自主數位同事」的角色轉變。這一轉變對勞動市場、工作流程設計和企業組織架構都將產生深遠影響。

OpenAI的商業里程碑

伴隨GPT-5.4的發布,OpenAI同期宣布年化收入已突破250億美元,並正在評估上市計畫,最快可能於2026年底進行IPO。競爭對手Anthropic的年化收入也接近190億美元。這些數字清楚表明,先進AI模型的市場已迅速成長為科技行業增長最快的領域之一。

 
 
 

Comments


bottom of page