top of page

Search

GPT-5.4超越人類！OpenAI最新模型在桌面任務基準測試中首次超越人類表現

吳雨涵
May 6
1 min read

【記者吳雨涵／科技報導】

2026年3月5日，OpenAI發布了GPT-5.4，這款模型搭載100萬Token的上下文視窗，並具備在軟體環境中自主執行多步驟工作流程的能力。在OSWorld-V基準測試——一個模擬真實桌面生產力任務的評估系統——中，GPT-5.4得分75%，略高於人類基準的72.4%，成為首款在此類測試中超越人類表現的AI模型。

OpenAI GPT-5.4示意圖

從聊天工具到自主數位工作者

GPT-5.4的發布標誌著AI發展的一個重要里程碑。過去，AI主要被定位為對話工具，用戶需要明確指示每一個步驟；而GPT-5.4能夠自主規劃和執行複雜的多步驟任務，包括在不同應用程式之間切換、處理文件、執行程式碼，以及根據中間結果調整策略。

在知識工作場景中，GPT-5.4在大多數測試中達到或超越了專業人員的表現水準，這意味著AI正在從「輔助工具」向「自主數位同事」的角色轉變。這一轉變對勞動市場、工作流程設計和企業組織架構都將產生深遠影響。

OpenAI的商業里程碑

伴隨GPT-5.4的發布，OpenAI同期宣布年化收入已突破250億美元，並正在評估上市計畫，最快可能於2026年底進行IPO。競爭對手Anthropic的年化收入也接近190億美元。這些數字清楚表明，先進AI模型的市場已迅速成長為科技行業增長最快的領域之一。

Recent Posts

溼地公園中成片50年池杉樹林，筆直挺立於水面，倒影如畫

湖北最大人工水上森林／仙桃夢裡水鄉生態濕地宛若天然畫卷

兩岸記者走進湖北天門陸泉生態茶園台青記者深度體驗茶文化：換上漢服採茶每一口都喝得到歷史

兩岸記者走進湖北天門陸泉生態茶園台青記者深度體驗茶文化：換上漢服採茶每一口都喝得到歷史

AI 突破數學極限：OpenAI 模型推翻長達 80 年的幾何學猜想

AI 突破數學極限：OpenAI 模型推翻長達 80 年的幾何學猜想

Comments

bottom of page