
【新聞發佈日期:2024年11月21日 下午07:50,張宇,北京報導】
2024年11月,微軟正式發布了其最新的小型語言模型Phi-2,這款擁有27億參數的模型在性能上超越了許多更大規模的對手,震撼了整個人工智慧(AI)領域。Phi-2的推出標誌著微軟在AI技術上的又一重大突破,展示了其在語言模型研發方面的領先地位。
Phi-2的研發由微軟研究院主導,該模型在多項基準測試中表現出色,特別是在推理和語言理解能力上,超越了許多參數數量更大的模型。微軟表示,Phi-2的成功得益於高品質的訓練數據和創新的模型縮放技術,使其在保持小型化的同時,仍能提供卓越的性能。
微軟研究院的高級研究員Mojan Javaheripi和合夥研究經理Sébastien Bubeck在官方博客中指出,Phi-2的緊湊尺寸使其成為研究人員的理想平台,可用於機制可解釋性、安全性改進或在各種任務上的微調實驗。他們強調,Phi-2的設計旨在為研究社群提供一個開放且高效的工具,以推動AI技術的進一步發展。
在訓練過程中,Phi-2使用了1.4兆個高品質的「教科書級」數據,並進行了多次訓練迭代。這些數據包括來自網絡的高品質內容,以及專門設計的合成數據集,旨在教授模型常識推理和一般知識。訓練過程耗時14天,使用了96個NVIDIA A100 GPU。
Phi-2的發布引起了業界的廣泛關注。許多專家認為,這標誌著小型語言模型在性能和效率上的新高度,可能會對未來的AI應用產生深遠影響。此外,Phi-2的開源性質使其成為研究人員和開發者的重要資源,促進了AI技術的開放合作與創新。
微軟表示,Phi-2已在Azure AI Studio模型目錄中上線,供研究人員使用。他們強調,Phi-2目前僅供研究用途,未來可能會根據需求進行商業應用的開發。
總而言之,Phi-2的推出展示了微軟在AI領域的強大實力和創新能力。這款小型但功能強大的語言模型為AI技術的未來發展開闢了新的可能性,並為研究社群提供了一個強大的工具,以推動AI技術的進一步突破。
▌參考資料來源
微軟研究院官方博客:
Hugging Face上的Phi-2模型頁面:
NeurIPS 2023會議上的Phi-2演講資料
文章歡迎轉載,轉載請附上本站「FOCO Future|孵科未來」網站原文鏈接,謝謝!
「FOCO Future|孵科未來」誠意尋求跨界合作夥伴!
我們致力於全方位教育領域和各類前沿資訊相關業務合作。
立即開啟合作之旅!
請通過以下方式與我們取得聯繫:
* 訪問我們的【合作聯繫】頁面,填寫線上表單,留下您的聯繫方式和相關合作訊息。
* 直接通過官網線上客服系統,與我們實時溝通。
我們的團隊將盡快回覆您的諮詢,共同探討合作可能。
Comments