OpenAI于4月15日凌晨正式推出GPT-4.1系列模型,由中科大校友??Jiahui Yu??領銜的團隊開發。該系列包含旗艦版GPT-4.1、輕量級GPT-4.1 mini和性價比突出的GPT-4.1 nano,??均支持100萬Token的上下文窗口??,知識截止日期更新至2024年6月。
??編程能力全面碾壓前代??
在反映真實工程能力的SWE-bench Verified測試中,??GPT-4.1以54.6%的得分超越GPT-4o達21.4%??,并能通過單次提示生成完整網頁應用。Aider多語言編碼基準測試中,其表現達到GPT-4o的2倍,且代碼修改冗余率從9%降至2%。
??指令跟隨與長上下文突破??
通過內部評估體系測試,GPT-4.1在困難指令場景的正確率提升至49%。在Scale的MultiChallenge基準中,其得分較GPT-4o提高10.5%。長上下文處理方面,??100萬Token容量相當于React代碼庫的8倍??,且在OpenAI-MRCR多輪指代測試中保持穩定性能。
??價格與多模態優勢??
GPT-4.1的輸入/輸出定價為每百萬Token 2美元和8美元,較GPT-4o降低26%。GPT-4.1 nano則以??0.1美元/百萬Token??的輸入成本成為最快廉價選擇。多模態任務中,GPT-4.1在Video-MME無字幕視頻問答測試中以72.0%刷新紀錄。
OpenAI同時確認,??GPT-4.5 Preview將于7月14日停用??,但其核心特性將融入后續模型。目前GPT-4.1系列已全面開放API訪問。