原標題:2024年人工智能年終總結報告|Artificial Analysis
文章來源:新智元
內容字數:4152字
2024人工智能年度回顧:飛速發展的一年
2024年,人工智能領域經歷了前所未有的飛速發展,堪稱里程碑式的一年。各家大模型能力提升顯著,涌現出一批具有突破性進展的模型,對人們的生活和學習方式產生了重大影響。本文將對Artificial Analysis提供的2024年人工智能年度回顧報告進行總結。
1. 大模型領域的軍備競賽
自2022年ChatGPT發布以來,生成式AI領域的“軍備競賽”持續升溫。短短兩年內,多個實驗室已追趕上甚至超越了OpenAI的GPT-4。例如,Claude 3.5 Sonnet、Gemini 1.5 Pro以及Gemini 2.0 Flash等模型都展現出超越GPT-4o的智能水平。雖然美國仍占據LLM領域的主導地位(ChatGPT、Gemini、Claude、Nova、LLama系列),但中國(Qwen2.5 Instruct 72B、DeepSeek V2.5等)和部分歐洲國家也取得了顯著進展。
2. 開源模型的崛起與價格下降
OpenAI不再“Open”并沒有導致開源模型與專有模型性能差距難以逾越。Meta、Mistral和阿里巴巴等發布的開源模型縮小了與專有模型的性能差距。更重要的是,語言模型的推理定價大幅下降,例如GPT-4o mini的價格僅為GPT-4的百分之一,國產模型Qwen2.5 72B的價格也遠低于GPT-4 Turbo。這得益于小模型也能達到之前只有大模型才能達到的智能水平,例如微軟的phi-4模型。
3. 上下文窗口的擴展與多模態能力的增強
上下文窗口長度已達到128K tokens,比2023年三季度增長了32倍,支持多模態輸入(圖像、視頻、音頻)。用戶更傾向于使用頭部企業的產品(OpenAI、Meta、Anthropic、Mistral、Google),選擇模型的關鍵因素包括推理質量、上下文窗口、價格和速度。用戶需求涵蓋信息抽取、長文本總結、文本生成等,并越來越重視模型的多模態能力。大部分開發者同時使用多個模型,72%直接使用已發布模型,24%進行微調,僅4%從頭訓練。
4. 圖像生成技術的飛躍
2024年圖像生成質量顯著提升,在照片真實感、提示符合度和文本渲染方面取得了巨大進步。多個先進的文生圖模型不斷迭代推出,例如Recraft v3。OpenAI的Sora以及快手的可靈、MiniMax的海螺AI、騰訊的混元等模型在該領域展開激烈競爭。
5. 文本轉語音和語音識別的進步
OpenAI的Whisper模型重塑了語音識別領域,云推理服務提供商在響應速度和價格上展開競爭,帶來高性價比體驗。例如,Groq發布的最新Whisper模型比亞馬遜2018年模型價格降低了72倍,速度提升了11倍。文本轉語音模型也達到了新的質量里程碑,超越了之前的云服務供應商。
總而言之,2024年人工智能領域發展迅猛,大模型能力持續提升,價格持續下降,應用場景不斷拓展。 雖然報告中未包含最新的o3和Gemini 2.0 Flash Thinking,但其飛速發展已超乎想象,令人對2025年充滿期待。
聯系作者
文章來源:新智元
作者微信:
作者簡介:智能+中國主平臺,致力于推動中國從互聯網+邁向智能+新紀元。重點關注人工智能、機器人等前沿領域發展,關注人機融合、人工智能和機器人對人類社會與文明進化的影響,領航中國新智能時代。