<span id="3dn8r"></span>
    1. <span id="3dn8r"><optgroup id="3dn8r"></optgroup></span><li id="3dn8r"><meter id="3dn8r"></meter></li>

        “agent”一詞令人沮喪,GPT-4級模型已不值一提,大神程序員盤點「大模型的2024」

        “agent”一詞令人沮喪,GPT-4級模型已不值一提,大神程序員盤點「大模型的2024」

        原標題:“agent”一詞令人沮喪,GPT-4級模型已不值一提,大神程序員盤點「大模型的2024」
        文章來源:人工智能學家
        內容字數:28401字

        2024年大語言模型(LLM)領域回顧:驚喜與挑戰并存

        2024年被業內人士稱為“AGI元年”,大模型領域發生了翻天覆地的變化。本文總結了Simon Willison在《Things we learned about LLMs in 2024》一文中對2024年LLM領域的關鍵發現,并對其進行了精編。

        1. GPT-4的護城河被突破

        2023年,GPT-4的性能一度遙不可及。但2024年,多個組織的模型在Chatbot Arena Leaderboard上的得分超過了GPT-4-0314,例如谷歌的Gemini 1.5 Pro,以及Anthropic的Claude 3系列。這標志著GPT-4級的模型不再是少數機構的專利,訓練此類模型已不再是特別值得一提的成就。

        2. 筆記本電腦也能運行GPT-4級模型

        得益于訓練和推理性能的顯著提升,如今即使是普通的64GB內存筆記本電腦也能運行多個GPT-4級模型,這在2023年是不可想象的。Meta的Llama 3.2系列模型也展現了在較小尺寸下取得的令人驚喜的效果。

        3. LLM價格大幅下降

        2024年,LLM的使用成本急劇下降,這主要歸功于競爭加劇和效率提高。各家模型提供商的價格戰使得使用先進模型的成本降低了數十倍,這對于個人用戶和小型企業來說是個好消息,也降低了LLM對環境的影響。

        4. 多模態模型的興起

        多模態大語言模型(MLLM)在2024年得到廣泛應用,幾乎所有模型提供商都推出了支持圖像、音頻和視頻輸入的模型。多模態能力極大地拓展了LLM的應用范圍,也為用戶提供了更豐富的交互方式。

        5. 語音和實時視頻模式的應用

        語音和實時視頻模式的出現,讓科幻照進現實。OpenAI的GPT-4o和谷歌的Gemini都支持音頻輸入和輸出,并能進行逼真的語音對話。實時視頻模式也開始出現,用戶可以與模型實時分享相機畫面并進行交流。

        6. Prompt驅動的應用生成成為商品

        通過編寫合適的prompt,LLM可以生成完整的交互式應用,這一能力在2024年得到廣泛應用。許多團隊都構建了類似的系統,這項功能已成為一種商品,可以有效地與所有領先的模型進行競爭。

        7. 強大模型的普及與付費模式的轉變

        2024年,強大的模型在幾個月內就變得普及,OpenAI和Anthropic都向所有用戶免費提供了其強大的模型。然而,免費使用SOTA模型的時代可能已經結束,付費訂閱模式將成為主流。

        8. 智能體(Agent)的局限性

        盡管“智能體”概念備受關注,但其定義仍然模糊,實際應用也面臨挑戰,尤其是在應對“輕信”(gullibility)問題上進展甚微。

        9. 自動評估的重要性

        為LLM驅動的系統編寫優秀的自動評估,是構建有用應用的關鍵技能。擁有強大的評估套件能夠加快模型迭代,并構建更可靠、更有用的產品功能。

        10. 蘋果的MLX庫與Apple Intelligence的差距

        蘋果公司的MLX庫為Apple Silicon帶來了強大的模型運行能力,但其自家的Apple Intelligence功能卻令人失望,與其他領先的LLM相比差距明顯。

        11. 推理擴展模型的興起

        OpenAI的o1模型開辟了一種新的模型擴展方法:通過在推理上花費更多計算量來解決更難的問題,而不是單純增加訓練計算量。

        12. 中國在LLM訓練方面的進展

        DeepSeek v3等模型的出現,顯示出中國在LLM訓練方面的顯著進展,尤其是在訓練效率優化方面,這可能與美國對中國出口GPU的限制有關。

        13. LLM環境影響的改善

        模型效率的提高降低了運行prompt的能耗和對環境的影響,這消除了部分人對LLM環境影響的擔憂。

        14. 數據中心建設的必要性

        LLM成本的下降引發了對未來數據中心建設必要性的討論,過度的基礎設施建設可能會造成資源浪費和環境問題。

        15. “泔水”(Slop)時代的到來

        2024年,“泔水”一詞被用來形容人工智能生成的未經請求和未經審查的內容,這突顯了濫用生成式人工智能的風險。

        16. 合成訓練數據的有效性

        合成訓練數據在LLM訓練中發揮著越來越重要的作用,它可以幫助引導模型走向正確的方向,并提高訓練效率。

        17. 有效利用LLM的挑戰

        雖然LLM功能強大,但要充分利用它們并非易事,需要用戶具備深入的理解和豐富的經驗,才能避免其陷阱。

        18. 認知差距的擴大

        公眾對LLM的認知存在巨大差距,這可能會影響到這項技術對社會的積極影響。

        19. 對LLM的批判性思考

        LLM值得被批判性地審視,需要對環境影響、數據可靠性、不正當應用等問題進行討論,并找到解決方案,以確保其正面應用大于負面影響。

        總而言之,2024年是LLM領域發展迅猛的一年,既帶來了令人驚喜的進步,也帶來了新的挑戰。未來,如何更好地利用LLM,并解決其局限性和潛在風險,將是業界需要持續關注和努力的方向。


        聯系作者

        文章來源:人工智能學家
        作者微信:
        作者簡介:致力成為權威的人工智能科技媒體和前沿科技研究機構

        閱讀原文
        ? 版權聲明
        Trae官網

        相關文章

        Trae官網

        暫無評論

        暫無評論...
        主站蜘蛛池模板: 亚洲人成网国产最新在线| 亚洲黄色在线观看视频| 亚洲真人日本在线| 亚洲中文字幕无码久久2020| 爱情岛论坛亚洲品质自拍视频网站 | 亚洲一区二区三区免费在线观看| 无码午夜成人1000部免费视频| 亚洲中文字幕久久精品无码喷水| 无码免费又爽又高潮喷水的视频| 亚洲国产综合无码一区二区二三区| 免费人妻精品一区二区三区| 亚洲&#228;v永久无码精品天堂久久| 国产亚洲精品成人久久网站| 免费国产成人午夜电影| 美女被爆羞羞网站免费| 亚洲一区二区三区免费| 国产精品偷伦视频观看免费| 亚洲成人激情在线| 日韩视频在线精品视频免费观看| 亚洲午夜电影一区二区三区| 黄a大片av永久免费| 国产成人亚洲综合色影视| a级毛片毛片免费观看久潮| 久久久久久久亚洲Av无码| 黄色永久免费网站| 亚洲av无码偷拍在线观看| 亚洲第一福利网站在线观看| jzzjzz免费观看大片免费| 卡一卡二卡三在线入口免费| 黄色免费网址在线观看| 亚洲av午夜福利精品一区| 国产va精品免费观看| 久久亚洲sm情趣捆绑调教| 成年女人免费碰碰视频| 天堂亚洲免费视频| 亚洲精品无码不卡| 全免费a级毛片免费看无码| 久久久久久毛片免费看| 亚洲免费人成视频观看| 亚洲?V无码乱码国产精品| 中文字幕亚洲免费无线观看日本|