多模態大語言模型的競爭
根據《The Information》的報道,OpenAI正在加緊研發其多模態大語言模型GPT-Vision,試圖在谷歌推出其多模態模型Gemini之前實現發布。這一競爭標志著OpenAI與谷歌在AI領域的激烈對抗,類似于蘋果與安卓的競爭。
1. Gobi與Gemini的較量
OpenAI計劃在推出GPT-Vision后,進一步推出更強大的多模態模型Gobi。與以文本為主的GPT-3.5相比,GPT-4已經具備了部分多模態功能,如圖像輸入,但其視覺輸入尚未全面開放使用。Gobi將從一開始就專注于多模態能力,能夠處理更多類型的信息并提供更全面的響應。目前,谷歌的Gemini已向少量外部公司展示,且據稱其在準確性上表現更佳。
2. 數據優勢與技術挑戰
谷歌在多模態大語言模型方面的優勢在于其豐富的專有數據來源,包括從搜索引擎和YouTube獲得的文本、圖像和音頻信息。OpenAI則面臨著在多模態功能上追趕的挑戰,盡管其在GPT-4中已展示了部分相關能力。此外,訓練Gobi的進展不明,尚不確定其能否成為新一代的GPT-5。
3. 信息安全與濫用問題
多模態功能的推出也引發了信息安全的擔憂。OpenAI在發布GPT-4的多模態功能時,僅與特定公司合作,避免潛在的濫用風險。其工程師團隊正在努力解決視覺功能可能被惡意利用的問題,例如自動驗證碼或進行面部識別追蹤。谷歌也面臨類似挑戰,并表示承諾將確保其AI產品的負責任開發。
4. 未來展望:AIGC的焦點
多模態大語言模型的開發正在成為AI領域的新趨勢,OpenAI與谷歌之間的競爭不僅是技術上的較量,也可能引發更廣泛的社會討論,包括技術應用、合作、監管與倫理等方面。隨著Gobi與Gemini的推出,這場競爭將為未來AI大模型的發展奠定基礎。
聯系作者
文章來源:元動乾坤
作者微信:
作者簡介:訂閱前沿信息技術,了解活動動態,分享技術信息
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...