標簽:文本
媲美Sora!谷歌Veo來了,文生超1分鐘、1080P視頻
直播預告|今晚七點,「企業級大模型工程實踐在線研討會」將舉行。阿里巴巴 AI 基礎架構工程師劉彬、NVIDIA 軟件解決方案架構師吳金鐘兩位技術專家將分別主講...
OpenAI干翻所有語音助手!GPT-4o模型實時語音視頻交互強到恐怖,完全免費開放
智東西5月14日報道,今日凌晨1點,搶在谷歌年度開發者大會Google I/O開幕前,OpenAI舉辦春季線上直播,宣布將推出桌面版ChatGPT,并發布全新旗艦AI模型GPT-4o...
免費GPT-4o來襲,音頻視覺文本實現「大一統」
OpenAI「魔法」降臨。作者 | 賴文昕 今天凌晨,即北京時間5月14日1點整,OpenAI 召開了首場春季發布會,CTO Mira Murati 在臺上和團隊用短短不到30分鐘的時間...
OpenAI 用 26 分鐘改變世界!免費版 GPT-4 來了,視頻語音交互快進到科幻片
GPT-4o 正式發布今天凌晨,一場 26 分鐘的發布會,將又一次大大改變 AI 行業和我們未來的生活,也會讓無數 AI 初創公司焦頭爛額。 這真不是標題黨,因為這是 ...
OpenAI顛覆世界:GPT-4o完全免費,實時語音視頻交互震撼全場,直接進入科幻時代
機器之心報道 機器之心編輯部ChatGPT 問世才 17 個月,OpenAI 就拿出了科幻電影里的超級 AI,而且完全免費,人人可用。太震撼了! 當各家科技公司還在追趕大...
OpenAI一夜干翻語音助手!GPT-4o模型強到恐怖,ChatGPT學會看屏幕,現實版Her來了
GPT-4免費了!OpenAI新旗艦模型深夜炸場!頂級跨模態干翻同行,API速度翻倍、價格暴降。 作者|智東西編輯部 頂尖AI產品的對決,將在這兩天集中上演。 智東西5...
今日arXiv最熱大模型論文:減少語法錯誤,竟成了突破口!識別AI生成文本,AUROC達98.7%
夕小瑤科技說 原創作者 | 謝年年語法錯誤更少竟成為檢測大模型生成文本的突破口? 澳門大學和哈工大的團隊最近發現人類在寫作時比語言模型更容易犯語法錯誤。...
GPT-4o深夜炸場!AI實時視頻通話絲滑如人類,Plus功能免費可用,奧特曼:《她》來了
夢晨 克雷西 發自 凹非寺量子位 | 公眾號 QbitAI不開玩笑,電影《她》真的來了。 OpenAI最新旗艦大模型GPT-4o,不僅免費可用,能力更是橫跨聽、看、說,絲滑...
DiT架構大一統:一個框架集成圖像、視頻、音頻和3D生成,可編輯、能試玩
機器之心報道 編輯:杜偉、大盤雞基于 Diffusion Transformer(DiT)又迎來一大力作「Flag-DiT」,這次要將圖像、視頻、音頻和 3D「一網打盡」。今年 2 月初...
HuggingFace燒錢做了一大批實驗,揭示多模態大模型哪些trick真正有效
夕小瑤科技說 原創作者 | 謝年年構建多模態大模型時有很多有效的trick,如采用交叉注意力機制融合圖像信息到語言模型中,或直接將圖像隱藏狀態序列與文本嵌入...
UC伯克利全新AI智能體,精確理解人類語言,刷新SOTA
來源:新智元 智能體如何從不同的語言中理解世界?近日,來自UC伯克利的研究人員提出了一種全新的AI智能體,可以通過對未來進行多模態世界建模來學習理解語言...
為什么要做長文本、長圖文、長語音的大模型?深度解讀訊飛星火V3.5春季上新
機器之心發布 機器之心編輯部訊飛的持續高投入,換來了大模型能力的迅速提升。4 月 26 日,科大訊飛發布訊飛星火大模型 V3.5 的功能上新,其中一個重點就是面...
LLaMA 3:大模型之戰的新序幕
作者 | 符堯 OneFlow編譯 翻譯|楊婷、宛子琳、張雪聃 本文要點概覽: 文本數據的擴展可能已經達到了極限,因為易于獲取的網絡文本資源(如Common Crawl、Git...
8B文字多模態大模型指標逼近GPT4V,字節、華師、華科聯合提出TextSquare
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
硬控設計人一分鐘,加持大模型的Adobe,PS起來更香了
機器之心報道 機器之心編輯部圖像編輯這一塊,還得看 Adobe。剛剛,Adobe 正式宣布推出新的圖像生成模型 Firefly Image 3,即日起在 Firefly Web 應用程序、A...