標簽:字幕

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

智能眼鏡這個被忽略的功能,他們已經離不開了

字幕是 一種 權利字幕,已經成了現代人的「外掛」。通勤嘈雜,摸魚易露餡,學習會分心,聽和看并用,才能避免進度條白白走了冤枉路。 然而,對一些人來說,字...
閱讀原文

在線可玩!智譜開源圖生視頻模型,網友直呼Amazing!

叨樂 發自 凹非寺量子位 | 公眾號 QbitAI剛剛,智譜把清影背后的圖生視頻模型CogVideoX-5B-I2V給開源了!(在線可玩) 一起開源的還有它的標注模型cogvlm2-ll...
閱讀原文

智譜版Sora開源爆火:狂攬4K Star,4090單卡運行,A6000可微調

機器之心報道 機器之心編輯部智譜AI把自研打造的大模型給開源了。 國內視頻生成領域越來越卷了。剛剛,智譜 AI 宣布將與「清影」同源的視頻生成模型 ——CogVid...
閱讀原文

4090單卡可跑,6秒直出電影級畫質,智譜版Sora正式開源!

新智元報道編輯:編輯部 【新智元導讀】國內首個人人可用的國產Sora「清影」,已經引起了AI視頻圈的轟動!才發布6天,生成視頻數就已經破百萬。并且,智譜AI...
閱讀原文

中國的開源版 sora:4090 內單卡運行,A6000 可微調

智譜版 Sora「清影」正式開源,第一個開源的商用級視頻生成模型。7 月 26 日,智譜發布AI 生視頻產品「清影」,30秒將任意文圖生成視頻,并上線在他們的AI助...
閱讀原文

國產版Sora開源了!推理優化到18G,4090單卡可跑

國產視頻生成模型又有新進展。 作者|ZeR0 編輯|漠影 智東西8月6日報道,好消息,智譜AI的視頻生成模型CogVideoX-2B,昨晚正式開源了。 模型已上架GitHub、Hug...
閱讀原文

智譜AI版Sora開源!首個可商用,在線可玩,5小時GitHub狂攬3.7K星

金磊 發自 凹非寺量子位 | 公眾號 QbitAI國產版Sora真的卷瘋了。 就在剛剛,智譜AI直接把清影視頻生成背后的大模型給開源了。 而且是首個可商用的那種哦! 這...
閱讀原文

硅谷大廠被曝違規“偷”數據:蘋果Anthropic用YouTube視頻訓練AI

創作者聲稱他們的視頻在他們不知情的情況下被使用。 編譯|ZeR0 編輯|漠影 智東西7月17日消息,Proof News的一項最新調查發現,從超過48,000個頻道竊取的173,5...
閱讀原文

首個多模態視頻競技場Video-MME來了!Gemini全面超越GPT-4o,Jeff Dean連轉三次

新智元報道編輯:alan 好困 【新智元導讀】近日,首個多模態LLM視頻分析綜合評估基準Video-MME誕生!在這場全新的考試中,Gemini 1.5 Pro一路遙遙領先,谷歌...
閱讀原文

百萬級高質量視頻數據集發布,登頂抱抱臉數據集排行榜,中科大&上海AI Lab等出品

ShareGPT4V團隊 投稿量子位 | 公眾號 QbitAI中科大、上海AI實驗室等組成的ShareGPT4V團隊,推出了新的視頻數據集,登頂HuggingFace排行榜! 數據集涵蓋了3000...
閱讀原文

ShareGPT4V作者團隊又一力作!百萬高質量視頻-字幕數據助力社區提升多模態大模型視頻理解及生成能力

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

Gemini視頻推理遙遙領先GPT-4o,Jeff Dean連續轉發三次,首個視頻多模態基準Video-MME來了

夢晨 發自 凹非寺量子位 | 公眾號 QbitAIOpenAI和谷歌接連兩場發布會,把AI視頻推理卷到新高度。 但業界還缺少可以全面評估大模型視頻推理能力的基準。 終于...
閱讀原文

GPT-4o僅排第二!北大港大等6所高校聯手,發布權威多模態大模型榜單!

夕小瑤科技說 原創作者 | 謝年年多模態大模型視頻分析能力榜單出爐: Gemini 1.5 Pro最強,GPT-4o僅排第二? 曾經紅極一時的GPT-4V屈居第三。 最近,北大港大...
閱讀原文

第一個能聽懂人類語氣的AI火了,網友:感覺在和真人交談

西風 發自 凹非寺量子位 | 公眾號 QbitAI第一個能聽懂你說話的語氣、有“情商”的AI火了! 請看VCR: △字幕為機器翻譯 這個AI名為EVI(Empathic Voice Interfac...
閱讀原文

百度網盤變了!進化成學習神器:音視頻轉文稿、加字幕,還能一鍵生成PPT!

金磊 發自 凹非寺量子位 | 公眾號 QbitAI你絕對想不到現在最fashion的學習“姿勢”是什么——百度網盤!你以為只是拿它用來存儲課件、資料嗎?不不不,現在的百度...
閱讀原文