讓 AIGC「飛入尋常百姓家」
原標題:2024即將結束,中國AI應用支棱起來了嗎?這家公司交出95分答卷
文章來源:機器之心
內容字數:7291字
智象多模態大模型:場景驅動,讓AIGC飛入尋常百姓家
本文介紹了智象未來公司及其多模態大模型3.0版本的研發歷程和應用場景。文章指出,OpenAI的Sora發布后并未帶來預期震撼,部分國產模型在某些方面甚至超越了Sora,這引發了對AI視頻生成模型應用前景的重新思考。
1. 場景驅動優化模型,填補模型與應用的Gap
智象未來基于用戶反饋,發現用戶更需要解決特定問題的模型,而非追求通用能力的完美模型。 他們發現簡單的、帶特定IP的動態壁紙更受年輕人歡迎,B端也類似,需要模型在特定場景下達到95分以上的實用性。因此,智象未來從場景需求出發優化模型,而非一味追求基礎模型的“100分”。
2. 智象多模態大模型3.0的三大優化
智象多模態大模型3.0在畫面質量、鏡頭控制和特色場景生成效果上進行了三大優化:
- 畫面質量和相關性提升:采用DiT+AR混合架構,兼顧生成質量、可控性和推理速度。
- 鏡頭和畫面更可控:聯合訓練鏡頭和畫面,實現更自然的影視級運鏡效果。
- 特色場景下的生成效果提升:針對特定場景(如IP遷移)進行優化,實現端到端95分以上的用戶體驗。
3. 理解與生成相輔相成:智象多模態理解大模型1.0
智象未來還推出了智象多模態理解大模型1.0,用于更精細、準確的圖像和視頻內容理解,并與生成大模型結合,打造多模態檢索+內容編輯與生成的創作平臺,降低創作門檻,提高效率。
4. 商業化落地與未來規劃
智象未來專注于模型的應用落地,而非追求AGI。 他們已累計服務全球上千萬個人用戶和數萬家企業客戶,取得了亮眼的商業化成績。未來,他們將繼續專注于解決用戶“最后一公里”的問題,讓AIGC技術惠及更多用戶。
5. 最新融資消息
智象未來近日獲得數億元人民幣Pre-A和A輪融資,投資方包括敦鴻資本、合肥產投等國資基金以及其他戰略資本。
聯系作者
文章來源:機器之心
作者微信:
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...