標簽:內(nèi)容生成

mPLUG-DocOwl2

mPLUG-DocOwl 2是由阿里巴巴通義實驗室mPLUG團隊推出的用于多頁文檔理解的多模態(tài)大型語言模型。在不依賴光學(xué)字符識別(OCR)技術(shù)的情況下,通過高分辨率文檔...
閱讀原文

墨魚AIGC

墨魚AIGC是一款基于國內(nèi)先進的人工智能技術(shù)的文案寫作工具,產(chǎn)品經(jīng)過大量優(yōu)質(zhì)數(shù)據(jù)訓(xùn)練后形成垂類場景的寫作能力,為用戶提供一鍵生成營銷廣告、原創(chuàng)文案、寫...
閱讀原文

ReplaceAnything

ReplaceAnything是由阿里巴巴智能計算研究院推出的一款開源AI圖像內(nèi)容替換框架,利用先進的人工智能技術(shù),能夠?qū)崿F(xiàn)對照片或圖像中物體的智能替換。用戶可以通...
閱讀原文

騰訊元器

騰訊元器是騰訊公司在騰訊云生成式AI產(chǎn)業(yè)應(yīng)用峰會上推出的一款基于其騰訊混元大模型的AI智能體創(chuàng)作與分發(fā)平臺,可幫助用戶輕松創(chuàng)建和部署智能體,無需編寫代...
閱讀原文

CriticGPT

CriticGPT是OpenAI發(fā)布的一個新型人工智能模型,基于GPT-4構(gòu)建,專門用于審查和識別大型語言模型(如ChatGPT)生成的代碼中的錯誤。CriticGPT通過人類反饋強...
閱讀原文

度豆

度豆APP是百度推出的一款仿真人AI社交應(yīng)用,基于文心大模型技術(shù),提供與仿真數(shù)字人進行實時溝通和情感互動的體驗。
閱讀原文

Poe AI新功能「Previews」

Poe 新功能「Previews」允許用戶實時預(yù)覽 AI 生成的 Web 應(yīng)用。與 AI 對話,用戶可快速創(chuàng)建并體驗原型,如游戲、編輯器等。功能支持交互體驗,簡化編程和設(shè)計...
閱讀原文

Agent Q

Agent Q是MultiOn公司聯(lián)合斯坦福大學(xué)推出的自監(jiān)督代理推理和搜索框架。Agent Q融合了引導(dǎo)式蒙特卡洛樹搜索(MCTS)、AI自我批評和直接偏好優(yōu)化(DPO)等技術(shù)...
閱讀原文

LongWriter

LongWriter 是清華大學(xué)聯(lián)合智譜AI推出的長文本生成模型,能生成超10,000字的連貫文本,項目已開源。通過分析現(xiàn)有大型語言模型的輸出限制,創(chuàng)建了"LongWr...
閱讀原文

因賽AIGC

因賽AIGC是因賽集團推出的AI營銷工具,InsightGPT結(jié)合AI技術(shù)與營銷策略洞察、內(nèi)容創(chuàng)意生產(chǎn)、傳播投放及效果轉(zhuǎn)化,提升營銷行業(yè)的生產(chǎn)力。InsightGPT不僅具備...
閱讀原文

Omages

Omages是一個開源的3D模型生成項目,基于圖像擴散技術(shù)將3D形狀的幾何和紋理信息編碼進64x64像素的2D圖像中,從而簡化3D建模流程。
閱讀原文

Qwen2-VL

Qwen2-VL是阿里巴巴達摩院開源的視覺多模態(tài)AI模型,具備高級圖像和視頻理解能力。Qwen2-VL支持多種語言,能處理不同分辨率和長寬比的圖片,實時分析動態(tài)視頻...
閱讀原文

Loopy

Loopy是字節(jié)跳動推出的音頻驅(qū)動的AI視頻生成模型,用戶可以讓一張靜態(tài)照片動起來,照片中的人物根據(jù)給定的音頻文件進行面部表情和頭部動作的同步,生成逼真的...
閱讀原文

藍心大模型

藍心大模型是vivo發(fā)布的全新自研通用大模型矩陣,包括語言大模型、端側(cè)大模型、語音大模型、圖像大模型以及多模態(tài)大模型。在多個領(lǐng)域和場景中發(fā)揮著重要作用...
閱讀原文

NarratoAI

NarratoAI 是基于AI技術(shù)自動化影視解說和編輯的工具。通過大型語言模型(LLM)理解視頻內(nèi)容,自動生成解說文案,并將文案轉(zhuǎn)化為配音,同時進行視頻剪輯和字幕...
閱讀原文
134567