標(biāo)簽:圖像

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經(jīng)常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓W(xué)PS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業(yè)~AI生成影視解說,半個月漲粉變現(xiàn)3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機(jī)會還是有的,但問題不在于有沒有,而在于你是否能夠認(rèn)準(zhǔn)機(jī)會,然后抓住它。 接觸過很多咨詢項(xiàng)目的人,發(fā)現(xiàn)...

Mistral放大招:124B多模態(tài),Canvas、搜索、圖片生成免費(fèi)用

Mistral AI終于放大招了!一連發(fā)布兩大更新——Pixtral Large:前沿級124B多模態(tài)模型,用于驅(qū)動新Le Chat。 全新Le Chat:具備網(wǎng)頁搜索、Canvas、圖像生成、圖...
閱讀原文

超GPT-4o,1240億參數(shù)!最強(qiáng)開源多模態(tài)模型?Pixtral Large!

大會預(yù)告12月5-6日,智猩猩共同主辦的2024中國生成式AI大會(上海站)將舉辦。北大(臨港)大模型對齊中心執(zhí)行主任徐驊,騰訊優(yōu)圖實(shí)驗(yàn)室天衍研究中心負(fù)責(zé)人吳...
閱讀原文

多模態(tài)競技場對標(biāo)90B Llama 3.2!Pixtral 12B技術(shù)報(bào)告全公開

新智元報(bào)道編輯:alan 【新智元導(dǎo)讀】以開源極客之姿殺入江湖的Mistral AI,在9月份甩出了自家的首款多模態(tài)大模型Pixtral 12B,如今,報(bào)告之期已至,技術(shù)細(xì)節(jié)...
閱讀原文

發(fā)力了,Mistral對標(biāo)ChatGPT全面升級le Chat,還祭出超大杯多模態(tài)模型

機(jī)器之心報(bào)道 編輯:蛋醬、陳陳一覺醒來,Mistral AI 又發(fā)力了。 就在今天,Mistral AI 多模態(tài)家族迎來了第二位成員:一個名為 Pixtral Large 的超大杯基礎(chǔ)模...
閱讀原文

AI一鍵解析九大生物醫(yī)學(xué)成像模式,用戶只需文字prompt交互,微軟UW等新研究登Nature Methods

BiomedParse團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAI用AI大模型一鍵解析MRI、CT和病理學(xué)等九大生物醫(yī)學(xué)成像模式。 不僅復(fù)雜、不規(guī)則形狀對象能高精度識別: 而且通過...
閱讀原文

攻克OCR手寫識別難點(diǎn)!InkSight教程上線,實(shí)現(xiàn)高精度轉(zhuǎn)寫;iNatSounds數(shù)據(jù)集發(fā)布,含23萬自然物種音頻

手寫記錄是許多人在日常生活中記錄靈感的方式,但如何高效地將手寫內(nèi)容轉(zhuǎn)化為電子文本一直是一大挑戰(zhàn)。傳統(tǒng)的 OCR(光學(xué)字符識別)技術(shù)在處理復(fù)雜背景或不規(guī)...
閱讀原文

從未見過現(xiàn)實(shí)世界數(shù)據(jù),MIT在虛擬環(huán)境中訓(xùn)練出機(jī)器狗,照樣能跑酷

機(jī)器之心報(bào)道 編輯:杜偉如今,機(jī)器人學(xué)習(xí)最大的瓶頸是缺乏數(shù)據(jù)。與圖片和文字相比,機(jī)器人的學(xué)習(xí)數(shù)據(jù)非常稀少。目前機(jī)器人學(xué)科的主流方向是通過擴(kuò)大真實(shí)世界...
閱讀原文

視頻大模型無損提速:刪除多余token,訓(xùn)練時間減少30%,幀率越高效果越好 | NeurIPS

克雷西 發(fā)自 凹非寺量子位 | 公眾號 QbitAIDon’t look twice! 把連續(xù)相同的圖像塊合并成一個token,就能讓Transformer的視頻處理速度大幅提升。 卡內(nèi)基梅隆...
閱讀原文

深度解析Recraft V3:突破文本渲染限制,「文生圖」黑馬是怎樣煉成的?

新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】Recraft團(tuán)隊(duì)通過結(jié)合TextDiffuser-2技術(shù)和自訓(xùn)練的大型語言模型,提升了文本到圖像渲染的質(zhì)量和準(zhǔn)確性,不過現(xiàn)有模型在...
閱讀原文

擴(kuò)散模型失寵?端側(cè)非自回歸圖像生成基礎(chǔ)模型Meissonic登場,超越SDXL!

新智元報(bào)道編輯:LRST 【新智元導(dǎo)讀】剛剛,一款專為消費(fèi)級顯卡設(shè)計(jì)的全新非自回歸掩碼圖像建模的文本到圖像生成模型——Meissonic發(fā)布,標(biāo)志著圖像生成即將進(jìn)...
閱讀原文

開源版SearchGPT來了,兩張3090就可復(fù)現(xiàn),超越Perplexity付費(fèi)版

VSA團(tuán)隊(duì) 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。 港中文MMLab、上海AI Lab、騰訊團(tuán)隊(duì)簡易實(shí)現(xiàn)了Vision Search Assistant,...
閱讀原文

真·打字P圖!字節(jié)發(fā)布新模型SeedEdit,一句話爆改世界名畫,可免費(fèi)體驗(yàn)

機(jī)器之心原創(chuàng) 作者:澤南、楊文一句話實(shí)時P圖,網(wǎng)友又能整活了。字節(jié)豆包大模型又又又上新了! 11 月 11 日,字節(jié)跳動豆包大模型團(tuán)隊(duì)推出了最新圖像編輯模型 ...
閱讀原文

當(dāng)視覺大模型陷入認(rèn)知失調(diào),馬里蘭大學(xué)構(gòu)建了一個幻覺自動生成框架

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

AI有鼻子了,還能遠(yuǎn)程傳輸氣味,圖像生成香水

機(jī)器之心報(bào)道 編輯:Panda、張倩眾所周知,圖像、音樂能用 AI 生成,但出乎意料的是,氣味也行。 最近,一個名叫 Osmo 的初創(chuàng)公司宣布,他們成功地將氣味數(shù)字...
閱讀原文

評估大模型不看輸出看「內(nèi)在」,上交大新測試指標(biāo)入選NeurIPS 2024

上交大MIFA實(shí)驗(yàn)室 魏來 投稿量子位 | 公眾號 QbitAI能夠深入大模型內(nèi)部的新評測指標(biāo)來了! 上交大MIFA實(shí)驗(yàn)室提出了全新的大模型評估指標(biāo)Diff-eRank。 不同于...
閱讀原文
12348