標簽:圖像

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Mistral放大招:124B多模態,Canvas、搜索、圖片生成免費用

Mistral AI終于放大招了!一連發布兩大更新——Pixtral Large:前沿級124B多模態模型,用于驅動新Le Chat。 全新Le Chat:具備網頁搜索、Canvas、圖像生成、圖...
閱讀原文

超GPT-4o,1240億參數!最強開源多模態模型?Pixtral Large!

大會預告12月5-6日,智猩猩共同主辦的2024中國生成式AI大會(上海站)將舉辦。北大(臨港)大模型對齊中心執行主任徐驊,騰訊優圖實驗室天衍研究中心負責人吳...
閱讀原文

多模態競技場對標90B Llama 3.2!Pixtral 12B技術報告全公開

新智元報道編輯:alan 【新智元導讀】以開源極客之姿殺入江湖的Mistral AI,在9月份甩出了自家的首款多模態大模型Pixtral 12B,如今,報告之期已至,技術細節...
閱讀原文

發力了,Mistral對標ChatGPT全面升級le Chat,還祭出超大杯多模態模型

機器之心報道 編輯:蛋醬、陳陳一覺醒來,Mistral AI 又發力了。 就在今天,Mistral AI 多模態家族迎來了第二位成員:一個名為 Pixtral Large 的超大杯基礎模...
閱讀原文

AI一鍵解析九大生物醫學成像模式,用戶只需文字prompt交互,微軟UW等新研究登Nature Methods

BiomedParse團隊 投稿量子位 | 公眾號 QbitAI用AI大模型一鍵解析MRI、CT和病理學等九大生物醫學成像模式。 不僅復雜、不規則形狀對象能高精度識別: 而且通過...
閱讀原文

攻克OCR手寫識別難點!InkSight教程上線,實現高精度轉寫;iNatSounds數據集發布,含23萬自然物種音頻

手寫記錄是許多人在日常生活中記錄靈感的方式,但如何高效地將手寫內容轉化為電子文本一直是一大挑戰。傳統的 OCR(光學字符識別)技術在處理復雜背景或不規...
閱讀原文

從未見過現實世界數據,MIT在虛擬環境中訓練出機器狗,照樣能跑酷

機器之心報道 編輯:杜偉如今,機器人學習最大的瓶頸是缺乏數據。與圖片和文字相比,機器人的學習數據非常稀少。目前機器人學科的主流方向是通過擴大真實世界...
閱讀原文

視頻大模型無損提速:刪除多余token,訓練時間減少30%,幀率越高效果越好 | NeurIPS

克雷西 發自 凹非寺量子位 | 公眾號 QbitAIDon’t look twice! 把連續相同的圖像塊合并成一個token,就能讓Transformer的視頻處理速度大幅提升。 卡內基梅隆...
閱讀原文

深度解析Recraft V3:突破文本渲染限制,「文生圖」黑馬是怎樣煉成的?

新智元報道編輯:LRST 【新智元導讀】Recraft團隊通過結合TextDiffuser-2技術和自訓練的大型語言模型,提升了文本到圖像渲染的質量和準確性,不過現有模型在...
閱讀原文

擴散模型失寵?端側非自回歸圖像生成基礎模型Meissonic登場,超越SDXL!

新智元報道編輯:LRST 【新智元導讀】剛剛,一款專為消費級顯卡設計的全新非自回歸掩碼圖像建模的文本到圖像生成模型——Meissonic發布,標志著圖像生成即將進...
閱讀原文

開源版SearchGPT來了,兩張3090就可復現,超越Perplexity付費版

VSA團隊 投稿量子位 | 公眾號 QbitAIOpenAI推出SearchGPT沒幾天,開源版本也來了。 港中文MMLab、上海AI Lab、騰訊團隊簡易實現了Vision Search Assistant,...
閱讀原文

真·打字P圖!字節發布新模型SeedEdit,一句話爆改世界名畫,可免費體驗

機器之心原創 作者:澤南、楊文一句話實時P圖,網友又能整活了。字節豆包大模型又又又上新了! 11 月 11 日,字節跳動豆包大模型團隊推出了最新圖像編輯模型 ...
閱讀原文

當視覺大模型陷入認知失調,馬里蘭大學構建了一個幻覺自動生成框架

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

AI有鼻子了,還能遠程傳輸氣味,圖像生成香水

機器之心報道 編輯:Panda、張倩眾所周知,圖像、音樂能用 AI 生成,但出乎意料的是,氣味也行。 最近,一個名叫 Osmo 的初創公司宣布,他們成功地將氣味數字...
閱讀原文

評估大模型不看輸出看「內在」,上交大新測試指標入選NeurIPS 2024

上交大MIFA實驗室 魏來 投稿量子位 | 公眾號 QbitAI能夠深入大模型內部的新評測指標來了! 上交大MIFA實驗室提出了全新的大模型評估指標Diff-eRank。 不同于...
閱讀原文
12348