標(biāo)簽：場(chǎng)景理解

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經(jīng)常用來(lái)日常寫(xiě)作，雖然本身提供了AI功能，但可惜需要會(huì)員，本文教你三分鐘接入最火的DeepSeek，讓W(xué)PS秒變辦公神器。 DeepSeek API申請(qǐng)地址：http:/...

閱讀原文

AI教程

10個(gè)月前

AI賺錢副業(yè)~AI生成影視解說(shuō)，半個(gè)月漲粉變現(xiàn)3.5W+！

這兩年大家都在感嘆生活不易，然而我想說(shuō)的是，機(jī)會(huì)還是有的，但問(wèn)題不在于有沒(méi)有，而在于你是否能夠認(rèn)準(zhǔn)機(jī)會(huì)，然后抓住它。接觸過(guò)很多咨詢項(xiàng)目的人，發(fā)現(xiàn)...

使用教程

1年前 (2024)

SAM 3

SAM 3（Segment Anything Model 3）是 Meta AI 最新推出的先進(jìn)計(jì)算機(jī)視覺(jué)模型，能通過(guò)文本、示例和視覺(jué)提示檢測(cè)、分割和跟蹤圖像及視頻中的對(duì)象。

閱讀原文

AI工具

4周前

豆包大模型1.6-vision

豆包大模型1.6-vision是火山引擎推出的具備工具調(diào)用能力的視覺(jué)深度思考模型。模型擁有強(qiáng)大的通用多模態(tài)理解和推理能力，支持Responses API，能自主調(diào)用工具如...

閱讀原文

AI工具

3個(gè)月前

3DV-TON

3DV-TON（Textured 3D-Guided Consistent Video Try-on via Diffusion Models）是阿里巴巴達(dá)摩院、湖畔實(shí)驗(yàn)室和浙江大學(xué)聯(lián)合推出的基于擴(kuò)散模型的視頻虛擬試...

閱讀原文

AI工具

7個(gè)月前

Lumina-Image 2.0

Lumina-Image 2.0 是開(kāi)源的高效統(tǒng)一圖像生成模型，參數(shù)量為26億，基于擴(kuò)散模型和Transformer架構(gòu)。在圖像生成質(zhì)量、復(fù)雜提示理解和資源效率方面表現(xiàn)出色，在...

閱讀原文

AI工具

10個(gè)月前

moonshot-v1-vision-preview

moonshot-v1-vision-preview 是月之暗面推出的多模態(tài)圖片理解模型，模型完善了 moonshot-v1 模型系列的多模態(tài)能力，具備強(qiáng)大的圖像識(shí)別能力，能精準(zhǔn)區(qū)分復(fù)雜...

閱讀原文

AI工具

11個(gè)月前

李飛飛團(tuán)隊(duì)視覺(jué)AI突破：2025，多模態(tài)大模型迎來(lái)“視覺(jué)空間智能”時(shí)代？

希望 2025 年 AI 領(lǐng)域能帶來(lái)推理之外的突破。

閱讀原文

AIGC動(dòng)態(tài)

12個(gè)月前

VisionFM

VisionFM（伏羲慧眼）是多模態(tài)多任務(wù)的視覺(jué)基礎(chǔ)模型，專為通用眼科人工智能而設(shè)計(jì)。通過(guò)預(yù)訓(xùn)練3.4百萬(wàn)張來(lái)自560,457個(gè)個(gè)體的眼科圖像，覆蓋廣泛的眼科疾病、...

閱讀原文

AI工具

12個(gè)月前

什么是計(jì)算機(jī)視覺(jué)（Computer Vision）

計(jì)算機(jī)視覺(jué)(Computer Vision)是人工智能的一個(gè)關(guān)鍵分支，專注于使機(jī)器能夠像人類一樣解釋和理解視覺(jué)信息。它涉及圖像和視頻的獲取、處理、分析以及從這些數(shù)據(jù)...

閱讀原文

AI百科

1年前 (2024)