標簽:語義理解

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

LMEval

LMEval 是谷歌推出的開源框架,用在簡化大型模型(LLMs)的跨提供商評估。框架支持多模態(文本、圖像、代碼)和多指標評估,兼容 Google、OpenAI、Anthropic...
閱讀原文

Macaly

Macaly 是創新的無代碼應用開發工具,通過自然語言處理技術,讓用戶能將想法轉化為可運行的應用程序。可以通過簡單的文字描述或語音指令,直接參與到應用的創...
閱讀原文

Amie

Amie是AI會議記錄工具,幫助用戶高效管理會議內容和后續工作。通過自動錄音和生成會議總結,讓用戶在短時間內分享會議要點、更新CRM、計劃行動項以及安排下次...
閱讀原文

SWE-1

SWE-1是Windsurf團隊推出的首個軟件工程 AI 模型系列,專為整個軟件開發流程優化,涵蓋代碼生成、測試、調試、資料查找等開發環節,提升開發效率和用戶體驗。
閱讀原文

FLUX-Text

FLUX-Text 是阿里推出的新型的多語言場景文本編輯框架,基于擴散模型(Diffusion Model)和輕量級字形嵌入模塊。框架基于注入字形條件信息,提升復雜場景下文...
閱讀原文

Seed1.5-VL

Seed1.5-VL 是字節跳動 Seed 團隊最新發布的視覺-語言多模態大模型,具備強大的通用多模態理解和推理能力,推理成本顯著降低。模型由一個 532M 參數的視覺編...
閱讀原文

F-Lite

F-Lite是Freepik團隊聯合FAL開源的10B參數的文生圖模型。基于Freepik內部80M有版權的數據集訓練,支持商業用途。F-Lite將T5-XXL作為文本編碼器,基于抽取第17...
閱讀原文

RepText

RepText 是Shakker Labs 和 Liblib AI推出的多語言視覺文本渲染框架,基于復制字形而非理解文本內容實現高質量的文本渲染。框架基于預訓練的單語言文本到圖像...
閱讀原文

易筆AI

易筆AI是AI論文寫作輔助工具,專為學生、研究人員以及各類學術寫作者設計。通過先進的AI技術和大數據分析,能快速生成高質量的論文初稿和框架。
閱讀原文

文心大模型4.5 Turbo

文心大模型4.5 Turbo是百度推出的高性能、低成本多模態大模型。基于文心大模型4.5的基礎上進行優化,具備多模態、強推理能力,能處理文本、圖像等多種輸入形...
閱讀原文

DAM-3B

DAM-3B(Describe Anything 3B)是英偉達推出的多模態大語言模型,專為生成圖像和視頻中特定區域的詳細描述設計。模型通過點、邊界框、涂鴉或掩碼等方式指定...
閱讀原文

Flex.2-preview

Flex.2-preview 是Ostris開源的 80 億參數文本到圖像擴散模型,支持通用控制輸入(如線條、姿態、深度)和內置修復功能。模型基于一個模型滿足多種創意需求,...
閱讀原文

可靈2.0

可靈2.0是快手推出的新一代 AI 視頻生成模型,現已上線可靈AI視頻平臺。平臺更新包含可靈2.0(大師版)和可圖2.0兩大基礎模型。可圖2.0大幅提升圖片生成質量...
閱讀原文

明岐

明岐是上海交通大學計算機學院LoCCS實驗室推出的首個精準診斷罕見病的醫學多模態大模型。基于“大模型能力矩陣 + 專家路由協同”的雙引擎驅動架構,整合醫學影...
閱讀原文

WorldScore

WorldScore 是斯坦福大學提出的用于世界生成模型的統一評估基準。將世界生成分解為一系列的下一個場景生成任務,通過明確的基于相機軌跡的布局規范來實現不同...
閱讀原文
1239