標簽:大模型評測

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

開源小模型的大智慧!微軟Phi-4技術報告解讀與簡單測評

Phi-4:小模型的大智慧——技術詳解及簡單測評
閱讀原文

中國信通院聯合淘天集團發布全球首個中文安全領域事實性基準評測集,僅三個大模型達及格線

Chinese SafetyQA是全球第一個針對中文安全領域的系統性評估模型安全事實性知識的高質量評測集。
閱讀原文

騰訊聯合智源發布升級版長文本理解基準測試模型—LongBench v2

原標題:騰訊聯合智源發布升級版長文本理解基準測試模型—LongBench v2 文章來源:小夏聊AIGC 內容字數:1502字LongBench v2:衡量大型語言模型長文本理解能力...
閱讀原文

智源發布FlagEval「百模」評測結果,丈量模型生態變局

評測全面升級,多維度探索模型能力邊界與應用潛能。
閱讀原文

智源發布FlagEval評測:全球100+大模型多模態表現一覽!

還有四大專項評測榜單,探索模型能力邊界與應用潛能
閱讀原文