標簽：難度

WPS接入DeepSeek，秒變辦公神器！

WPS 大家經常用來日常寫作，雖然本身提供了AI功能，但可惜需要會員，本文教你三分鐘接入最火的DeepSeek，讓WPS秒變辦公神器。 DeepSeek API申請地址：http:/...

閱讀原文

AI教程

10個月前

AI賺錢副業~AI生成影視解說，半個月漲粉變現3.5W+！

這兩年大家都在感嘆生活不易，然而我想說的是，機會還是有的，但問題不在于有沒有，而在于你是否能夠認準機會，然后抓住它。接觸過很多咨詢項目的人，發現...

使用教程

1年前 (2024)

最強 OpenAI o1 邏輯推理正確率僅 50%！清華、智譜推出「大模型邏輯推理新基準」

9.11 和 9.9 哪個大？這一連人類幼兒園兒童都能回答的問題，曾經（至今）難倒了眾多大語言模型（LLM）。然而，要想達到通用人工智能（AGI）的水平，LLM 不僅...

閱讀原文

AIGC動態

1年前 (2024)

00后國人論文登Nature，大模型對人類可靠性降低

一水發自凹非寺量子位 | 公眾號 QbitAI00后國人一作登上Nature，這篇大模型論文引起熱議。簡單來說，論文發現：更大且更遵循指令的大模型也變得更不可靠了...

閱讀原文

AIGC動態

1年前 (2024)

顛覆認知：大模型不可靠，越大越不可靠？最新研究登上 Nature

人工智能（AI）模型的參數規模越大，生成的答案就越準確？就更加可信？還真不一定！日前，一項發表在權威科學期刊 Nature 上的研究表明：相比于小參數模型...

閱讀原文

AIGC動態

1年前 (2024)

北大AI奧數評測，o1-mini比o1-preview分數還高

Omni-MATH團隊投稿量子位 | 公眾號 QbitAIOpenAI的o1系列一發布，傳統數學評測基準都顯得不夠用了。 MATH-500，滿血版o1模型直接拿下94.8分。更難的奧數邀...

閱讀原文

AIGC動態

1年前 (2024)

有了ChatGPT，還需要人類程序猿編碼嗎？

6月，IEEE刊登了一篇對ChatGPT代碼生成任務進行系統評估的論文，數據集就是程序員們最愛的LeetCode題庫。研究揭示了LLM在代碼任務中出現的潛在問題和能力局限...

閱讀原文

AIGC動態

1年前 (2024)

ChatGPT無法取代人類程序員！ IEEE 35頁論文測出困難編碼正確率僅為0.66%

新智元報道編輯：編輯部【新智元導讀】6月，IEEE刊登了一篇對ChatGPT代碼生成任務進行系統評估的論文，數據集就是程序員們最愛的LeetCode題庫。研究揭示了LL...

閱讀原文

AIGC動態

1年前 (2024)

Bengio團隊提出多模態新基準，直指Claude 3.5和GPT-4o弱點

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術...

閱讀原文

AIGC動態

1年前 (2024)

今日Arxiv最熱NLP大模型論文：AllenAI最新研究：讓AI從簡單學起，竟然能解決難題？

夕小瑤科技說原創作者 | 賽博馬良本期論文解讀非人類撰寫，全文由賽博馬良「AI論文解讀達人」智能體自主完成，經人工審核后發布。智能體傳送門： https:/...

閱讀原文

AIGC動態

2年前 (2024)