標簽:評分

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

Evaluation is All You Need!首個開源多模態大模型通用評測器LLaVA-Critic

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

頂會審稿人緊缺,我審我自己!ICML 2023排序實驗結果出爐:作者自評能提升評審質量嗎?

新智元報道編輯:LRST 【新智元導讀】賓夕法尼亞大學蘇煒杰教授團隊在ICML 2023會議中進行實驗顯示,經過作者自評校準后,審稿分數的誤差降低超過20%。近年來...
閱讀原文

現在看個球都要懂數據分析了嗎?

大數據文摘授權轉載自果殼 作者:Timo 當下歐洲杯,除了夜半爬起看比賽之外,虎撲或者懂球帝的老哥們最喜歡做的事情之一,就是拿著每場比賽賽后球員評分,去“...
閱讀原文

首次引入GPT-4o!圖像自動評估新基準來啦

DreamBench++團隊 投稿量子位 | 公眾號 QbitAI面對層出不窮的個性化圖像生成技術,一個新問題擺在眼前: 缺乏統一標準來衡量這些生成的圖片是否符合人們的喜...
閱讀原文

「AI+物理先驗知識」,浙大、中國科學院通用蛋白質-配體相互作用評分方法登Nature子刊

將 ScienceAI設為星標 第一時間掌握 新鮮的 AI for Science 資訊編輯 | X 蛋白質就像是身體中的精密鎖具,而藥物分子則是鑰匙,只有完美契合的鑰匙才能解鎖治...
閱讀原文

大模型盲測競技場放榜!國產黑馬沖進世界七強,中文并列第一

把大模型差距從7-10年降低到6個月,成立一年的國內AI獨角獸是怎么做到的? 作者|ZeR0 編輯|漠影 智東西5月22日報道,周二,知名大模型競技場LMSYS Chatboat A...
閱讀原文

國產黑馬大模型盲測競技場挺進全球前十!中文榜和GPT-4o并列第一

夕小瑤科技說 分享美國時間2024年5月20日剛刷新的 LMSYS Chatboat Arena 盲測結果,來自至今積累超過 1170萬的全球用戶真實投票數,有一個國產大模型玩家Yi-L...
閱讀原文

國產黑馬與GPT-4o稱霸中文榜首!Yi-Large勇奪國內LLM盲測桂冠,沖進世界第七

新智元報道編輯:桃子 好困 【新智元導讀】真正與GPT-4o齊頭并進的國產大模型來了!剛剛,LMSYS揭開最新榜單,黑馬Yi-Large在中文分榜上與GPT-4o并列第一,而...
閱讀原文

中國大模型頭名易主:全球盲測榜單上,Yi-Large與GPT-4o中文并列第一

機器之心發布 機器之心編輯部上周,一個名為 “im-also-a-good-gpt2-chatbot” 的神秘模型突然現身大模型競技場 Chatbot Arena,排名直接超過 GPT-4-Turbo、Gem...
閱讀原文

千億模型 Yi-Large 杠上萬億 GPT-4 Turbo,多項能力不輸 OpenAI

新生代中國大模型后來居上,表現亮點。上周,一個名為“im-also-a-good-gpt2-chatbot”的神秘模型突然現身大模型競技場Chatbot Arena,排名直接超過GPT-4-Turbo...
閱讀原文

ICLR被曝巨大,評審和作者竟私下勾結?49.9%論文疑有AI審稿

新智元報道編輯:好困 喬楊 【新智元導讀】正在召開的ICLR 2024會議上,成為關注熱點的不僅有耀眼的成果和學術明星,關于論文的審稿程序也掀起了一波討論。大...
閱讀原文

【數據集匯總】大眾點評/攜程/百度地圖/米其林餐廳……內含餐廳/酒店的真實評價

作者:李寶珠 編輯:三羊 HyperAI超神經整理了 5 個優質數據集,覆蓋國內外出行的「食住行」剛需。又到「小長假」,HyperAI超神經在這里祝各位打工人假期愉快...
閱讀原文

谷歌再雪前恥,新Bard逆襲GPT-4沖上LLM排行榜第二!Jeff Dean高呼我們回來了

新智元報道編輯:潤 好困 【新智元導讀】谷歌Bard又行了?在第三方LLM「排位賽」排行榜上,Bard擊敗GPT-4成為第二名。Jeff Dean興奮宣布:谷歌回來了!一夜之...
閱讀原文