標簽:答案

AI搜索之戰(zhàn)再迎微軟Bing入局,「千年老二」能否一舉翻身?

新智元報道編輯:庸庸 喬楊 【新智元導讀】搜索引擎市場老二微軟Bing引進AI搜索功能,集傳統(tǒng)搜索結(jié)果和AI搜索結(jié)果于一體,這次,能撼動老大哥谷歌搜索的江山...
閱讀原文

OpenAI向Google宣戰(zhàn),重磅推出AI搜索引擎SearchGPT,卻被網(wǎng)友發(fā)現(xiàn)已翻車?

來源:CSDN(ID:CSDNnews) 整理:屠敏 有 AI 在的科技圈,似乎沒有冷場的時候。過去一周,前有 Meta 發(fā)布最強模型Llama 3.1炸場,揚言要成為 AI 界的 Linux...
閱讀原文

AI搜索大戰(zhàn)打響!OpenAI深夜發(fā)布SearchGPT,不過先“翻車”了

9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業(yè)部高級總監(jiān)王宏強,清華大學交叉信息研究院助理教授、北極雄芯創(chuàng)始人馬愷聲,珠海芯動力創(chuàng)...
閱讀原文

IMO數(shù)學競賽第5題是何方神圣?大模型全軍覆沒了…

夕小瑤科技說 原創(chuàng)作者 | 海野昨天,第65屆IMO(國際數(shù)學奧林匹克競賽)決賽成績公布,中國隊因2分之差憾失冠軍。 從中國隊的得分情況來看,其中第5題是中國...
閱讀原文

大模型“自學”后能力反下降,Llama/Mistral都沒逃過

PengFei Liu 投稿量子位 | 公眾號 QbitAIAI經(jīng)過多輪“自我提升”,能力不增反降? 上海交通大學GAIR團隊最新研究表明,在常識理解、數(shù)學推理和代碼生成等復雜任...
閱讀原文

OpenAI超級對齊團隊再發(fā)「絕唱」!首提「證明者-驗證者」博弈,訓練GPT說人話

新智元報道編輯:喬楊 好困 【新智元導讀】當我們不停在CoT等領(lǐng)域大下苦功、試圖提升LLM推理準確性的同時,OpenAI的對齊團隊從另一個角度發(fā)現(xiàn)了華點——除了準...
閱讀原文

OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了

機器之心報道 機器之心編輯部如果 AI 模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統(tǒng)在更重要的領(lǐng)域得到應用,證明為什么我們可以信任它們的輸出,并...
閱讀原文

微軟開源的GraphRAG爆火,Github Star量破萬,生成式AI進入知識圖譜時代?

機器之心報道 編輯:Panda W知識圖譜從不退環(huán)境!LLM 很強大,但也存在一些明顯缺點,比如幻覺問題、可解釋性差、抓不住問題重點、隱私和安全問題等。檢索增...
閱讀原文

給大家介紹我的新工具人,夸克AI搜索

NO.1AI時代的搜索變身搜索引擎,長期占據(jù)互聯(lián)網(wǎng)“鐵王座”。 AI迅猛崛起后,風向有變。 有人猜測: “搜索引擎的黃金時代可能要結(jié)束了。”然而,這事沒那么簡單,...
閱讀原文

首個視頻思維鏈推理框架Video-of-Thought來了:像人一樣從感知到認知全面推理視頻

AIxiv專欄是機器之心發(fā)布學術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機器之心AIxiv專欄接收報道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實驗室,有效促進了學術(shù)...
閱讀原文

大模型權(quán)威測試被曝翻車!更偏袒GPT-4等閉源模型,連提示詞都區(qū)別對待

白交 發(fā)自 凹非寺量子位 | 公眾號 QbitAI大模型權(quán)威測試,翻車了?! HuggingFace都在用的MMLU-PRO,被扒出評測方法更偏向閉源模型,被網(wǎng)友直接在GitHub Issu...
閱讀原文

語義熵識破LLM幻覺!牛津大學新研究登Nature

新智元報道編輯:alan 【新智元導讀】近日,來自牛津大學的研究人員推出了利用語義熵來檢測LLM幻覺的新方法。作為克服混淆的策略,語義熵建立在不確定性估計...
閱讀原文

復旦大學:一個小技巧探測大模型的知識邊界,有效消除幻覺

夕小瑤科技說 原創(chuàng)作者 | Zicy 孔子說“知之為知之,不知為不知,是知也”,目前的大模型非常缺乏這個能力。雖然大模型擁有豐富的知識,但它仍然缺乏對自己知識...
閱讀原文

你的欲言又止它都懂!輸入法竟然自帶AI了,90% 的人還不知道!

點擊上方藍字關(guān)注我們“微信輸入法迎來AI革新,Mac和Windows版本新增輸入即查功能,手機端'邊寫邊譯'支持多語言,讓溝通無國界。在這個AI橫行霸道的時代,微信...
閱讀原文

2024KDD挑戰(zhàn)任務,GPT-4僅得40分,Meta發(fā)布最新RAG評價基準

夕小瑤科技說 原創(chuàng)作者 | Axe_越眾所周知,“要想富,先修路”,經(jīng)常挖路的同學應該知道,要想修好一條路,首先就必須搞清楚關(guān)于道路質(zhì)量的統(tǒng)一驗收標準,否則...
閱讀原文
12346