標簽:答案

AI搜索之戰再迎微軟Bing入局,「千年老二」能否一舉翻身?

新智元報道編輯:庸庸 喬楊 【新智元導讀】搜索引擎市場老二微軟Bing引進AI搜索功能,集傳統搜索結果和AI搜索結果于一體,這次,能撼動老大哥谷歌搜索的江山...
閱讀原文

OpenAI向Google宣戰,重磅推出AI搜索引擎SearchGPT,卻被網友發現已翻車?

來源:CSDN(ID:CSDNnews) 整理:屠敏 有 AI 在的科技圈,似乎沒有冷場的時候。過去一周,前有 Meta 發布最強模型Llama 3.1炸場,揚言要成為 AI 界的 Linux...
閱讀原文

AI搜索大戰打響!OpenAI深夜發布SearchGPT,不過先“翻車”了

9月6-7日,2024全球AI芯片峰會將在北京召開。目前,AMD人工智能事業部高級總監王宏強,清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲,珠海芯動力創...
閱讀原文

IMO數學競賽第5題是何方神圣?大模型全軍覆沒了…

夕小瑤科技說 原創作者 | 海野昨天,第65屆IMO(國際數學奧林匹克競賽)決賽成績公布,中國隊因2分之差憾失冠軍。 從中國隊的得分情況來看,其中第5題是中國...
閱讀原文

大模型“自學”后能力反下降,Llama/Mistral都沒逃過

PengFei Liu 投稿量子位 | 公眾號 QbitAIAI經過多輪“自我提升”,能力不增反降? 上海交通大學GAIR團隊最新研究表明,在常識理解、數學推理和代碼生成等復雜任...
閱讀原文

OpenAI超級對齊團隊再發「絕唱」!首提「證明者-驗證者」博弈,訓練GPT說人話

新智元報道編輯:喬楊 好困 【新智元導讀】當我們不停在CoT等領域大下苦功、試圖提升LLM推理準確性的同時,OpenAI的對齊團隊從另一個角度發現了華點——除了準...
閱讀原文

OpenAI超級對齊團隊遺作:兩個大模型博弈一番,輸出更好懂了

機器之心報道 機器之心編輯部如果 AI 模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域得到應用,證明為什么我們可以信任它們的輸出,并...
閱讀原文

微軟開源的GraphRAG爆火,Github Star量破萬,生成式AI進入知識圖譜時代?

機器之心報道 編輯:Panda W知識圖譜從不退環境!LLM 很強大,但也存在一些明顯缺點,比如幻覺問題、可解釋性差、抓不住問題重點、隱私和安全問題等。檢索增...
閱讀原文

給大家介紹我的新工具人,夸克AI搜索

NO.1AI時代的搜索變身搜索引擎,長期占據互聯網“鐵王座”。 AI迅猛崛起后,風向有變。 有人猜測: “搜索引擎的黃金時代可能要結束了?!比欢?,這事沒那么簡單,...
閱讀原文

首個視頻思維鏈推理框架Video-of-Thought來了:像人一樣從感知到認知全面推理視頻

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

大模型權威測試被曝翻車!更偏袒GPT-4等閉源模型,連提示詞都區別對待

白交 發自 凹非寺量子位 | 公眾號 QbitAI大模型權威測試,翻車了?! HuggingFace都在用的MMLU-PRO,被扒出評測方法更偏向閉源模型,被網友直接在GitHub Issu...
閱讀原文

語義熵識破LLM幻覺!牛津大學新研究登Nature

新智元報道編輯:alan 【新智元導讀】近日,來自牛津大學的研究人員推出了利用語義熵來檢測LLM幻覺的新方法。作為克服混淆的策略,語義熵建立在不確定性估計...
閱讀原文

復旦大學:一個小技巧探測大模型的知識邊界,有效消除幻覺

夕小瑤科技說 原創作者 | Zicy 孔子說“知之為知之,不知為不知,是知也”,目前的大模型非常缺乏這個能力。雖然大模型擁有豐富的知識,但它仍然缺乏對自己知識...
閱讀原文

你的欲言又止它都懂!輸入法竟然自帶AI了,90% 的人還不知道!

點擊上方藍字關注我們“微信輸入法迎來AI革新,Mac和Windows版本新增輸入即查功能,手機端'邊寫邊譯'支持多語言,讓溝通無國界。在這個AI橫行霸道的時代,微信...
閱讀原文

2024KDD挑戰任務,GPT-4僅得40分,Meta發布最新RAG評價基準

夕小瑤科技說 原創作者 | Axe_越眾所周知,“要想富,先修路”,經常挖路的同學應該知道,要想修好一條路,首先就必須搞清楚關于道路質量的統一驗收標準,否則...
閱讀原文
12346