標簽：答案

AI搜索之戰再迎微軟Bing入局，「千年老二」能否一舉翻身？

新智元報道編輯：庸庸喬楊【新智元導讀】搜索引擎市場老二微軟Bing引進AI搜索功能，集傳統搜索結果和AI搜索結果于一體，這次，能撼動老大哥谷歌搜索的江山...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI向Google宣戰，重磅推出AI搜索引擎SearchGPT，卻被網友發現已翻車？

來源：CSDN（ID：CSDNnews）整理：屠敏有 AI 在的科技圈，似乎沒有冷場的時候。過去一周，前有 Meta 發布最強模型Llama 3.1炸場，揚言要成為 AI 界的 Linux...

閱讀原文

AIGC動態

1年前 (2024)

AI搜索大戰打響！OpenAI深夜發布SearchGPT，不過先“翻車”了

9月6-7日，2024全球AI芯片峰會將在北京召開。目前，AMD人工智能事業部高級總監王宏強，清華大學交叉信息研究院助理教授、北極雄芯創始人馬愷聲，珠海芯動力創...

閱讀原文

AIGC動態

1年前 (2024)

IMO數學競賽第5題是何方神圣？大模型全軍覆沒了…

夕小瑤科技說原創作者 | 海野昨天，第65屆IMO（國際數學奧林匹克競賽）決賽成績公布，中國隊因2分之差憾失冠軍。從中國隊的得分情況來看，其中第5題是中國...

閱讀原文

AIGC動態

1年前 (2024)

大模型“自學”后能力反下降，Llama/Mistral都沒逃過

PengFei Liu 投稿量子位 | 公眾號 QbitAIAI經過多輪“自我提升”，能力不增反降？上海交通大學GAIR團隊最新研究表明，在常識理解、數學推理和代碼生成等復雜任...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI超級對齊團隊再發「絕唱」！首提「證明者-驗證者」博弈，訓練GPT說人話

新智元報道編輯：喬楊好困【新智元導讀】當我們不停在CoT等領域大下苦功、試圖提升LLM推理準確性的同時，OpenAI的對齊團隊從另一個角度發現了華點——除了準...

閱讀原文

AIGC動態

1年前 (2024)

OpenAI超級對齊團隊遺作：兩個大模型博弈一番，輸出更好懂了

機器之心報道機器之心編輯部如果 AI 模型給的答案一點也看不懂，你敢用嗎？隨著機器學習系統在更重要的領域得到應用，證明為什么我們可以信任它們的輸出，并...

閱讀原文

AIGC動態

1年前 (2024)

微軟開源的GraphRAG爆火，Github Star量破萬，生成式AI進入知識圖譜時代？

機器之心報道編輯：Panda W知識圖譜從不退環境！LLM 很強大，但也存在一些明顯缺點，比如幻覺問題、可解釋性差、抓不住問題重點、隱私和安全問題等。檢索增...

閱讀原文

AIGC動態

1年前 (2024)

給大家介紹我的新工具人，夸克AI搜索

NO.1AI時代的搜索變身搜索引擎，長期占據互聯網“鐵王座”。 AI迅猛崛起后，風向有變。有人猜測： “搜索引擎的黃金時代可能要結束了。”然而，這事沒那么簡單，...

閱讀原文

AIGC動態

1年前 (2024)

首個視頻思維鏈推理框架Video-of-Thought來了：像人一樣從感知到認知全面推理視頻

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年，機器之心AIxiv專欄接收報道了2000多篇內容，覆蓋全球各大高校與企業的頂級實驗室，有效促進了學術...

閱讀原文

AIGC動態

1年前 (2024)

大模型權威測試被曝翻車！更偏袒GPT-4等閉源模型，連提示詞都區別對待

白交發自凹非寺量子位 | 公眾號 QbitAI大模型權威測試，翻車了？！ HuggingFace都在用的MMLU-PRO，被扒出評測方法更偏向閉源模型，被網友直接在GitHub Issu...

閱讀原文

AIGC動態

1年前 (2024)

語義熵識破LLM幻覺！牛津大學新研究登Nature

新智元報道編輯：alan 【新智元導讀】近日，來自牛津大學的研究人員推出了利用語義熵來檢測LLM幻覺的新方法。作為克服混淆的策略，語義熵建立在不確定性估計...

閱讀原文

AIGC動態

1年前 (2024)

復旦大學：一個小技巧探測大模型的知識邊界，有效消除幻覺

夕小瑤科技說原創作者 | Zicy 孔子說“知之為知之，不知為不知，是知也”，目前的大模型非常缺乏這個能力。雖然大模型擁有豐富的知識，但它仍然缺乏對自己知識...

閱讀原文

AIGC動態

1年前 (2024)

你的欲言又止它都懂！輸入法竟然自帶AI了，90% 的人還不知道！

點擊上方藍字關注我們“微信輸入法迎來AI革新，Mac和Windows版本新增輸入即查功能，手機端'邊寫邊譯'支持多語言，讓溝通無國界。在這個AI橫行霸道的時代，微信...

閱讀原文

AIGC動態

1年前 (2024)

2024KDD挑戰任務，GPT-4僅得40分，Meta發布最新RAG評價基準

夕小瑤科技說原創作者 | Axe_越眾所周知，“要想富，先修路”，經常挖路的同學應該知道，要想修好一條路，首先就必須搞清楚關于道路質量的統一驗收標準，否則...

閱讀原文

AIGC動態

1年前 (2024)

123 4…6