標簽:能力
Nature 熱議論文證明「語言不是思考工具」,LLM 可能要學不會推理了?
機器之心PRO · 會員通訊 Week 26---- 本周為您解讀 ③個值得細品的AI & Robotics業內要事 ---- 1. Nature 熱議論文證明「語言不是思考工具」,LLM 可能要...
AI如何改變通信?對話聯想懂的通信
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI剛剛,世界通信行業頂級大會——MWC上海站落下帷幕。 展會上,不僅5.5G(5G-A)標準正式亮相,AI也成為了通信領域新...
打開文心大模型,一看全是生產力
機器之心報道 作者:澤南、小舟百度文心按下了 Turbo 鍵。 最近一段時間,人們在熱衷于給大模型「考試」。 不論是適用于機器的 Benchmark 跑分,還是人類的高...
打通大模型行業應用任督二脈!看訊飛星火如何做好大模型落地“必答題”
破解大模型落地最后一公里難題,科大訊飛甩出組合拳。 作者|程茜 編輯|漠影 智東西6月28日下午,昨日下午,科大訊飛的星火大模型迎來重磅升級,基于全國首個...
陳丹琦團隊圖表解讀新基準:新王Claude3.5剛及格,但已是模型最強推理表現
克雷西 發自 凹非寺量子位 | 公眾號 QbitAIClaude 3.5 Sonnet的圖表推理能力,比GPT-4o高出了27.8%。 針對多模態大模型在圖表任務上的表現,陳丹琦團隊提出了...
炸裂!訊飛現場大秀強干擾語音識別,星火4.0霸榜八個榜單,74種語言交流
游魚 發自 凹非寺量子位 | 公眾號 QbitAI很炸裂!訊飛星火大秀語音識別能力,現場掌聲雷動—— 三個人同時說話,再加上背景音樂,如此強干擾的場景,大模型卻表...
擊敗Gemini-1.5-Pro、GPT-4V,從容大模型多模態能力躋身全球前三
機器之心報道 機器之心編輯部近日,云從科技從容大模型在綜合評測權威平臺 OpenCompass 的多模態評測領域中取得重大進展。 最新評測結果顯示,云從科技的從容...
一群頂尖搜索人才如何2個月出貨,還把GPU利用率干到60%!揭秘百川智能研發大模型這一年
作者|褚杏娟 采訪嘉賓|陳煒鵬 去年的大模型之戰講究一個“快”字:入場快、發布快、迭代快。 王小川在去年 4 月份宣布成立“百川智能”的兩個月后,就迅速對外...
飛書,為何成為國內大模型獨角獸們的共同選擇?
機器之心發布 來源:虎嗅題圖 |視覺中國 在過去的一年多時間里,“大模型” 一直是中國科技領域內最熱門的賽道。 尤其是進入 2024 年之后,整個行業的熱度只能...
OpenAI封殺不支持地區API:違規封號,7月9日生效
機器之心報道 編輯:澤南該來的還是來了。昨晚,很多大模型應用的開發者、程序員都收到了 OpenAI 的警告信,心里一驚。OpenAI 在檢測用戶使用其 API 的地區后...
昆侖萬維攜手南洋理工大學搶發Q*算法:百倍提升7B模型推理能力
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
圖解智能和意識基本原理的“飛行模型”
作者:劉鋒 隨著本世紀以來人工智能的快速發展,其對人類社會的影響也越來越大,對于通用智能何時實現、人工智能是否能產生自我意識,人工智能未來的研究方...
語言≠思維,大模型學不了推理:一篇Nature讓AI社區炸鍋了
機器之心報道 機器之心編輯部方向完全搞錯了?大語言模型(LLM)為什么空間智能不足,GPT-4 為什么用語言以外的數據訓練,就能變得更聰明?現在這些問題有 「...
奧林匹克競賽里選最聰明的AI:Claude-3.5-Sonnet vs. GPT-4o?
AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
大模型“考生”數學全不及格!首個AI高考全卷評測結果出分
直播預告 | 6月25日晚7點,「智猩猩機器人新青年講座」第9講正式開講,UMass Amherst在讀博士周沁泓將直播講解《在具身智能模擬器中針對動態災害進行具身決策...