標(biāo)簽:上下文

OpenAI o1 團(tuán)隊(duì)在線答疑:o1的o指OpenAI,強(qiáng)化后的推理有泛化能力,未來模型思考時(shí)間可控!

這可能是最有參與感的一次產(chǎn)品問答了。 對于 OpenAI o1 的所有疑問和好奇,由推特的所有網(wǎng)友來提問,OpenAI 的全體技術(shù)人員來回答。數(shù)了下,一共有 12 位員工...
閱讀原文

原生集成GitHub,讓AI成為協(xié)作者,Claude企業(yè)版饞哭個(gè)人開發(fā)者

機(jī)器之心報(bào)道 機(jī)器之心編輯部聊天機(jī)器人的 game changer? 剛剛,只有 Claude 聊天機(jī)器人一款產(chǎn)品的 Anthropic 更新了其產(chǎn)品線,推出了 Claude Enterprise(C...
閱讀原文

一款小而強(qiáng)大的編程助手:零一萬物正式開源Yi-Coder系列模型

在 AI 領(lǐng)域中,代碼生成和編輯工具一直是開發(fā)者們關(guān)注的焦點(diǎn)。 今天,零一萬物開源了 Yi-Coder 系列模型,它作為 Yi 系列模型家族中的“編程小能手”,展現(xiàn)了卓...
閱讀原文

Jamba 1.5發(fā)布,最長上下文,非Transformer架構(gòu)首次成功領(lǐng)先

昨天,號稱當(dāng)前最強(qiáng)、最高效的長上下文模型——Jamba 1.5 系列發(fā)布。 Jamba 是第一個(gè)基于 Mamba 架構(gòu)的生產(chǎn)級模型。Mamba 是由卡內(nèi)基梅隆大學(xué)和普林斯頓大學(xué)的...
閱讀原文

大模型時(shí)代的ASR就是不一樣!豆包“聽力”水平現(xiàn)場評測,方言&小朋友口音直接拿捏!

機(jī)器之心發(fā)布 機(jī)器之心編輯部2024 火山引擎 AI 創(chuàng)新巡展上海站于近日舉辦,活動(dòng)展示了豆包大模型在綜合評分、語音識別等方面的效果提升,還發(fā)布了對話式 AI ...
閱讀原文

謝謝微軟,又又又Open了!一口氣發(fā)布3款Phi-3.5新模型,領(lǐng)先Llama3.1和谷歌同級模型

夕小瑤科技說 原創(chuàng)作者 | 付奶茶家人們!微軟又用愛發(fā)電了!一覺醒來,微軟發(fā)布了最新的小模型三兄弟: Phi-3.5-MoE-instruct Phi-3.5-mini-instruct Phi-3.5...
閱讀原文

打臉“AI滅絕倫”!研究反駁:大模型涌現(xiàn)能力不會威脅人類生存

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條 大語言模型(LLM)因“涌現(xiàn)能力”(emergent abilities)而擁有了超出人類預(yù)期的技能,但也因此讓人類十分忌憚:操縱、欺騙人類...
閱讀原文

給RAG系統(tǒng)做一次全面「體檢」,亞馬遜開源RAGChecker診斷工具

AIxiv專欄是機(jī)器之心發(fā)布學(xué)術(shù)、技術(shù)內(nèi)容的欄目。過去數(shù)年,機(jī)器之心AIxiv專欄接收報(bào)道了2000多篇內(nèi)容,覆蓋全球各大高校與企業(yè)的頂級實(shí)驗(yàn)室,有效促進(jìn)了學(xué)術(shù)...
閱讀原文

非Transformer架構(gòu)站起來了!首個(gè)純無注意力大模型,超越開源巨頭Llama 3.1

機(jī)器之心報(bào)道 編輯:杜偉、陳陳Mamba 架構(gòu)的大模型又一次向 Transformer 發(fā)起了挑戰(zhàn)。Mamba 架構(gòu)模型這次終于要「站」起來了?自 2023 年 12 月首次推出以來...
閱讀原文

大模型“腦回路”統(tǒng)一了?LLMs竟然能正確回答其他模型虛構(gòu)的題目

來源:夕小瑤科技說 原創(chuàng) 作者:謝年年 最近開源模型Llama3.1上線,其405B模型竟超越閉源GPT-4o,一夜之間成最強(qiáng)大模型! 然而榜首的位置還沒坐熱,僅隔一天...
閱讀原文

小技巧大功效,「僅閱讀兩次提示」讓循環(huán)語言模型超越Transformer++

機(jī)器之心報(bào)道 編輯:杜偉在當(dāng)前 AI 領(lǐng)域,大語言模型采用的主流架構(gòu)是 Transformer。不過,隨著 RWKV、Mamba 等架構(gòu)的陸續(xù)問世,出現(xiàn)了一個(gè)很明顯的趨勢:在...
閱讀原文

NVIDIA把Llama-3的上下文長度擴(kuò)展16倍,長上下文理解能力超越GPT-4

夕小瑤科技說 原創(chuàng)作者 | Richard在 Llama-3.1 模型發(fā)布之前,開源模型與閉源模型的性能之間一直存在較大的差距,尤其是在長上下文理解能力上。 大模型的上下...
閱讀原文

還沒排上SearchGPT?比Perplexity更好用的國產(chǎn)開源平替了解一下?

機(jī)器之心報(bào)道 編輯:佳琪、澤南來自上海人工智能實(shí)驗(yàn)室。 有 AI 在的科技圈,似乎沒有中場休息。除了大模型發(fā)布不斷,各家科技大廠也在尋找著第一個(gè)「殺手級...
閱讀原文

GPT-4o 語音模式終于來了,首批測試網(wǎng)友已經(jīng)玩瘋了

趕在 7 月結(jié)束前,GPT-4o 語音功能終于開啟?,F(xiàn)開啟灰度測試,一小部分 ChatGPT Plus 用戶已經(jīng)可以試用。 如果打開 ChatGPT App 之后看到了下面這個(gè)界面,恭...
閱讀原文

GPT-4o版「Her」終于來了!講笑話、學(xué)貓叫,AI女友能有多?

新智元報(bào)道編輯:桃子 好困 【新智元導(dǎo)讀】GPT-4o語音功能終于如期而至,科幻版Her走進(jìn)現(xiàn)實(shí)!一些灰度測試到的網(wǎng)友們已經(jīng)玩瘋了,不過,OpenAI目前只給了4種...
閱讀原文
123415