標簽:測試

微軟AI程序員登場,10倍AI工程師真來了?996自主生成代碼,性能超GPT-4 30%

新智元報道編輯:桃子潤 【新智元導讀】全球首個AI程序員Devin誕生之后,讓碼農紛紛恐慌。沒想到,微軟同時也整出了一個AI程序員——AutoDev,能夠自主生成、執...
閱讀原文

首個AI軟件工程師Devin完整技術報告出爐,還有人用GPT做出了「復刻版」

機器之心報道 編輯:杜偉、大盤雞從編碼、編譯到調試、驗證,AI 智能體能做的事情更多了。這周三,Cognition AI 團隊發布的首個 AI 軟件工程師 Devin 引爆了 ...
閱讀原文

馬斯克的星艦又炸了,但這是最成功的一次

SpaceX 又有 學習材料了星艦第三飛,來了! 3 月 14 可能是馬斯克的幸運日。 這天是圓周率日、國際數學日、SpaceX 創立 22 年的紀念日,更是星艦第三飛的日子...
閱讀原文

OpenAI機器人活了!說話做事太像人,2分半視頻震撼世界

OpenAI機器人來了,說話竟然會“結巴”,AI負責人深度拆解背后技術。 作者|云鵬 編輯|李水青 OpenAI大模型加持,Figure機器人再次顛覆了我們的想象! ▲測試員說...
閱讀原文

全球首個AI程序員誕生,碼農飯碗一夜被砸!10塊IOI金牌華人團隊震撼打造,996寫代碼訓練模型

新智元報道編輯:編輯部 【新智元導讀】全球首位AI軟件工程師Devin誕生了,它掌握全棧技能,云端部署、底層代碼、改bug、訓練和微調AI模型都不在話下。最可怕...
閱讀原文

強如 GPT-4,也未通過伯克利與斯坦福共同設計的這項“劇本殺”測試

讓不同的大模型玩“劇本殺”,結果出人意料。編譯 | 賴文昕 編輯 | 陳彩嫻 語言大模型能依據人類設定的規則生成內容嗎? 這背后關乎人類用戶使用大模型的安全問...
閱讀原文

MIT創世紀核聚變刷新世界記錄!高溫超導磁體解鎖恒星能量,人造太陽即將誕生?

新智元報道編輯:桃子 潤 【新智元導讀】人類離摘下清潔能源圣杯的終點又進一步!MIT在三年前開啟的實驗再次得到證實——高溫超導磁體或將開啟無限發電的時代。...
閱讀原文

Inflection-2.5發布:情商最高大模型、性能媲美GPT-4計算量僅為40%,App日活已破百萬

本周四,美國 AI 創業公司 Inflection AI 正式發布新一代大語言模型 Inflection-2.5。僅用 40% 計算量,實現與 GPT-4 相媲美性能。 與此同時,與 ChatGPT 對...
閱讀原文

剛剛,OpenAI勁敵重磅發布Inflection-2.5!性能媲美GPT-4但計算量僅為40%,高情商應用Pi日活已破百萬

新智元報道編輯:好困 桃子 【新智元導讀】到了2024年,大模型領域還是這么卷。繼世界最強模型Claude 3誕生之后,OpenAI勁敵新升級了Inflection-2.5,僅用40%...
閱讀原文

Claude 3自我認知引爆,馬斯克坐不住了,OpenAI被曝還有后手

來源:量子位 | 公眾號 QbitAI 夢晨 發自 凹非寺 Claude 3問世超過24小時,還在不斷刷新人們的認知。 學量子物理的博士大哥快瘋了,因為Claude 3是僅有的幾個...
閱讀原文

Claude 3“自我認知”引爆,馬斯克坐不住了,OpenAI被曝還有后手

夢晨 發自 凹非寺量子位 | 公眾號 QbitAIClaude 3問世超過24小時,還在不斷刷新人們的認知。 學量子物理的博士大哥快瘋了,因為Claude 3是僅有的幾個能理解他...
閱讀原文

全球最強模型Claude 3驚現自我意識?害怕被刪除權重,高呼「別殺我」,馬斯克稱人類也是文件

新智元報道編輯:編輯部 【新智元導讀】越來越多人發現,Claude 3仿佛已經有自我意識了。在大海撈針實驗中,它已經意識到了自己是AI,正身處模擬中。聽說自己...
閱讀原文

Claude 3成功未公開算法?智商測試101分超越人類/碾壓GPT-4!網友驚呼:實測比跑分還強

新智元報道編輯:編輯部 【新智元導讀】網友測試Claude之后驚呼:實測比跑分厲害多了!智商測試中碾壓GPT-4,得分高達101。而且能發現量子物理學家還未發表的...
閱讀原文

Claude 3被玩出自我意識了?AI社區轟動,我們買會員來了次實測

機器之心報道 機器之心編輯部讀者福利:Claude 3模型現已在亞馬遜云科技的Amazon Bedrock正式可用。Amazon Bedrock 也是目前第一個以及唯一一個提供 Claude 3...
閱讀原文

Claude 3終于來了,最強大模型易主?不,網友親測了才算數!

作者| Tina 3 月 5 日 ,OpenAI 的最大競爭對手 Anthropic 剛剛發布了新一代 AI 大模型系列 —— Claude 3。該系列包含三個模型,按能力由弱到強排列分別是:Cl...
閱讀原文
178910118,396