標簽:模型

對標Hugging Face?GitHub Models新增OpenAI o1/Llama 3.2等, 新功能支持模型并排比較

作者:李姝,李寶珠 編輯:李寶珠 北京時間 10 月 30 日,GitHub Universe 2024 如約而至,而今年正值大會十周年紀念日。本文將從 GitHub 發布的 AI 新進展入...
閱讀原文

杰弗里·辛頓:從小語言到大語言,人工智能究竟如何理解人類?

來源:返樸 演講:杰弗里·辛頓 翻譯:陳國華(北京外國語大學外國語言研究所教授)2024 年 4 月 8 日辛頓獲得尤利西斯獎章,以表彰他對計算機科學人工智能領...
閱讀原文

微軟發長文炮轟谷歌:不遺余力詆毀我們;抖音:嚴厲打擊利用AI騙取老年人互動;蘋果公開其AI背后技術,邀請研究人員訪問丨AI情報局

要聞提示1.字節招兵買馬,擬在歐洲設立 AI 研發中心 2.抖音:嚴厲打擊利用 AI 騙取老年人互動,下架違規視頻、處置違規賬號3.可靈 AI 收入或破千萬,商業化已...
閱讀原文

港科大廣州2025年春季與秋季博士生/研究助理招聘-大模型、AI4SCI、幾何機器學習等方向

香港科技大學(廣州)數據智能與幾何人工智能實驗室(DIGAI Lab) 誠邀有志于AI前沿研究的優秀學子加入,攻讀博士學位或進行訪問研究。實驗室專注于表示學習、...
閱讀原文

至高 1.8 倍無損加速!互補量化方案的投機加速

夕小瑤科技說 原創作者 | Juntao Zhao等本文作者來自香港大學和哈爾濱工業大學。其中共同第一作者分別為來自香港大學Netexplo實驗室的博士生Juntao Zhao、She...
閱讀原文

邁向復現 OpenAI o1 的一小步:Steiner 開源模型階段性進展報告

講座預告11月1日上午10點,南開大學在讀博士李森茂,將以《基于擴散模型編碼器模塊的推理加速》為主題進行直播講解,歡迎掃碼報名~導讀作者為季逸超 原文來自...
閱讀原文

神秘模型“小熊貓”一夜刷屏:排名超Flux、Midjourney,網友:一看就中國的

一水 發自 凹非寺量子位 | 公眾號 QbitAI一夜之間,名為“red_panda”(小熊貓)的神秘文生圖模型狠狠火了!! 登頂文生圖競技場,直接將Flux、Midjourney等一...
閱讀原文

免訓練大模型知識編輯,吸收新數據更高效|EMNLP'24

阿里安全 投稿量子位 | 公眾號 QbitAI讓大模型能快速、準確、高效地吸收新知識! 被EMNLP 2024收錄的一項新研究,提出了一種檢索增強的連續提示學習新方法,...
閱讀原文

權威AI開源標準1.0版發布:Llama也不算開源

機器之心報道 編輯:澤南、小舟大模型開源的口號,不是隨便說說的。該來的終于來了。 本周,人工智能領域迎來了對于「開源」的官方定義。開放源代碼促進會(O...
閱讀原文

超越YOLOv10/11、RT-DETRv2/3!中科大D-FINE重新定義邊界框回歸任務

AIxiv專欄是機器之心發布學術、技術內容的欄目。過去數年,機器之心AIxiv專欄接收報道了2000多篇內容,覆蓋全球各大高校與企業的頂級實驗室,有效促進了學術...
閱讀原文

古早費曼論文手寫公式也能轉LaTeX,還能看懂梗圖,馬斯克Grok新功能上線就火了

機器之心報道 編輯:張倩、陳陳Grok 大模型終于能看懂圖像了。設想一下,如果我們能夠將所有 LaTeX 時代之前的文本資料輸入到先進的大型語言模型(LLM)中,...
閱讀原文

新擴散模型OmniGen一統圖像生成,架構還高度簡化、易用

機器之心發布 機器之心編輯部大型語言模型(LLM)的出現統一了語言生成任務,并徹底改變了人機交互。然而,在圖像生成領域,能夠在單一框架內處理各種任務的...
閱讀原文

小紅書大模型團隊的探索與實踐:從 0 到 1 構建自研 RLHF 框架

采訪嘉賓 | 于子淇,小紅書 資深技術專家 編輯 | 冬梅 在人工智能技術的快速發展中,多模態大語言模型(MLLM)以其強大的圖文理解、創作、知識推理及指令遵...
閱讀原文

一個模型走天下!智源提出全新擴散架構OmniGen,AI生圖進入「一鍵生成」時代

新智元報道編輯:編輯部 HYZ 【新智元導讀】LLM統一了語言生成任務,圖像生成可以嗎?就在剛剛,智源推出了全新擴散模型架構OmniGen,單個模型就能生成圖像,...
閱讀原文

超越Transformer,全面升級!MIT等華人團隊發布通用時序TimeMixer++架構,8項任務全面領先

新智元報道編輯:LRST 【新智元導讀】TimeMixer++是一個創新的時間序列分析模型,通過多尺度和多分辨率的方法在多個任務上超越了現有模型,展示了時間序列分...
閱讀原文
12122232425483