標簽:模型
高效能不等于開發快,大模型時代如何正確提升研發效能?
采訪嘉賓 | 肖然 編輯 | 凌敏 從最初的敏捷軟件開發方法到 DevOps 成熟度模型,研發效能的發展歷程經過多個階段。如今,基于大模型的 AIGC 技術正在催生軟件...
多模態大模型綜述:從專家到通用助手
文章轉載自量子位,Founder Park 有所調整。多模態大模型最全綜述來了!由微軟 7 位華人研究員撰寫,足足 119 頁——它從目前已經完善的和還處于最前沿的兩類多...
頂尖科學家如何玩轉AI?DeepSpeed4Science:利用先進的AI系統優化技術實現科學發現
新智元報道編輯:LRS 好困【新智元導讀】AI助力科學發現,DeepSpeed4Science計劃引領新時代技術突破!在接下來的十年中,深度學習可能會徹底改變自然科學,增...
不要淪為大模型應用的“炮灰”
作者|褚杏娟“雖然在 2012 年到 2015 年間,深度學習在圖像識別領域獲得了巨大成功,但要達到通用人工智能,還需要時間。”這是讀研究生時劉小洋的老教授告訴...
Chinchilla之死:只要訓練足夠長時間,小模型也能超過大模型
選自espadrine機器之心編譯2022 年 3 月,DeepMind 一篇論文《Training Compute-Optimal Large Language Models》通過構建的 Chinchilla 模型得出了一個結論...
如何評估大語言模型是否可信?這里總結了七大維度
機器之心發布作者:劉揚,Kevin Yao本文提出 7 個主要關鍵維度來全面評估 LLM 可信度。實際部署中,如何 “對齊”(alignment)大型語言模型(LLM,Large Langu...
AI 模擬《漫長的季節》角色唱歌
大數據文摘受權轉載自陳東澤最近,自研了一個 AI 模型叫 TalkSVS,能根據人們說話的聲音,去模擬其唱歌。舉個例子,電視劇《漫長的季節》,臺詞白話。這個模...
語言模型有重大缺陷,知識推演竟然是老大難
來源:機器之心驚人發現:大模型在知識推演上存在嚴重缺陷。靈活運用知識是智慧的關鍵。人腦可以快速處理知識,如快速回答 “《靜夜思》中有幾個月字”。那么,...
【人工智能】美智庫建議利用生成式人工智能提升決策優勢
往期回顧簡介近期,美國防務智庫特別競爭研究項目(Special Competitive Studies Project)發布了一份《生成式人工智能:未來創新的力量》文件,文件認為美國國...
華為中秋節給員工發Mate60手機;商湯科技回應原知產總監被立案偵查;馬斯克平均年終獎33億元 | AI一周資訊
整理 | 凌敏 第四范式港股上市;微軟發布 Windows 11 重大更新,包含 Copilot 和 AI 驅動畫圖工具;阿里分拆菜鳥獨立上市;臺積電 AI 芯片將漲價;抖音推出閃...
真實性驚人,谷歌、康奈爾提出真實的圖像補全技術RealFill
機器之心報道編輯:XW得到一張好看的照片越來越容易了。假期出游,肯定少不了拍照留念。不過,大部分在景區拍攝的照片或多或少都有些遺憾,背景里不是多了些...
小扎元宇宙1小時「真人對談」載入史冊!13個月超進化,表情模擬2.0,連頭發絲都根根分明
新智元報道編輯:桃子 潤【新智元導讀】《頭號玩家》的世界近在咫尺!周末,小扎在元宇宙開啟了1小時「真人對談」,讓主播感慨差點忘記眼前的人竟不是真人。...
雷軍王小川牽手,小米大模型投資布局首次曝光
衡宇 發自 凹非寺量子位 | 公眾號 QbitAI大模型時代,雷軍和王小川走到了一起。量子位最新獲悉,王小川旗下的創業公司百川智能,已經成為雷軍大模型布局中的...
賈佳亞韓松團隊新作:兩行代碼讓大模型上下文窗口倍增 | GitHub熱榜
克雷西 發自 凹非寺量子位 | 公眾號 QbitAI只要兩行代碼+11個小時微調,就能把大模型4k的窗口長度提高到32k。規模上,最長可以擴展到10萬token,一口氣就能讀...
Meta官方博客:開源模型Llama的生態是怎樣的?
本文來源于 Meta AI 官方博客,作者 Meta AI 產品總監Joe Spisak 和工程總監Sergey Edunov。原文鏈接:https://ai.meta.com/blog/llama-2-updates-connect-20...
粵公網安備 44011502001135號