跟硅谷的核心AI公司聊完后,得到了這 60 條關鍵洞察
重塑世界的力量不在硅谷,而在一代中國從業者的努力中。
原標題:跟硅谷的核心AI公司聊完后,得到了這 60 條關鍵洞察
文章來源:Founder Park
內容字數:20957字
錦秋基金硅谷Scale With AI活動觀察:中國力量崛起
本文總結了錦秋基金在硅谷舉辦的Scale With AI活動后,組織者石頭的一些觀察和認知。活動匯聚了眾多AI領域的大廠和人才,石頭從中得出了一些重要的結論。
1. LLM發展趨勢:Pre-training時代終結,Post-training機遇涌現
1. LLM的Pre-training階段已接近瓶頸,Scaling速度放緩,但Post-training仍有巨大潛力。Multi-model的出現,使得數據和算力成為關鍵因素,新的架構也成為突破點。
2. Pre-training對數據質量要求不高,而Post-training則對數據質量要求極高,強化學習(RL)在Post-training中扮演著重要角色,它并非提升模型智力,而是優化思考模式。
3. 大模型優化主要在Post-training階段進行,用于提升安全性、構建Multi-agent框架,優化模型的應用效果。
4. 未來LLM發展方向可能包括:模型架構變化、知識模型解耦,以及大模型生成數據訓練小模型等。
5. 隨著Scaling Law達到極限,閉源和開源模型的差距將縮小。
6. Post-training團隊建設:5人規模即可,需涵蓋基礎設施搭建、數據管理、模型訓練、產品判斷等方面。
7. 數據pipeline構建至關重要,需要高效迭代,構建數據循環和護城河。
2. 視頻模型發展:Scaling Law瓶頸尚遠,但技術路徑多元化
1. 視頻生成技術仍處于早期階段,數據集匱乏是主要瓶頸,開源版本的難度也較高。
2. 未來視頻生成技術將呈現多元化趨勢,不同場景選擇不同的技術棧。
3. 視頻的Scaling Law遠未達到LLM的水平,模型架構優化和高效的數據使用至關重要。
4. 提升視頻生成速度的方法包括生成低分辨率畫面、步數蒸餾等。
5. 長視頻生成的未來在于故事性,而非單純的時長。
6. 視頻模型和其他模態的融合是未來發展方向,但目前仍面臨諸多挑戰。
3. 具身智能:人類級泛化能力的機器人尚遠,但特定場景應用可期
1. 具身機器人尚未迎來類似ChatGPT的“關鍵時刻”,通用性、可靠性和可擴展性是關鍵挑戰。
2. 機器人泛化面臨環境復雜性、物理交互問題和人機交互不確定性等挑戰。
3. 斯坦福實驗室選擇聚焦家庭場景,應對老齡化社會需求。
4. 場景調試至關重要,需要與領域專家合作,確保機器人適應特定場景。
5. 仿真技術是解決數據閉環問題的重要手段,但Sim-to-Real Gap仍然是挑戰。
6. 具身多模態模型具有巨大潛力,但數據整合和融合是關鍵難點。
7. 機器人數據共享面臨諸多挑戰,需要探索新的機制和平臺。
4. AI應用及AI Coding趨勢
1. 硅谷VC認為2025年是AI應用投資大年,但對AI產品的壁壘要求很高。
2. AI Native公司標準與傳統SaaS公司不同,其優勢在于低Customer Acquisition cost和高效的AI Scaling。
3. AI Coding重要趨勢是推理增強技術,例如O3或O1方法,可以顯著提升代碼代理效率。
4. GitHub Copilot是AI Coding領域的主要競爭對手。
5. 客戶成功對于AI Coding工具的采用至關重要。
總而言之,雖然硅谷是AI創新的中心,但石頭認為,重塑世界的力量也來自一代中國AI從業者的努力,這值得我們關注。
聯系作者
文章來源:Founder Park
作者微信:
作者簡介:來自極客公園,專注與科技創業者聊「真問題」。