原標題:階躍同時開源視頻生成+實時語音模型,我愿稱之「多模態界的Deepseek」
文章來源:夕小瑤科技說
內容字數:6015字
中國開源大模型的崛起:階躍星辰的驚艷表現
本文總結了關于中國AI初創公司階躍星辰及其最新開源大模型的報道要點。階躍星辰在短短兩年內發布了11款多模態模型,展現了其驚人的研發速度和技術實力,被譽為“多模態卷王”。其最新發布的兩個模型——Step-Video-T2V和Step-Audio,在全球范圍內引發關注,被認為是繼DeepSeek之后又一個里程碑式的成果。
1. Step-Video-T2V:開源視頻生成模型的王者
Step-Video-T2V是一個參數量高達300億的視頻生成模型,超越了此前騰訊混元130億參數的開源模型,成為新的開源老大。該模型在多個維度上超越了之前的SOTA模型,尤其在、風景、人物等復雜場景的生成上表現出色,其流暢的運鏡、精準的細節還原以及對物理規律的理解都令人印象深刻。模型采用MIT開源協議,允許商用和任意編輯,進一步降低了使用門檻。
2. Step-Audio:實時語音對話模型的突破
Step-Audio是一個支持實時語音對話的模型,同樣在躍問APP上提供免費不限次的使用。該模型支持多種語言、方言和情緒表達,甚至可以理解和復現繞口令,其在學術測試基準上也全面超越了之前的開源模型。更重要的是,Step-Audio-chat版本可以調用外部工具,如搜索引擎和知識庫,這使其更接近實際應用場景,有望成為業內首個產品級的開源語音交互模型。階躍星辰還同時開源了一個新的語音評估體系StepEval-Audio-360,為更客觀地評估語音模型提供了新的標準。
3. 階躍星辰的快速發展和技術實力
階躍星辰在短短兩年內取得的成就令人矚目,平均每兩個月就發布一款新模型,其模型涵蓋了圖像、視頻、語音等多種模態。其其他模型也在多個權威榜單上取得了領先地位,例如Step-1o-vision在LMSYS Org榜單中獲得國內視覺領域大模型第一。這些都證明了階躍星辰強大的技術實力和創新能力。
4. 中國AI的蓬勃發展
階躍星辰的成功,以及DeepSeek等其他中國AI企業的崛起,共同展現了中國AI技術的蓬勃發展。這些企業在不同的方向上取得突破,共同推動著AGI(通用人工智能)的發展,也讓世界看到了中國在人工智能領域的強大實力。 這也印證了麻省理工科技評論的觀點,即除了DeepSeek外,中國還有多家AI初創企業值得關注。
總而言之,階躍星辰的開源大模型的發布,不僅為開發者提供了強大的工具,也為中國AI在全球舞臺上的競爭力注入了新的活力。
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:低負擔解碼AI世界,硬核也可愛!聚集35萬AI發燒友、開發者和從業者,廣泛覆蓋互聯網大廠中高管、AI公司創始人和機構投資人。一線作者來自清北、國內外頂級AI實驗室和大廠,兼備敏銳的行業嗅覺和洞察深度。商務合作:zym5189