AIGC動態歡迎閱讀
原標題:SAM 2.1上新、Lingua代碼庫發布,一Meta開源工具來襲
關鍵字:模型,鏈接,語音,語言,編碼器
文章來源:機器之心
內容字數:0字
內容摘要:
機器之心報道
機器之心編輯部????今天,Meta 分享了一系列研究和模型,這些研究和模型支撐 Meta 實現高級機器智能(AMI)目標,同時也致力于開放科學和可復現性。
這些工作側重于 AMI 的構建模塊,包括感知、語音和語言、推理、具身智能和對齊。研究工作包括 SAM 2.1、Spirit LM、Layer Skip、自學習評估器等。???????SAM 2.1
SAM 2 已經被應用于跨學科(包括醫學圖像、氣象學等)研究,并且產生了良好的影響。現在,Meta 宣布推出性能更強的 SAM 2.1。Meta 引入了額外的數據增強技術來模擬 SAM 2 之前遇到的視覺相似物體和小物體的存在,通過在較長的幀序列上訓練模型并對空間和物體指針內存的位置編碼進行一些調整,提高了 SAM 2 的遮擋處理能力。項目鏈接:https://github.com/facebookresearch/sam2
Spirit LM
大型語言模型經常被用于構建文本到語音 pipeline,其中語音通過自動語音識別 (ASR) 進行轉錄,然后由 LLM 生成文本,最終使用文本到語音 (TTS) 轉換為語音。然而,
原文鏈接:SAM 2.1上新、Lingua代碼庫發布,一Meta開源工具來襲
聯系作者
文章來源:機器之心
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...