AIGC動態歡迎閱讀
原標題:350億參數、開放權重,Transformer作者創業后推出新大模型
關鍵字:模型,報告,上下文,語言,工具
文章來源:機器之心
內容字數:4628字
內容摘要:
機器之心報道
編輯:杜偉開源大語言模型宇宙又來了一個強勁對手。Transformer 作者參與創立的 Cohere 公司推出的大模型Command-R 在可擴展、RAG和工具使用三個方面具有顯著的優勢。今天,由 Transformer 作者之一 Aidan Gomez 參與創立的人工智能初創公司 Cohere 迎來了自家大模型的發布。
Cohere 推出的模型名為「Command-R」,參數量為 35B,它是一個針對大規模生產工作負載的全新大語言模型研究版本。該模型屬于「可擴展」模型類別,能夠平衡高效率和高精度, 使企業用戶超越概念驗證,進入生產階段。作為一種生成模型,Command-R 針對檢索增強生成(RAG)等長上下文任務以及使用外部 API 和工具進行了優化。該模型旨在與自家行業領先的嵌入(Embed)和重新排序(Rerank)模型配合使用,為 RAG 應用程序提供一流的集成,并在企業用例中具有出色表現。
就其架構而言,Command-R 是一種使用優化后 transformer 架構的自回歸語言模型。在預訓練后,模型使用監督微調(SFT)和偏好訓練使自身與人類偏好保持一致,并
原文鏈接:350億參數、開放權重,Transformer作者創業后推出新大模型
聯系作者
文章來源:機器之心
作者微信:almosthuman2014
作者簡介:專業的人工智能媒體和產業服務平臺
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...