AIGC動態歡迎閱讀
原標題:OpenAI 開發者大會!實時語音功能有API了,GPT-4o支持多模態微調,上下文cache功能上線
關鍵字:開發者,模型,功能,視覺,大會
文章來源:夕小瑤科技說
內容字數:0字
內容摘要:
夕小瑤科技說 原創作者 | 付奶茶家人們!十一假期第1天, OpenAI一年一度的開發者大會又來了惹!今年的開發者大會分成三部分分別在美國、英國、新加坡三個地點舉辦,剛剛結束的是第一場。
去年的OpenAI開發者大會公布了GPT-4 Turbo和GPTs,今年沒有大更新,但主打實用。
發布了給開發者的一些福利,包括API的功能更新以及降價。下面一起盤一下吧!
視覺微調(Vision Fine-Tuning)OpenAI今年在GPT-4o上引入了微調的功能,開發者們已經開始利用文本對模型進行微調以適應下游任務。
而此次開發者大會之際,OpenAI宣布將引入GPT-4o的視覺微調功能,允許開發者結合圖像和文本來定制模型的視覺理解能力。
視覺微調的過程與文本微調相似,開發者需要按照指定的格式準備數據集并上傳。開放視覺微調功能使得開發者能夠增強模型在視覺搜索、生成和檢測等核心能力方面的功能。
例如,東南亞的運輸公司Grab通過僅使用100個樣本對GPT-4o進行視覺微調,顯著提高了其特定任務的圖像理解能力。在車道計數的準確性上Grab實現了20%的提升,在限速標志的定位上提高了13%,這些成績
原文鏈接:OpenAI 開發者大會!實時語音功能有API了,GPT-4o支持多模態微調,上下文cache功能上線
聯系作者
文章來源:夕小瑤科技說
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...