OpenAI 開發者大會！實時語音功能有API了，GPT-4o支持多模態微調，上下文cache功能上線

AIGC動態1年前 (2024)發布夕小瑤科技說

AIGC動態歡迎閱讀

原標題：OpenAI 開發者大會！實時語音功能有API了，GPT-4o支持多模態微調，上下文cache功能上線
關鍵字：開發者,模型,功能,視覺,大會
文章來源：夕小瑤科技說
內容字數：0字

內容摘要：

夕小瑤科技說原創作者 | 付奶茶家人們！十一假期第1天， OpenAI一年一度的開發者大會又來了惹！今年的開發者大會分成三部分分別在美國、英國、新加坡三個地點舉辦，剛剛結束的是第一場。
去年的OpenAI開發者大會公布了GPT-4 Turbo和GPTs，今年沒有大更新，但主打實用。
發布了給開發者的一些福利，包括API的功能更新以及降價。下面一起盤一下吧！
視覺微調（Vision Fine-Tuning）OpenAI今年在GPT-4o上引入了微調的功能，開發者們已經開始利用文本對模型進行微調以適應下游任務。
而此次開發者大會之際，OpenAI宣布將引入GPT-4o的視覺微調功能，允許開發者結合圖像和文本來定制模型的視覺理解能力。
視覺微調的過程與文本微調相似，開發者需要按照指定的格式準備數據集并上傳。開放視覺微調功能使得開發者能夠增強模型在視覺搜索、生成和檢測等核心能力方面的功能。
例如，東南亞的運輸公司Grab通過僅使用100個樣本對GPT-4o進行視覺微調，顯著提高了其特定任務的圖像理解能力。在車道計數的準確性上Grab實現了20%的提升，在限速標志的定位上提高了13%，這些成績

原文鏈接：OpenAI 開發者大會！實時語音功能有API了，GPT-4o支持多模態微調，上下文cache功能上線