原標題:輸入文字即可生成圖片,必應將引入Open AI 圖像生成工具DALL-E3
文章來源:元動乾坤
內容字數:2011字
微軟必應搜索引擎接入 OpenAI DALL·E 模型
微軟近日正式宣布,必應搜索引擎已接入 OpenAI 的 DALL·E 模型,新增 AI 生成圖像的功能。這是繼接入 ChatGPT 后,必應再次升級的重要舉措。Bing Image Creator 現已允許用戶通過 DALL·E 模型生成圖像,特別是在創意模式下,用戶可以通過輸入圖像描述、提供位置或活動等額外信息,并選擇藝術風格來生成相應的圖像。
必應的響應模式
必應的圖像生成功能具有三種響應模式:創意模式、平衡模式和精確模式。在創意模式下,生成的結果更加原創和富有想象力;而在精確模式下,則更加注重準確性和相關性,以提供真實且簡潔的答案。目前,Image Creator 僅在創意模式下可用。
用戶訪問和語言支持
值得注意的是,即使沒有必應預覽版的使用權限,用戶仍可通過訪問 bing.com/create 來單獨使用 Image Creator,當前僅支持英文輸入。微軟表示,未來將支持更多語言的輸入。
AI 支持的視覺故事和知識卡片
此外,微軟在必應中推出了新的 AI 支持的視覺故事和知識卡片 2.0。這些新功能將進一步提升用戶的搜索體驗,為用戶提供更豐富的信息呈現方式。
DALL·E 的發展歷程
OpenAI 于 2021 年發布了 DALL·E 和 CLIP 兩個神經網絡,DALL·E 能夠根據文本生成圖像,而 CLIP 則用于圖像與文本的匹配。2022 年,DALL·E 迎來了升級版本 DALL·E 2,具有更高的圖像生成分辨率和更低的延遲,并新增了對原始圖像的編輯功能。
未來的展望
此次必應接入的 DALL·E 是經過更新迭代的版本,彌補了 ChatGPT 在跨模態生成方面的不足。隨著 GPT-4 的多模態能力開放,用戶將期待更多新體驗。同時,OpenAI 已確認 DALL-E 3 將于 10 月對其付費用戶開放,而 Bing Chat 的 DALL-E 3 圖像生成器將免費提供給用戶。
聯系作者
文章來源:元動乾坤
作者微信:
作者簡介:訂閱前沿信息技術,了解活動動態,分享技術信息