原標題:谷歌推出Gemini Live AI助手,對標GPT-4o
文章來源:小夏聊AIGC
內容字數:1905字
谷歌推出Gemini Live:智能語音助手的新紀元
在8月14日的“Made by Google 2024”大會上,谷歌正式推出了其最新的智能語音AI助手——Gemini Live。這一重磅消息引起了廣泛關注,因為Gemini Live的功能與OpenAI的GPT-4o語音模式不相上下,都是多模態智能助手,能夠流暢理解自然語言,同時具備識別圖像、視頻和語音的能力。
智能助手的新體驗
想象一下,你拿起手機拍攝了一幅《清明上河圖》,然后詢問Gemini Live關于這幅畫的歷史。它不僅能給你詳細的解說,還能像朋友一樣與您互動,你隨時可以打斷它進行提問。此外,用戶還可以授權Gemini Live訪問郵箱、地圖及通訊錄,從而幫助安排約會、尋找餐館等,宛如鋼鐵俠中的AI助理賈維斯。
谷歌的市場先機
盡管OpenAI的GPT-4o語音模式早在5月就已推出,但仍處于小范圍測試階段。而谷歌則迅速行動,推出Gemini Live,搶占了安卓手機市場。用戶們普遍認為,谷歌在這場競爭中走在了OpenAI的前面。
現場演示的真實感
在Gemini Live的演示現場,主持人曾詢問助手他是否有空見朋友,但Gemini Live起初沒有反應。經過三次提問后,它終于回答道:“我發現她將在2024年11月9日來舊金山,我查看了你的日歷,那段時間你沒有任何活動。”這一幕讓現場觀眾驚呆了,盡管有些小尷尬,但也展現了Gemini Live的真實能力。
簡單易用的操作方式
使用Gemini Live非常簡單,只需長按電源按鈕或喚醒“Hey Google”即可開始。除了理解語音、圖片和視頻,Gemini Live還能生成圖片,直接應用于谷歌的生態系統中。谷歌表示,Gemini Live已與郵件、云盤、相冊、天氣等原生應用集成,未來還將擴展到更多知名應用,以幫助用戶自動完成日常任務。
個性化的交流體驗
Gemini Live不僅能理解你說的話,還能根據需求生成圖片。例如,你可以對它說“幫我設計一張生日慶祝的圖片”,它會迅速生成符合你要求的作品,并允許你直接在谷歌應用中使用。如果你是安卓用戶并訂閱了Gemini Advanced英文版,就可以體驗到這項新功能。它支持10種不同的語音選項和45種語言,滿足不同用戶的交流需求。
展望未來
谷歌的Gemini Live展示了其在智能語音助手領域的持續創新與進步,可能會對市場產生深遠的影響,尤其是在與OpenAI的競爭中。未來幾周,谷歌計劃將Gemini Live擴展到iOS系統,并增加更多語言功能,讓更多用戶能夠享受到這一新技術。我們期待看到Gemini Live為我們帶來更多驚喜!
聯系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內容的前沿信息與技術分享。我們提供AI生成藝術、文本、音樂、視頻等領域的最新動態與應用案例。每日新聞速遞、技術解讀、行業分析、專家觀點和創意展示。期待與您一起探索AI的無限潛力。歡迎關注并分享您的AI作品或寶貴意見。