
原標(biāo)題:谷歌推出Gemini Live AI助手,對標(biāo)GPT-4o
文章來源:小夏聊AIGC
內(nèi)容字?jǐn)?shù):1905字
谷歌推出Gemini Live:智能語音助手的新紀(jì)元
在8月14日的“Made by Google 2024”大會上,谷歌正式推出了其最新的智能語音AI助手——Gemini Live。這一重磅消息引起了廣泛關(guān)注,因?yàn)镚emini Live的功能與OpenAI的GPT-4o語音模式不相上下,都是多模態(tài)智能助手,能夠流暢理解自然語言,同時具備識別圖像、視頻和語音的能力。
智能助手的新體驗(yàn)
想象一下,你拿起手機(jī)拍攝了一幅《清明上河圖》,然后詢問Gemini Live關(guān)于這幅畫的歷史。它不僅能給你詳細(xì)的解說,還能像朋友一樣與您互動,你隨時可以打斷它進(jìn)行提問。此外,用戶還可以授權(quán)Gemini Live訪問郵箱、地圖及通訊錄,從而幫助安排約會、尋找餐館等,宛如鋼鐵俠中的AI助理賈維斯。
谷歌的市場先機(jī)
盡管OpenAI的GPT-4o語音模式早在5月就已推出,但仍處于小范圍測試階段。而谷歌則迅速行動,推出Gemini Live,搶占了安卓手機(jī)市場。用戶們普遍認(rèn)為,谷歌在這場競爭中走在了OpenAI的前面。
現(xiàn)場演示的真實(shí)感
在Gemini Live的演示現(xiàn)場,主持人曾詢問助手他是否有空見朋友,但Gemini Live起初沒有反應(yīng)。經(jīng)過三次提問后,它終于回答道:“我發(fā)現(xiàn)她將在2024年11月9日來舊金山,我查看了你的日歷,那段時間你沒有任何活動。”這一幕讓現(xiàn)場觀眾驚呆了,盡管有些小尷尬,但也展現(xiàn)了Gemini Live的真實(shí)能力。
簡單易用的操作方式
使用Gemini Live非常簡單,只需長按電源按鈕或喚醒“Hey Google”即可開始。除了理解語音、圖片和視頻,Gemini Live還能生成圖片,直接應(yīng)用于谷歌的生態(tài)系統(tǒng)中。谷歌表示,Gemini Live已與郵件、云盤、相冊、天氣等原生應(yīng)用集成,未來還將擴(kuò)展到更多知名應(yīng)用,以幫助用戶自動完成日常任務(wù)。
個性化的交流體驗(yàn)
Gemini Live不僅能理解你說的話,還能根據(jù)需求生成圖片。例如,你可以對它說“幫我設(shè)計一張生日慶祝的圖片”,它會迅速生成符合你要求的作品,并允許你直接在谷歌應(yīng)用中使用。如果你是安卓用戶并訂閱了Gemini Advanced英文版,就可以體驗(yàn)到這項(xiàng)新功能。它支持10種不同的語音選項(xiàng)和45種語言,滿足不同用戶的交流需求。
展望未來
谷歌的Gemini Live展示了其在智能語音助手領(lǐng)域的持續(xù)創(chuàng)新與進(jìn)步,可能會對市場產(chǎn)生深遠(yuǎn)的影響,尤其是在與OpenAI的競爭中。未來幾周,谷歌計劃將Gemini Live擴(kuò)展到iOS系統(tǒng),并增加更多語言功能,讓更多用戶能夠享受到這一新技術(shù)。我們期待看到Gemini Live為我們帶來更多驚喜!
聯(lián)系作者
文章來源:小夏聊AIGC
作者微信:
作者簡介:專注于人工智能生成內(nèi)容的前沿信息與技術(shù)分享。我們提供AI生成藝術(shù)、文本、音樂、視頻等領(lǐng)域的最新動態(tài)與應(yīng)用案例。每日新聞速遞、技術(shù)解讀、行業(yè)分析、專家觀點(diǎn)和創(chuàng)意展示。期待與您一起探索AI的無限潛力。歡迎關(guān)注并分享您的AI作品或?qū)氋F意見。

粵公網(wǎng)安備 44011502001135號