發(fā)現(xiàn)一個好玩的AI播客生成工具,嗯嗯啊啊實在太像人了…
經(jīng)常讀咱們文章的小伙伴們,你們是否覺得文字的方式有些枯燥了呢?沒關(guān)系,這里我制作了本文的一期播客,歡迎收聽!還有愛好寫作或者喜歡聽播客的朋友們,你們是否想過做一檔屬于自己的播客,但又無從下手呢?沒關(guān)系,今天分享的這個工具先給你打個樣 ~最近,語音人工智能初創(chuàng)公司 ElevenLabs,在他們的 ElevenReader 應(yīng)用中推出了一個叫做 GenFM 的功能,這個功能能通過我們上傳的內(nèi)容,快速制作一期由兩名 AI 對話交流的播客。通過給對話加停頓、「嗯」聲和呼吸等人類元素,整場對話非常自然。再結(jié)合該公司積累的豐富多樣的 AI 音色,GenFM 功能可以和之前 Google 出品的 NotebookLM 一爭高下了。適用場景因為平臺支持各種類型的內(nèi)容來創(chuàng)建播客,如文章鏈接、文本、PDF 文檔、電子書,甚至還支持上傳 YouTube 視頻、一鍵掃描文檔,并且生成時間快,所以它的適用場景非常廣,只要你想到什么有價值的東西,你都可以用它轉(zhuǎn)換成播客形式,聽兩位 AI 嘮嘮你的好東西。比如:讓文字更方便、有趣:不方便看文字的時候,比如上班開車路上、等,聽 AI 朗讀又很容易走神,就可以試試把喜歡的文字轉(zhuǎn)換成播客,先聽聽 AI 的思考。讓知識更簡單、輕松:碰見難啃的知識點,自己一個人學(xué)很枯燥,缺少伴兒,又或者想分享一些專業(yè)知識,用文字的方式擔(dān)心別人理解困難,也可以試試將它們轉(zhuǎn)化為播客,先磨磨耳朵。讓播客制作更易上手:自己寫好了文字,讓兩位 AI 打個樣,聊聊文字里的內(nèi)容,這樣自己對播客的形式會有更多想象的空間,另外也可以讓 AI 給自己的內(nèi)容把把關(guān),就把它倆當(dāng)成內(nèi)容點評官看待。這里我試了下用我很喜歡的播客節(jié)目制作一期播客,有點套娃的意思了,下面有請兩位 AI 主播,聊聊「知行小酒館」最近一期關(guān)于教育的播客《高考前只管努力,工作后只想發(fā)瘋,我們的教育究竟怎么了?》:聽聽里面的語氣詞,雖然他倆的中文不是特別好,但還真挺像外國人說中國話的。兩位 AI 主播聊得也很深入,確實是理解了原播客的觀點。有幾個亮點值得一提:生成的播客結(jié)構(gòu)非常清晰背景引入:首先引入這個教育機(jī)構(gòu)的成功案例,拋出話題。介紹主體:然后介紹他們的教育理念,幫孩子找我自我,成為一個、完整的人;描述他們的教學(xué)內(nèi)容,比如一些特別的課程,“生死課”、“做事課”等等。分析意義:再去理解他們教育行為背后的目的,他們相信當(dāng)一個人找到自己的興趣和方向時,學(xué)習(xí)效率會大大提高。從另一個角度思考:緊接著又表達(dá)出對這種創(chuàng)新的擔(dān)憂,畢竟新事物往往具有兩面性,他們的探索不一定適合每一個孩子,但他們提供了一種新的思路。從中得到的啟發(fā):分享了一些適合普通家庭的教育建議。展望未來:對未來的教育充滿期待,個性化和多元化將是趨勢。含有豐富的哇、嗯等語氣詞更令我驚訝的是,他們在對話里,還很適當(dāng)?shù)丶恿烁鞣N語氣詞,這讓聽眾可以感受到他們的情緒,一會兒激動,一會兒有所顧慮,沒錯,我感受到 AI 人的情緒了!另外,他們還會在思考的時候停頓,也給了聽眾們一點遐想的空間,代入感滿滿。提供了完整的逐字稿雖然講稿還是文字的形式,但兩人一問一答的對話方式讓文字變得生動起來,讀者也更容易進(jìn)入這個話題,去思考他們的問題。聽了這個還不過癮,要不我再試試用夕小瑤的技術(shù)文章生成播客?如果質(zhì)量不錯,那以后不就可以用它來生成播客,輔助學(xué)習(xí)知識了嘛 ~就用這篇干貨滿滿的綜述類文章吧:從 CoT 到 Agent,最全綜述來了!上交出品怎么樣?(忽略稍微有些出戲的口音和 15 秒位置的奇怪氣泡音)雖然時長不長,但也算是通俗易懂地以一問一答的方式,把 CoT 和 Agent 的概念、原理、應(yīng)用場景、挑戰(zhàn)以及未來趨勢等等說得非常清楚了。聽了他們的對話,是不是對這些高大上的技術(shù)更加感興趣了呢 ~既然 GemFM 可以讓知識變得更簡單、有趣,還支持 PDF 文件,此時我又有一個大膽的想法,讓我們再來試試這本當(dāng)年入門 AI 時啃了很久的西瓜書吧 ~不是,這個播客更像是兩位 AI 主播在幫周老師直播帶貨,就怕他們最后來一句“123,上鏈接”了,不過他們的帶貨是很很公正的,因為他們不僅聊了本書的結(jié)構(gòu)、內(nèi)容,還提到了這本書的不足,就是機(jī)器學(xué)習(xí)發(fā)展得太快,有些最新的技術(shù)沒有覆蓋到。不過沒關(guān)系,關(guān)注夕小瑤就夠了。等等,你以為 GenFM 就這些本事了?No,遠(yuǎn)遠(yuǎn)不止,因為它還可以通過視頻生成播客。緊跟時事(本來想發(fā)給它麥琳的十大名場面,可惜基于視頻的生成目前還只支持英文字幕),我給在 YouTube 上找了 OpenAI 第 3 天的直播錄像發(fā)給了它,讓 AI 主播們來聊聊最新發(fā)布的 Sora(聽說實測一言難盡,感興趣的可跳轉(zhuǎn):別吹 Sora 了,實測一言難盡。甚至分不清人臉和豬??)。有一說一,GenFM 的英語口語還是地道的哩。不過沒想到吧!GenFM 不僅能將文字升維成更輕松的音頻,還可以把視頻降維成更簡單的音頻,以后看視頻吃個瓜,還能有兩個伴和你一起嘮嗑,別提有多熱鬧了 ~GenFM 的應(yīng)用場景還有很多,我估摸著聰明的小伙伴們心里早已有了想法,歡迎留言分享你們的播客作品!后記AI 火了后,文字總結(jié)成為最先被廣泛應(yīng)用的場景之一。它通過提煉文字內(nèi)容的核心信息,幫助用戶快速理解復(fù)雜內(nèi)容,解決了信息量過載和時間碎片化的問題。然而,這種方式雖然高效,卻在形式上局限于“吸收信息”的單向互動,缺乏趣味性和代入感。而我們今天分享的 GenFM 功能,就打開了另外一條思路:通過對話為主的播客形式,將內(nèi)容的價值延伸到更豐富的場景體驗中,讓內(nèi)容更有溫度。不僅如此,在我看來,對話這種形式,更能復(fù)現(xiàn)出內(nèi)容的產(chǎn)生背景。試想我們寫的文章、論文,難道不都是在一次次自己與自己、與同學(xué)、與老師的交流中產(chǎn)生的嗎?如果能用對話的形式,將復(fù)雜的內(nèi)容通過角色間的討論重新呈現(xiàn),聽眾是不是會獲得更深刻的理解呢?從文字到音頻,技術(shù)的發(fā)展總能在意想不到的地方開花,為我們又帶來了新奇的體驗。GenFM 這類創(chuàng)新展示了 AI 在內(nèi)容交互領(lǐng)域的無限潛力,在未來,AI 技術(shù)可能會進(jìn)一步提升對話的智能化程度,比如實時生成個性化的播客內(nèi)容,作為嘉賓直接參與到 AI 的播客互動中,等等。讓我們繼續(xù)保持對 AI 技術(shù)的觀察吧,咱們下期再見 ~

粵公網(wǎng)安備 44011502001135號