來源:學術頭條整理:李雯靖“我試圖創造對人類負責和有用的系統,而不是追求理論上的超級智能。”作為 DeepMind 聯合創始人、Inflection AI 聯合創始人兼首席執行官,以及如今的 Microsoft AI 首席執行官,Mustafa Suleyman 對當前的人工智能行業有著獨到的個人見解,且十分謹慎。在他看來,即使是最接近人工智能發展的人,也很難準確描述事物的發展方向。日前,他接受了美國科技媒體 The Verge 主編 Nilay Patel 的采訪。在訪談中,他談到了與 OpenAI 的關系、超級智能何時真正到來,以及人工智能對相關產業及內容管理帶來的影響與挑戰等多個話題。談及 OpenAI,他直截了當地表示“與 OpenAI 的合作……將成為計算機史上最成功的合作之一”,并希望這種合作能長期持續下去,當然,如果“OpenAI 宣布實現 AGI 并退出微軟的交易”,微軟也有后備計劃,“我們擁有一支出色的團隊,我們將確保無論發生什么,我們都能訓練出世界上最好的模型”。他對通用人工智能(AGI)持謹慎樂觀態度,但認為 AGI 在現有的一兩代硬件基礎上不太可能實現,稱“在未來兩到五代產品中的某個時間點或許可行”,給出了一個相對保守的數字——5-7 年。此外,他還談到,AGI 與奇點概念不同,應被看作為一種通用學習系統。部分觀點如下:人工智能所面臨的挑戰是,它變得如此戲劇化,以至于我們最終沒有把注意力集中在系統所能做的具體能力上。Scaling laws 依然有效,后續模型將繼續取得與前代相同的震撼性成果,但成本更高,也更脆弱,需要更長的時間訓練。因此,我們不會在 12 到 18 個月內看到它們,這一時間可能為 18 到 24 個月,或者更長。當模型的單次訓練運行達到 10 到 27 FLOPS 時,世界上只有三、四個實驗室擁有足夠的資源來進行這種規模的訓練。或許,正如任何人都可以在合理使用的前提下閱讀新聞和網絡內容以增長知識一樣,人工智能也可以,因為人工智能基本上是一種幫助人類從公開資料中學習的工具。幻覺不一定是有毒的、有偏見的、令人反感的,它并不完美,但已經越來越好了,而且隨著風格控制的加強,它只會越來越好。每一個瀏覽器、搜索引擎和應用程序都會被某種對話式界面、某種生成式界面所代表。劣質內容是可以被檢測出來的,或者說故意歪曲事實或誤導的人工智能內容是可以被檢測出來的,因為總會有更好的模型。學術頭條在不改變原文大意的情況下,對部分訪談內容做了精編。內容如下:Nilay Patel:歡迎 Microsoft AI 的首席執行官。Mustafa Suleyman:很高興和你一起(交談)。NP:我也是。我有很多問題想問你,關于 Microsoft AI 部門在微軟內部的結構,擔任 Microsoft AI 首席執行官意味著什么(在一家最近似乎只關注人工智能的公司里),你是如何做出決策的。我將從頭開始。我希望你已經準備好了,因為我意識到,如果你的回答方式不同,那么整個采訪就會朝著不同的方向發展。最近,Sam Altman 在 Reddit AMA 上說,他認為我們可以在目前的硬件上實現通用人工智能(AGI)。你認為這可能嗎?MS:目前的硬件指的是什么?NP:我想應該是一兩代以內的硬件。MS:我不認為英偉達的 GB200 可以做到這一點。但我認為,在未來兩到五代產品中的某個時間點,這將是可行的。我不想說我認為兩年后的可能性很大,但我認為在未來五到七年內是可行的,因為現在每一代需要 18 到 24 個月的時間。因此,五代的時間可能長達 10 年,這取決于事態的發展。對于這些芯片,我們確實面臨著越來越嚴峻的挑戰。我不認為它的發展或每美元成本會像我們過去看到的那樣線性。但發展速度非常快。所以,我同意你的看法。NP:所以,你認為是兩年到十年之間嗎?MS:這個問題的不確定性非常高,任何明確的聲明對我來說都是毫無根據的,都是夸夸其談。NP:你和我在過去曾多次談到很多事情,我想跟進所有這些想法。我只是想到,如果我們認為 AGI 還需要兩年到十年的時間,也就是在我們的有生之年,也許我們就不應該再研究其他東西了。這似乎將是一個范式的轉變,對嗎?我們正在經歷奇點,已經有了人工智能。在它的另一端,一切都將不同。你如何做到這一點,然后再考慮”我需要在 iPhone 上啟動 Copilot 應用程序“?MS:這取決于你對 AGI 的定義,對吧?AGI 不是奇點。奇點是一個指數遞歸的自我完善系統,它能非常迅速地加速,遠遠超越任何可能看起來像人類智能的東西。在我看來,AGI 是一種通用學習系統,能夠在所有人類水平的訓練環境中表現出色,包括知識工作,以及體力勞動。我之所以持懷疑態度,很大程度上與機器人技術的進步和完成工作的復雜性有關。但是,我完全可以想象,我們有一個系統,它可以在沒有大量手工制作的事先提示的情況下學習,在非常廣泛的環境中表現出色。我認為,這并不一定會成為 AGI,也不會導致奇點,但這意味著,在未來五到十年內,人類的大部分知識工作可能會由我們開發的人工智能系統之一來完成。我之所以對奇點或人工超級智能的說法避而不談,是因為我認為它們是截然不同的東西。人工智能所面臨的挑戰是,它變得如此戲劇化,以至于我們最終沒有把注意力集中在系統所能做的具體能力上。而這正是我在構建人工智能伴侶時所關心的,讓它們對作為人類的你有用,為作為人類的你工作,站在你這一邊,站在你的立場,站在你的團隊中。這就是我的動機,也是我能夠控制和影響的,我試圖創造對人類負責和有用的系統,而不是追求理論上的超級智能。NP:我對此特別好奇的原因之一是,所有人類的知識工作都可以在能力很強的通用人工智能的協助下完成,或者由人工智能自己完成。這意味著我們將建立一種新的人工智能系統,對嗎?一個能像人類知識工作者一樣具有創造力的系統,它的創造力能達到第 99 百分位數(99th percentile)。而在我們現在的系統中,我看不到這一點。LLM 的工作方式是,它們不一定會提出一大堆單獨的創造性想法。你可以促使它們做出令人驚訝的事情,但這種轉變(變成更多的東西)——我還沒有經歷過。你認為目前構建、訓練和部署 LLM 的方式是通往你所描述的那種 AGI 的直線路徑,還是我們需要構建另一種東西?MS:有趣的是,兩三年前,人們經常會說:“這些系統注定會重復它們所接受的訓練數據”。查詢訓練數據和輸出結果之間存在某種一對一的映射關系。如今很明顯,它們實際上并沒有這么做。對訓練數據的多個 N 維元素之間的空間進行插值,這本身就是一個創造性的過程,對嗎?它在這個極其復雜的空間中選取某一點,以產生或生成它從未見過的新穎形式的問題答案。我們從未見過以這種特定方式產生的特定答案。對我來說,這就是創造力的開端。它是真正新穎發明的曙光,而這顯然正是我們要創造的。在整個歷史長河中,智能正是推動我們在世界上取得進步的動力。它是一種能力,能夠綜合大量信息,將其聚合成概念表征,幫助我們在復雜的空間中更有效地推理,預測世界可能會如何發展,然后根據這些預測采取行動。無論你是在做一張桌子,還是在和朋友打棒球,你所經歷的每一個環境都具有這些特征。因此,如果我們能將這些時刻提煉成算法結構,當然會有巨大的價值。我認為,我們在過去三四年中看到的這個小時刻,是 LLM 真正能夠發揮創造力、做出真正的判斷、產生新穎想法的曙光。你關于它們能否主動做到這一點的觀點很好。比如 LLM 能在沒有提示的情況下做到這一點嗎?它們能完成嗎?它們能否在非常微妙、細致或輕量級的指導下做到這一點?我認為這是個懸而未決的問題。我本人對此感到非常樂觀。現在,確保 LLM 能夠做到這一點的大部分基礎架構都是工程問題。有狀態的內存和對模型當前上下文的元推理,是我們現在知道如何在軟件中做到的事情。我們知道如何引入第二個或第三個系統來觀察 LLM 在其活動中的工作狀態,并以此來引導或重新引導它正在運行的提示。如果你能做到異步元推理,也就是最初的“思維鏈”方法在過去 6-12 個月里所顯示的,那么你就可以想象它如何在這些連續的環境中將行動串聯起來。然后,它可以與它的工作記憶的其他部分、它的系統的其他部分——其中有些是為了做更短期的事情,有些是從長期記憶中汲取養分,有些是為了更有創造力,有些是為了更遵守你所設計的行為政策或安全政策——進行協調和配合。因此,這顯然還沒有完成,但有非常非常明顯的跡象表明,我認為我們正走在正確的道路上。NP:這些協調系統讓我著迷,因為模型本身并不是確定的。它們永遠不會產生兩次相同的輸出。我們希望計算機能做的很多事情都是非常確定的。我們肯定希望它們重復做同樣的事情。在各種情況下,人工智能都可能非常有用,比如你想做稅務準備工作,你希望人工智能非常有用,能夠理解所有的輸入。同時,你也希望它在任何時候都能百分之百地遵守規則。在這里,連接我們的邏輯計算機系統來控制非確定性人工智能系統似乎是一個重要的途徑,比讓人工智能變得更有能力更重要。這似乎是我最近才看到的一種新的討論方式。你覺得這是你需要打造的產品類型,還是你仍然專注于模型本身的能力?MS:這是一個很好的框架,但我們還是要弄清楚你所說的決定論是什么意思。因此,決定論是在抽象層中運作的。在最底層,每個 token 都是以非確定方式生成的。隨著這些輸出在行為政策、啟發式或已知目標(如填寫稅表)方面的可識別性越來越高,這些知識就可以存儲在更加穩定和確定的表征中。而這正是當今人類的工作方式。無論你把某件事記憶得多好,如果我讓你重復做 100 次,你的輸出結果很可能會有一些變化。我們并不是真的以確定性的方式存儲東西。我們有共同出現的概念表征,這些表征相當流動和抽象。然后,我們將它們復制并融入文字和語言的圖式中,以便我們能夠相互交流。這些模型實際上與這種架構非常相似。它們可以存儲穩定的信息,并能以相當確定的方式進行檢索,而且就像你說的那樣,能與現有的計算機系統和知識庫集成。但也不能說一種方壓倒另一種方法。模型的功能會越來越強大,檢索、信息訪問、使用現有數據庫或調用第三方 API 來整合信息的方法也會同時進步。順便說一句,我們還將開辟第三條“戰線”,那就是這些 LLM 現在可以說自然語言了。它們將能夠實時查詢其他人類和其他人工智能。因此,這就像是“檢索”或驗證信息、獲取新知識或檢查狀態的第三種范式。除了直接的模型功能和與現有系統的集成之外,這本身就會帶來巨大的收益。NP:我想詳細談談其中的智能體部分,因為這似乎是許多公司關注的焦點,在某種程度上也包括微軟。它對我們的計算機系統和網絡應該如何工作提出了無數的問題。我們認為,從現在開始的兩年到十年之間,我們將邁向 AGI,我們認為我們可以通過提高模型能力來實現這一目標,同時也可以通過一些新穎的方法來使用這些模型。我想談談你們微軟是如何做到這一點的。我從一開始就想到,如果我們不能就目標達成一致,那么結構對話就會脫離現實。所以,這些就是目標。這些都是巨大的目標。這些都是巨大的目標。在微軟人工智能公司,你們是如何組織架構來實現這些目標的?MS:這是一個很好的問題。首先,我的組織專注于消費者人工智能部分。因此,它與必應、Edge、MSN 和 Copilot 有關——這些面向消費者的產品擁有數以億計的日活躍用戶、大量的用戶數據和大量直接的商業表面,我們可以在這些表面上部署生產、獲得反饋并推動大規模實驗。對我來說,這是至關重要的任務,因為五年前,我們在 LLM 和人工智能方面還處于依賴基準來推動進步的狀態。評估基本上是在學術環境中進行的,盡管是在商業工程實驗室。模型還不夠好,無法真正投入生產并收集來自真實世界的反饋。現在情況完全不同了,所有的創新都是在生產中通過優化和爬坡實現的。所以,我認為這是第一點。第二點要說的是,我們的 Azure 業務和每天使用 M365 Copilot 的大量客戶提供了另一個巨大的實驗框架,這與消費者實驗框架截然不同。實際上,這對我來說是一個很好的機會,因為我從許多企業如何將真正的 AI 智能體集成到他們現在的工作流程中學到了很多東西。由于他們對內部數據有更高的可見性和控制力,而且在許多情況下,他們擁有數萬甚至數十萬名員工,因此他們能夠在工作流程中引入新穎的 Copilot,無論是用于培訓銷售代理、提高表現不佳的銷售代理的技能,還是提供營銷反饋。我見過人力資源 Copilot,也見過各種各樣的客戶服務 Copilot。這讓我看到了在企業第三方生產環境中測試和挑戰這些人工智能模型極限的各種不同風貌。第三個領域,當然是我們與合作伙伴 OpenAI 的合作。我認為這將成為計算機史上最成功的合作之一。這種合作關系已經持續了五年,還將持續很多年。我們從他們那里獲得模型,我們獲得知識產權(IP),他們獲得計算和資金。對我們來說,這顯然是一個巨大的支持來源。第四個領域是,自從我八、九個月前到來后,我們發展了自己的核心力量,在 Microsoft AI 內部大規模開發這些模型。我們擁有一些最優秀的人工智能研究人員和科學家,他們正在為我們的 weight class(權重級別)推進后訓練和前訓練的前沿技術。我們選擇的每秒浮點運算(FLOPS)匹配目標真正適合我們所關注的使用案例,并確保我們擁有能夠做到這一點的絕對世界級的前沿模型。NP:讓我來解釋一下這里的一些詞匯。你說的“weight class”,是指巨型企業,還是指更具體的指代?MS:“weight class”是我們將前沿模型相互比較的方法。你的 FLOPS 需要與你評估自己的競爭對手模型相匹配。因此,大小真的很重要。在這些模型中,它是迄今為止最重要的性能預測指標。你不能把自己與 FLOPS 大 10 倍的東西進行比較。你必須將它們視為 weight class 或 FLOPS class(如果你愿意)。NP:我覺得有道理。你剛剛說你想專注于你正在使用的應用程序,對嗎?所以,你們正在制造許多面向特定微軟產品的模型?MS:沒錯。所以,如果你仔細想想,Copilot 下面是一個不同模型類型、不同模型大小的整體集合,可以適應不同的環境。如果你在語音環境中,它就是一個不同類型的模型。如果是在桌面上,如果是在 Mac 或 Windows 的原生應用程序中,它們的模型都略有不同。此外,在搜索、推理和安全方面也有不同的模型,我認為隨著時間的推移,這些模型將變得更加多樣化。NP:然后,我只想弄清楚這一點。聽起來你們正在開發一個前沿模型,可以與 Gemini、GPT-4 或未來的 GPT-5 競爭。你們也在研究這個嗎?MS:就目前的 weight class 而言,是的,在 GPT-4、GPT-4o 級別。但這取決于未來幾年的發展情況,因為每個數量級的增長都是物理基礎設施的巨大進步。你說的是幾百兆瓦,很快就是幾千兆瓦的容量。當我們的單次訓練運行達到 10 到 27 FLOPS 時,世界上只有三四個實驗室擁有足夠的資源來進行這種規模的訓練。我們和 OpenAI 之間不會重復這種情況。OpenAI 是我們在這些方面的預訓練前沿模型合作伙伴,我們希望這種合作能長期持續下去。NP:所以,你們不會在下一代模型進入競爭,對嗎?你們依然打算讓 OpenAI 來做這件事。我之所以這么問,是因為微軟運營著數據中心,對嗎?這種合作關系一直在持續,但亞馬遜和谷歌都運營著自己的數據中心,無論合作關系有多好,似乎都存在著核心矛盾。在“我們將建造這些數據中心,并在美國重啟核電站,為其中一些數據中心供電”和“也許將這些數據中心賣給別人比自己建造模型更好”之間,存在著這樣的矛盾。你感受到這種緊張關系了嗎?MS:每種伙伴關系都有緊張的時候。這是健康和自然的。我的意思是,他們的業務與我們完全不同。他們運營,合作關系隨著時間的推移而發展。早在 2019 年,Satya Nadella 就向 OpenAI 投入了 10 億美元,這看起來非常瘋狂。我不認為這很瘋狂,但我認為很多人都認為這很瘋狂。現在,這已經有了回報,兩家公司都從合作中獲得了巨大的收益。因此,合作關系會不斷發展,必須適應當時的情況,我們將拭目以待未來幾年的變化。NP:如果 OpenAI 宣布實現 AGI 并退出微軟的交易,你們有后備計劃嗎?有一些可信的報道稱,如果他們宣布 AGI,他們可能會退出交易。MS:不,AGI 的定義并不明確。在 Microsoft AI 內部,我們擁有世界上最強大的人工智能研究團隊之一。我們的聯合創始人 Karén Simonyan 曾在 DeepMind 領導深度學習擴展團隊長達 8 年之久,是許多重大突破的背后功臣。Nando de Freitas 剛剛加入,他之前在 DeepMind 負責音頻/視頻生成工作長達 10 年之久。因此,我們擁有一支出色的團隊,我們將確保無論發生什么,我們都能訓練出世界上最好的模型。NP:讓我來問問你,因為模型開發……我們需要得到更多我們現在擁有的模型。這里面有點矛盾。有一種觀點認為,scaling laws 即將失效,下一類模型不會明顯優于我們現在擁有的模型,我認為你可以從我們談論產品的方式中追蹤到這一點。幾年前,我們還在說“人工智能會帶來生存風險”,“我們必須阻止它”,“這樣我們就能確保它在所有人之前就被對齊”。而現在,我們的想法是,“好吧,我們得從現在的模型中獲得更多。希望能生產出一些產品,賺點錢,然后搞清楚這些產品有什么用,如何更好地利用它們,因為下一代的模型似乎并沒有我們想象的那么好。你是否認為,前沿模型的發展速度不如我們想象的那么快,因此我們必須從現有的模型中獲得更多的利益?MS:不,我不這么認為。我認為,它們將繼續取得與前幾代相同的震撼性成果。請記住,它們的成本更高,也更脆弱,這次需要更長的時間來訓練。因此,我們不會看到它們在 12 到 18 個月的時間內出現。它將轉變為 18 到 24 個月,然后更長一些。但我看不到任何結構性放緩的跡象。我看到的恰恰相反。我們今天可以從中獲得巨大的收益,但我很清楚,在接下來的兩個數量級的訓練中,我們也可以從中獲得巨大的收益。NP:我想確保我們能談談你提到的事情,即信息的商品化,然后我一定要確保我們能快速地談談智能體,以便將這一切帶到未來的產品中去。我認為,信息商品化是我們今天的互聯網——平臺互聯網——的一個重要故事。你訪問谷歌,問它一個問題,現在它可能會吐出一個人工智能生成的答案。你訪問 MSN,向它詢問新聞,它可能會通過算法或人工智能對一堆新聞進行分類,并為你總結這些新聞。每個人都在朝這個方向前進。我們已經討論這個問題很久了。為了訓練下一代模型,我們需要更多的信息。我想說,你說互聯網上的信息是“免費軟件”,并期望可以用它來訓練,這給你自己帶來了一些麻煩。現在有很多訴訟,包括幾起針對微軟的訴訟。在我們理清使用這些東西進行訓練所涉及的版權問題之前,你認為下一批信息從何而來?MS:有一種思考方式是,計算量越大,這些模型就能花費越多時間來處理所有訓練數據中的各種關系成分。把 FLOPS 看作是一種理解時間的方式,即學習所有這些不同訓練輸入之間的關系。因此,首先,你仍然可以通過更多的計算來學習所有現有數據,從而獲得更多的收益。其次,我們可以從交互數據中學到大量知識。用戶以隱性或顯性的方式告訴我們對輸出結果的感受。質量高嗎?是否被使用?是否被忽視?第三,我們正在生成大量的合成數據。合成數據的質量越來越高。當你要求人工智能教師或評分員比較兩到三個不同的合成輸出和人類書面輸出時,要發現這些精確的細微差別是非常困難的。因此,合成數據的質量越來越高,并可用于各種不同的場合。第四,我可以想象人工智能與其他人工智能對話,尋求反饋——這些人工智能已經針對不同的專業領域或不同的風格進行了預設,并以不同的方式進行提示。你可以想象,這些互動會產生有價值的新知識,因為它們的基礎來源不同,或者僅僅因為它們的風格輸出,它們就會產生新穎的互動。因此,我并不認為數據很快就會成為限制。我認為,在可預見的未來,規模化仍將帶來巨大收益。NP:所以,這都是新數據,對嗎?你會得到一堆交互數據。也許合成數據的質量足以訓練下一代模型,但最初的數據集是網絡。這是一堆網絡內容。這是整個互聯網的內容,也許在某種程度上是一些模型提供商的視頻平臺的內容。你在 6 月份對 Andrew Ross Sorkin 說過一句話。這里有一段話,你說:“我認為,對于已經在開放網絡上的內容,自上世紀 90 年代以來,這些內容的社會契約就是合理使用,任何人都可以復制、再創造、再制作。這就是‘免費軟件’,如果你愿意,這就是人們的理解。”我很好奇……你是這么說的。這是對搜索的理解,圍繞搜索、谷歌圖片搜索和谷歌圖書引發了大量訴訟。你認為在人工智能時代,在所有訴訟都懸而未決的情況下,這對你來說還足夠穩定嗎?MS:我在那個環境中描述的是到那時為止世界對事物的看法。我的看法是,正如任何人都可以在合理使用的前提下閱讀新聞和網絡內容以增長知識一樣,人工智能也可以,因為人工智能基本上是一種幫助人類從公開資料中學習的工具。我們用于生成或訓練模型的所有資料都是從公開資料中截取的。NP:我不知道科技行業是否已經處于這種境地。我不知道這些產品是否像谷歌有史以來第一次在互聯網上推出的產品那樣明顯有用,我也不知道這些產品是否像谷歌在上世紀 90 年代和本世紀初那樣受到了創作者的青睞。在我看來,這就像是你在《經濟學人》的董事會里一樣。對我來說,這就好像是工作的人們最復雜的心情。因為是的,我認為我們中的很多人都能看到產品的價值,但我們也看到價值轉移到了大型科技公司,而不是后起之秀,不是辦公室里拿著幻燈片的可愛孩子們。MS:我認為這將比搜索更有用、更有價值。我認為搜索已經完全崩潰了,我認為這完全是一種痛苦,我們已經習慣了這種糟糕的使用體驗。輸入查詢… 想想什么是查詢。由于搜索引擎的弱點,我們不得不發明“查詢”這個詞來描述你在搜索引擎中表達句子或問題的這種非常奇怪的、受限制的方式。然后,你會得到 10 個藍色鏈接,這些鏈接與你要找的東西隱約相關。你點擊其中一個,然后你就必須去完善你的查詢。我的意思是,這是一種痛苦而緩慢的體驗。我認為,如果我們能把這個問題解決好,如果我們能真正把幻覺減少到最低限度……我認為我們已經證明,幻覺不一定是有毒的、有偏見的、令人反感的,以及所有其他的東西。這很好。它并不完美,但已經越來越好了,而且我認為,隨著風格控制的加強,它只會越來越好。那么,這些對話式互動將成為網絡的未來。這很簡單。這是下一個瀏覽器;這是下一個搜索引擎。對我來說,只要用語音對我的 Copilot 說:“嘿,Copilot,這個問題的答案是什么?”就會容易 100 倍。這是我的常用工具。它是我 iPhone 右下角的應用程序。我的拇指會立即指向它。我用電源按鈕打開它。我最喜歡的應用程序,就像我用 Pi 時一樣。我的意思是,對話互動顯然是未來的趨勢。因此,在我看來,它的實用性是驚人的,我認為這將成為法院審理案件時的重要依據。NP:我認為這直接導致了智能體的出現,你可以要求手機上的某個應用程序或電腦操作系統的某個部分做某事,然后它就會去做。它會把信息反饋給你,或者代表你完成一些任務,然后把結果帶給你。你我之前以各種方式討論過這個問題。這讓很多服務提供商本身商品化了,對吧?你說,“我想吃三明治”,現在我不知道是 DoorDash、Uber Eats 還是 Seamless,或者誰會給我送三明治。我的人工智能會出去和他們交談。這意味著他們將允許這種情況發生——他們將允許智能體使用他們的服務。在最好的情況下,他們會提供 API 供你使用。在最壞的情況下,他們會讓人們在他們的網站上隨意點擊,這也是我們見過的其他公司所做的事情。在中間情況下,他們會開發某種人工智能與人工智能之間的對話。不完全是 API ,也不完全是我們在網站上點擊并假裝是人類,但我們的人工智能會進行一些對話。對這些公司來說,建立所有這些系統或允許以這種方式去中介化的動力是什么?MS:我的意思是,當出現新的技術或科學,并造成巨大破壞時,人們經常會問,人們很好奇。就像“為什么有人會在 10 年內做到這一點?”如果你回顧幾個世紀的歷史,就會發現,只要有用,就會越來越便宜,越來越容易使用。它會大量涌現,成為人們的默認選擇。然后,下一場來臨,徹底顛覆一切。我敢打賭,每一個瀏覽器、搜索引擎和應用程序都會被某種對話式界面、某種生成式界面所代表。三五年后,你所體驗到的用戶界面將由 LLM 自動生成,這將成為默認設置。他們將代表品牌、企業、有影響力的人、名人、學者、活動家和組織,就像社會中的每一個利益相關者在過去最終都會獲得一個播客、建立一個網站、撰寫一篇博客、也許建立一個應用程序或使用電話一樣。技術產生了一種新的界面,徹底改變了事物的分布方式。有些組織適應得非常快,一躍而上,改變了他們的業務和組織,有些則不然。會有一個調整期。到 2030 年,我們回過頭來看,就會發現,“哦,那真是一個真正的拐點,因為這些對話式人工智能確實是我們進行這些互動的主要方式”。所以,你說得完全正確。品牌和企業將利用人工智能與你的個人伴侶人工智能對話,因為我不太喜歡這樣的購物方式。有些人喜歡,他們會做那種直接面對消費者的瀏覽體驗。很多人都不喜歡這樣做,而且這樣做實際上超級令人沮喪、艱難和緩慢。因此,越來越多的人開始與自己的人工智能伙伴合作,讓他們成為自己的界面,與自己談判,尋找好機會,并根據自己的具體情況進行調整。這將是一個更高效的協議,因為人工智能可以超實時地與人工智能對話。順便說一句,我們不要自欺欺人。今天,我們已經在開放的網絡上實現了這一點。我們可以在廣告空間的買賣雙方或搜索排名算法之間進行幕后實時談判。因此,人工智能市場已經存在。只是沒有明確地用語言表現出來。它在矢量空間中運行。NP:這正是我好奇的地方。自然語言是范式的轉變。我認為它非常強大。我不認為這一點已經表達得很清楚,但下一種計算形式本質上是以自然語言為基礎的,我只需與計算機對話,它就會去做一些事情,因為它能聽懂我的話,這種理念非常強大,我對此深信不疑。對我來說,如何在后端實現這一點仍是未知數,對嗎?我要買一個三明治,就必須有公司為我提供三明治,而他們如何與我的人工智能對話,如何維持業務似乎非常具有挑戰性。現在,這些公司之所以有生意,是因為他們可以把我手機上的廣告位賣給其他真正做三明治的公司。他們有追加銷售。這些公司有無數種不同的賺錢方式。如果他們把自己抽象成他們的人工智能與我的人工智能對話,然后說“好吧,這是個三明治”,而我剝奪了他們所有其他的盈利機會,我不確定這個生態系統能否保持相關性,甚至能否存活下去。MS:我不太確定。我的意思是,制作三明治的人工智能仍然會想要推銷自己,具有說服力、娛樂性,并為消費者制作內容,對嗎?這并不是說它完全脫媒和斷開連接。品牌廣告和展示廣告仍然具有超強的相關性,三明治制作的人工智能也會以贊助的方式出現在您的個人人工智能環境中。因此,關鍵詞競價、為存在付費、為知名度付費等核心框架依然存在。排名仍將存在——這在某種程度上仍有意義。只是,你將由一個個人工智能伙伴作為對話者或談判者,這兩個人工智能伙伴將用自然語言進行交流,而這正是我們想要的。我們希望能夠回過頭來審核這次談判,檢查錯誤出在哪里,事后看看是否真的是個好價格,等等。NP:你經營著 MSN,你在微軟顯然也有同行在經營其他類型的社交網絡和其他類型的信息產品。我看到大量的人工智能“泔水”正在扼殺其中的一些網絡。我在 Facebook 上搜索了“面條耶穌”,我看到了奇點的另一面,我的朋友。我們已經討論過如何判斷高質量,答案是“我一看就知道”。但是,如果你運行這些網絡,你面對的是一群正在說話的 AI 智能體或 TikTok 上的人工智能影響者,你能有效地給這些東西貼標簽嗎?你能讓用戶只能看到其他人的東西嗎?MS:當然可以。這就需要平臺的身份管理系統發生轉變,而這種轉變有利有弊。你當然可以分辨出哪些賬號來自人類,哪些是人工智能生成的。在某種程度上,我認為可以對經過驗證的人類內容或經過驗證的人工智能內容進行數字水印和簽名。然后,在某種程度上,可以對合成內容進行檢測,因為這確實有一個特定的簽名。從長遠來看,我不認為這是一種防御手段。我認為,這將是一場完真、質量極高的“貓捉老鼠”游戲,就像幾十年來在安全、隱私和信息領域一直存在的情況一樣。因此,我預計這種情況會繼續下去。這將變得更加困難,更加細致入微,但這是事物發展的自然軌跡。NP:經營 LinkedIn 的人或者 MSN 的人是否會說:“這是一個我們無法阻止的問題”?我們需要確保這里的人工智能內容不會太多,因為現在還不夠好。一英里外我就能看出來。我看到了這些要點。我覺得有人用 ChatGPT 做了這個。我都不想看了。這是你現在面臨的問題,還是未來的問題?MS:我認為是未來的問題,但我要說的是,我們人類是行為主義者,對嗎?我們觀察其他人類的產出,然后根據信息的質量和我們自己的評估來評估和解讀信任。是否準確?是否可靠?這個人是否一直說到做到?因此,我們可以觀察他們的行動。而不是自省:為什么會發生這種情況?為什么這個神經網絡會產生這樣的輸出?這個人為什么會得出這樣的結論?這其實是一個很重要的區別,因為我認為很多純粹主義者都有點固執于對為什么會產生產出的因果解釋,而不是更多的觀察評估,“它有用嗎?它能重復做同樣的事情嗎?”這就是信任的驅動力。原文鏈接:https://www.theverge.com/24314821/microsoft-ai-ceo-mustafa-suleyman-google-deepmind-openai-inflection-agi-decoder-podcast閱讀報告全文,請訪問歐米伽研究所的“未來知識庫”https://wx.zsxq.com/group/454854145828未來知識庫是“歐米伽未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。截止到11月25日 ”未來知識庫”精選的100部前沿科技趨勢報告Air Street Capital《2024 年人工智能現狀報告》未來今日研究所:2024 技術趨勢報告 – 廣義計算篇科睿唯安中國科學院 2024 研究前沿熱度指數報告文本到圖像合成:十年回顧《以人為中心的大型語言模型(LLM)研究綜述》經合組織 2024 年數字經濟展望報告加強連通性創新與信任第二版波士頓咨詢 2024 全球經濟體 AI 成熟度矩陣報告理解世界還是預測未來?世界模型的綜合綜述Google Cloud CSA2024 AI 與安全狀況調研報告英國制造商組織 MakeUK2024 英國工業戰略愿景報告從概念到實施花旗銀行 CitiGPS2024 自然環境可持續發展新前沿研究報告國際原子能機構 2024 聚變關鍵要素報告 – 聚變能發展的共同愿景國際可再生能源署 IRENA2024 年全球氣候行動報告Cell: 物理學和化學 、人工智能知識領域的融合智次方 2025 中國 5G 產業全景圖譜報告未來今日研究所:2024 技術趨勢報告 – 移動性,機器人與無人機篇Deepmind:AI 加速科學創新發現的黃金時代報告PitchBookNVCA2024 年第三季度全球風險投資監測報告德科 2024 年未來全球勞動力報告高工咨詢 2024 年協作機器人產業發展藍皮書國際能源署 IEA2024 年全球能源效率報告基因慧基因行業藍皮書 2024 – 2025普華永道 PwC2024 全球經濟犯罪調查英國報告 – 智對風險直面挑戰中國互聯網協會 2024 面向未來網絡的數字孿生城市場景應用白皮書中移智庫 2024 先進感知新技術及新應用白皮書智次方研究院 2025 中國 AIoT 產業全景圖譜報告未來今日研究所:2024 技術趨勢報告 – 人工智能篇國際電聯:邁向衡量數字經濟的通用框架的路線圖聯合國糧食與農業組織:2024 年世界糧食安全和營養狀況大語言模型綜述李飛飛等,AI 智能體:探索多模式交互的前景綜述哈爾濱工業大學 – ChatGPT 調研報告2024《美國核部署戰略報告》最新文件清華大學:AIGC 發展研究 3.0 發布版 b 版OpenAI:2024 年 OpenAI o1 大模型技術報告Verizon2024 年世界支付安全報告皇家學會哲學學報 從復雜系統角度評估人工智能風險復旦大學 大模型 AI 代理的興起和潛力:綜述經合組織 OECD2024 年氣候行動監測報告Wevolver2024 年邊緣人工智能現狀報告 – 探索各行業邊緣 AI 應用動態2024 全球人形機器人產品數據庫報告 – 人形機器人洞察研究 BTIResearch《全球金融穩定報告》 把舵定航 不確定性、人工智能與金融穩定瑞士洛桑聯邦理工學院 《人工智能中的 – 創造力:進展與挑戰》《你所需要知道的理 – 論:人工智能、人類認知與決策》牛津大學最新 53 頁報告世界經濟論壇 新興技術時代的網絡彈性導航:應對復雜挑戰的協作解決方案 2024ADL 理特咨詢 2024 汽車出行未來展望報告2024 中國硬科技創新發展白皮書 – 開辟未來產業新賽道科學時代的大語言模型中的人工智能Gartner2025 年重要戰略技術趨勢報告CBInsights2024 年第三季度全球人工智能投融資狀況報告TrendHunter2025 年全球趨勢報告 – 全行業頂級創新和變革趨勢前瞻天津大學 2024 大模型輕量化技術研究報告歐洲海洋局 2024 導航未來報告將海洋置于更廣泛的地球系統中第六版美國安全與新興技術中心 2024 AI 生成代碼的網絡安全風險研究報告國際原子能機構 2024 年世界聚變展望報告復旦大學 2024 大語言模型的能力邊界與發展思考報告安盛 AXA2024 年氣候與生物多樣性報告氣候過渡計劃路線圖YouGov2024 美國公眾對人工智能 AI 的態度調研報告麥肯錫中國報告:《中國與世界》完整版麥肯錫全球研究所 2024 下一代競技場報告 – 重塑全球經濟的 18 個新興行業領域Project Sid,一個旨在模擬多智能體交互以研究 AI 文明的項目德國研究與創新專家委員會 德國研究創新與科技成果報告2024 年歐洲關鍵產業的科技重塑研究報告智能體專題報告之二 – 智能體時代來臨具身智能有望成為最佳載體ActivateConsulting 2025 年頂級技術和媒體發展趨勢報告蘭德 全球災難風險評估斯坦福李飛飛 《AI agent 綜述》Agent AI 開啟多模態交互新紀元中國聯通研究院 2024 中國生成式人工智能應用與實踐展望白皮書中文版普華永道 2024 第五次工業研究報告邁向彈性可持續和以人為本的未來大成 Dentsons2024 年全球智慧城市與互聯社區智庫年度報告TechUK2024 量子技術挑戰與機遇并存構筑量子韌性的策略與實踐研究報告Emakina 將塑造 2024 年的技術趨勢報告圖靈獎得主 Yann LeCun《機器如何才能達到人類智能水平?》——Yann LeCun, 附 Slides 及視頻華為:2024 鴻蒙生態應用開發白皮書 V3.0(最新版)CASA:2023 第三代半導體產業發展報告大型視覺語言模型中幻覺現象的綜述IEA PVPS:2024 光伏應用趨勢報告(英文版)ABI Research:82 個將會或不會在 2024 年發生的技術趨勢白皮書《美國反無人機系統未來趨勢報告(2024 – 2029 年)》《軍事自主系統:未來之路》美空間智能如何?牛津大學博士論文《深度具身智能體的空間推理與規劃》2024 低空經濟場景白皮書 v1.0戰略與國際研究中心(CSIS)人類地月空間探索的總體狀況研究報告(2024)Artificial Intelligence Review:人工智能與物理學相遇的綜述麥肯錫:全球難題,應對能源轉型的現實問題歐米伽理論,智能科學視野下的萬物理論新探索(研究論文)Gartner 2025 年主要戰略技術趨勢研究報告2024 人工智能國外大模型使用手冊 + 中文大模型使用手冊詳解光刻巨人 ASML 成功之奧妙 – 241015CB Insights:未來變革者:2025 年九大科技趨勢研究報告國際電信聯盟 2023 – 2024 年聯合國人工智能 AI 活動報告《人工智能能力的人類系統集成測試和評估》最新 51 頁,美國防部首席數字和人工智能辦公室(CDAO)2024 瑞典皇家科學院諾貝爾化學獎官方成果介紹報告MHP 2024 全球工業 4.0 晴雨表白皮書世界經濟論壇白皮書《AI 價值洞察:引導人工智能實現人類共同目標》瑞典皇家科學院諾貝爾物理學獎科學背景報告資料AI 智能體的崛起:整合人工智能、區塊鏈技術與量子計算 (研究報告,書)OpenAI o1 評估:AGI 的機遇和挑戰(280 頁)世界知識產權組織:2024 年全球創新指數美國白宮:國家近地天體防御策略與行動計劃上下滑動查看更多
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
暫無評論...