AIGC動態歡迎閱讀
原標題:整合海量公共數據,谷歌開源AI統計學專家DataGemma
關鍵字:數據,自然語言,用戶,統計數據,模型
文章來源:新智元
內容字數:0字
內容摘要:
新智元報道編輯:alan
【新智元導讀】近日,谷歌推出了自己籌劃已久的大型開源公共統計數據庫,以及在此基礎上誕生的大模型。——「AI統計學專家」能解決幻覺嗎?準確的統計數據、時效性強的信息,一直是大語言模型產生幻覺的重災區。
知識是現成的,但學是不可能學的。
并非此身惰怠,只因現實太多阻礙。
對于這個問題,谷歌在近日推出了自己籌劃已久的大型數據庫Data Commons,以及在此基礎上誕生的大模型DataGemma。
論文地址:https://docs.datacommons.org/papers/DataGemma-FullPaper.pdf
Data Commons是一個龐大的開源公共統計數據存儲庫,包含來自聯合國 (UN)、疾病控制與預防中心 (CDC) 、人口普查局、衛生部、環境機構、經濟部門、非組織和學術機構等可信來源的大量統計數據。
目前,整個語料庫包含超過2500億個數據點和超過2.5萬億個三元組。
數據有了,模型要怎么處理?
本文提出了一種將LLM橋接到數據的通用架構,并探討了需要解決的三個問題。
首先,LLM必須學會在適當的時機選擇,是使用存儲在模型參數中的知識
原文鏈接:整合海量公共數據,谷歌開源AI統計學專家DataGemma
聯系作者
文章來源:新智元
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...