標簽:語料

WPS接入DeepSeek,秒變辦公神器!

WPS 大家經常用來日常寫作,雖然本身提供了AI功能,但可惜需要會員,本文教你三分鐘接入最火的DeepSeek,讓WPS秒變辦公神器。 DeepSeek API申請地址:http:/...
閱讀原文

AI賺錢副業~AI生成影視解說,半個月漲粉變現3.5W+!

這兩年大家都在感嘆生活不易,然而我想說的是,機會還是有的,但問題不在于有沒有,而在于你是否能夠認準機會,然后抓住它。 接觸過很多咨詢項目的人,發現...

用LLM一鍵生成百萬級領域知識圖譜!中科大新框架入選ACL 2024

SAC-KG團隊 投稿量子位 | 公眾號 QbitAI現在,用LLM一鍵就能生成百萬級領域知識圖譜了?! 來自中科大MIRA實驗室研究人員提出一種通用的自動化知識圖譜構建新...
閱讀原文

LLM實踐系列-詳談Tokenizer訓練細節

今天給大家帶來知乎@真中合歡的一篇文章,《LLM實踐--Tokenizer訓練》。 知乎:https://zhuanlan.zhihu.com/p/739078635 經過了數據收集、篩選、去重,馬上就...
閱讀原文

華為喬彥輝:大模型如何驅動華為云智能運維無人化變革

采訪嘉賓 | 喬彥輝 編輯 | 李忠良 在智能運維領域,大模型技術正引領運維從輔助決策逐步邁向無人化操作。隨著行業迅速發展,智能化運維不僅提升了效率,更有...
閱讀原文

全是細節!大模型SFT的100個關鍵點

GTIC 2024中國AI PC創新峰會將于10月11日,在2024上海國際消費電子展TechG同期舉辦。聯想集團首席研究員顏毅強、榮耀終端有限公司PC產品研發系統部部長席迎軍...
閱讀原文

星環科技孫元浩:語料已經是大模型最大的挑戰

機器之心報道 作者:Esther「原來以為語料已經匱乏了,大模型訓練已經沒有語料了,實際上不是的,數據還遠遠沒有跑光」。 作為大數據領域超過十年的創業者,...
閱讀原文

彌補中文短板,社區Llama3漢化微調版效果如何?

Llama3自上個月發布以來,被稱為社區最強開源模型。由于中文能力欠缺,為了彌補這一短板,開源社區已經出現了多個基于Llama3進行中文優化的微調模型。 這些微...
閱讀原文

0門檻免費商用!孟子3-13B大模型正式開源,萬億token數據訓練

白交 發自 凹非寺量子位 | 公眾號 QbitAI瀾舟科技官宣:孟子3-13B大模型正式開源! 這一主打高性價比的輕量化大模型,面向學術研究完全開放,并支持免費商用...
閱讀原文

GPT-4「榮升」AI頂會同行評審專家?斯坦福最新研究:ICLR/NeurIPS等竟有16.9%評審是ChatGPT生成

新智元報道編輯:Mindy 【新智元導讀】斯坦福的一篇案例研究表示,提交給AI會議的同行評審文本中,有6.5%到16.9%可能是由LLM大幅修改的,而這些趨勢可能在個...
閱讀原文

谷歌開源大模型Gemma帶來了什么,原來“中國制造”的機會早已到來

金磊 發自 凹非寺量子位 | 公眾號 QbitAI谷歌罕見open的AI,給開源大模型到底帶來了什么? Gemma從發布到現在已經時過數日,谷歌久違的這次開源,可謂是給全...
閱讀原文

國產開源模型標桿大升級,重點能力比肩ChatGPT!書生·浦語2.0發布,支持免費商用

明敏 發自 凹非寺量子位 | 公眾號 QbitAI1月17日,新一代大語言模型書?·浦語2.0(InternLM2)正式發布并開源。 2種參數規格、3種模型版本,共計6個模型,全...
閱讀原文

200億「書生·浦語2.0」正式開源!數推性能比肩ChatGPT,200K超長上下文完美召回

新智元報道編輯:桃子 好困 【新智元導讀】新一代國產開源大語言模型來了!200K超長上下文「完美」支持,20B版本綜合性能全面領先。就在今天,上海人工智能實...
閱讀原文

為大模型惡補數學,上交開源MathPile語料庫,95億tokens,還可商用

機器之心專欄 機器之心編輯部在當前智能對話模型的發展中,強大的底層模型起著至關重要的作用。這些先進模型的預訓練往往依賴于高質量且多樣化的語料庫,而如...
閱讀原文

Gemini自曝文心一言牽出重大難題,全球陷入高質量數據荒?2024年或將枯竭

新智元報道編輯:編輯部 【新智元導讀】Gemini自曝自己是文心一言,聽之雖然好笑,背后原因卻令人憂心:互聯網語料或許已經被AI嚴重污染,而且全球都陷入了高...
閱讀原文

傳字節成立AI應用新部門Flow;淘天集團籌建大模型團隊;浪潮信息開源千億級大模型丨AIGC大事日報

11/27全球AIGC產業要聞1、傳字節跳動成立新部門Flow 發力AI應用層2、傳淘天集團籌建大模型團隊3、浪潮信息發布千億級開源大模型源2.04、馬毅團隊提出白盒Tran...
閱讀原文

重磅!首個生成式AI安全指導性文件來了,明確31種安全風險

頭圖由AIGC工具創作生成生成式AI安全新規征求意見,達標才能“持證上崗”。作者|李水青編輯|心緣智東西10月12日消息,10月11日,全國信息安全標準化技術委員會...
閱讀原文
12