覆蓋 7 百萬問答數據,上海 AI Lab 發布 ChemLLM,專業能力比肩 GPT-4

AIGC動態歡迎閱讀
原標題:覆蓋 7 百萬問答數據,上海 AI Lab 發布 ChemLLM,專業能力比肩 GPT-4
關鍵字:化學,模型,數據,任務,能力
文章來源:HyperAI超神經
內容字數:0字
內容摘要:
作者:李姝
編輯:李姝,李寶珠
化學大語言模型 ChemLLM 是首個兼備化學專業能力和對話、推理等通用能力的開源大模型。目前 HyperAI超神經官網 (hyper.ai) 已上線「一鍵部署化學大模型 ChemLLM-7B-chat」,詳細教程詳見下文。隨著人工智能技術的飛速發展,大語言模型 (LLMs) 憑借其強大的自然語言處理能力,在生命科學、海洋學、材料化學等科學研究中被廣泛應用。雖然,LLMs 在分子特性預測、分子生成和實驗方案設計等化學相關任務上表現良好,但在處理各種化學下游任務時表現欠佳。
究其原因,直接將化學知識集成到語言模型中,主要面臨三大挑戰:首先,大多數化學信息和知識存儲在結構化數據庫中,直接使用這些數據訓練 LLMs 可能會損害模型處理自然語言的能力,使得模型的對話和邏輯推理能力發生退化;其次,在化學信息學中,分子用特殊符號表示,如 SMILES。然而這類數據往往不符合自然語言的規范,因此常規的語言模型難以正確理解和生成這種符號;最后,化學數據和任務種類繁多,設計一個靈活并能泛化到多種化學任務上的訓練流程十分困難。
針對于此,上海人工智能實驗室發布了化學大語言模
原文鏈接:覆蓋 7 百萬問答數據,上海 AI Lab 發布 ChemLLM,專業能力比肩 GPT-4
聯系作者
文章來源:HyperAI超神經
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號