覆蓋 7 百萬問答數據，上海 AI Lab 發布 ChemLLM，專業能力比肩 GPT-4

AIGC動態1年前 (2024)發布 HyperAI超神經

AIGC動態歡迎閱讀

原標題：覆蓋 7 百萬問答數據，上海 AI Lab 發布 ChemLLM，專業能力比肩 GPT-4
關鍵字：化學,模型,數據,任務,能力
文章來源：HyperAI超神經
內容字數：0字

內容摘要：

作者：李姝
編輯：李姝，李寶珠
化學大語言模型 ChemLLM 是首個兼備化學專業能力和對話、推理等通用能力的開源大模型。目前 HyperAI超神經官網 (hyper.ai) 已上線「一鍵部署化學大模型 ChemLLM-7B-chat」，詳細教程詳見下文。隨著人工智能技術的飛速發展，大語言模型 (LLMs) 憑借其強大的自然語言處理能力，在生命科學、海洋學、材料化學等科學研究中被廣泛應用。雖然，LLMs 在分子特性預測、分子生成和實驗方案設計等化學相關任務上表現良好，但在處理各種化學下游任務時表現欠佳。
究其原因，直接將化學知識集成到語言模型中，主要面臨三大挑戰：首先，大多數化學信息和知識存儲在結構化數據庫中，直接使用這些數據訓練 LLMs 可能會損害模型處理自然語言的能力，使得模型的對話和邏輯推理能力發生退化；其次，在化學信息學中，分子用特殊符號表示，如 SMILES。然而這類數據往往不符合自然語言的規范，因此常規的語言模型難以正確理解和生成這種符號；最后，化學數據和任務種類繁多，設計一個靈活并能泛化到多種化學任務上的訓練流程十分困難。
針對于此，上海人工智能實驗室發布了化學大語言模

原文鏈接：覆蓋 7 百萬問答數據，上海 AI Lab 發布 ChemLLM，專業能力比肩 GPT-4