受 EleutherAI 的啟發,OpenBioML 旨在成為機器學習和生物學交叉領域的開放協作研究實驗室。從討論最新發展到合作開展尖端項目和復制閉源研究。我們尋求最大限度地發揮人工智能在生命科學中的積極影響。
我們可以訪問大規模計算資源,并希望利用它們來加速研究。如果這是您感興趣的事情,您可以考慮提出一個合作研究項目或通過我們的 discord 參與進來!
該項目的目標是研究最近的擴散模型對基因組學數據的應用和適應。擴散模型是功能強大的模型,已用于圖像生成(例如穩定擴散、DALL-E)、音樂生成(洋紅色項目的最新版本)并取得了出色的效果。如果在訓練期間提供文本或連續/離散標簽,則稱為“引導”擴散的特定模型公式允許將生成過程偏向特定方向。這允許創建“AI 藝術家”,基于文本提示,可以創建美麗而復雜的圖像。
我們的任務
大多數研究小組缺乏承擔前沿??研究項目以及快速迭代新想法所需的計算能力。AlphaFold2 最近的成功證明了這一事實:為了訓練最終模型,DeepMind 的團隊使用了 128 個 TPUv3 數周時間,但這并沒有考慮之前為最終架構所使用的所有資源。很少有學術實驗室能夠獲得如此大規模的資源,但很明顯,人才和創新思想可以在世界各地找到。
激勵我們的是可用資源和人才之間的不相稱:通過創建一個分散的研究實驗室,可以訪問以前只有資金最充足的工業研究實驗室才能使用的計算和存儲資源,我們尋求支持更廣泛的社區并激勵發布當前技術可以提供的最先進的預測模型。
人們一再明確表示,機器學習模型通常會顯示出令人驚訝的涌現能力,而這些能力往往難以預見。例如,AlphaFold2 被發現能夠預測四元結構。研究人員在其檢查點發布后不久就對該模型進行了實驗,發現了這種能力。我們都將從改進的生物技術中獲益,如果機器學習越來越成為計算生物學的核心,我們需要確保這些能力得到充分發現和利用。
數據統計
數據評估
本站OpenI提供的OpenBioML都來源于網絡,不保證外部鏈接的準確性和完整性,同時,對于該外部鏈接的指向,不由OpenI實際控制,在2023年 5月 13日 下午5:15收錄時,該網頁上的內容,都屬于合規合法,后期網頁的內容如出現違規,可以直接聯系網站管理員進行刪除,OpenI不承擔任何責任。