
AIGC動態歡迎閱讀
內容摘要:
大數據文摘受權轉載自算法進階
1 前言
在傳統軟件工程中,程序問題(即Bugs)會導致程序崩潰,但開發人員可以通過檢查錯誤來了解原因。
然而,在深度學習中,代碼可能會在沒有明確原因的情況下崩潰。雖然這些問題可以手動調試,但深度學習模型通常會因為輸出預測不佳而失敗。更糟糕的是,當模型性能較低時,通常沒有任何信號表明模型失敗的原因或時間。
開發過程中我們很經常要花80-90%的時間在數據處理及調試模型,而只花費10-20%的時間推導數學方程和實現功能。
2 為什么模型的問題排查困難
? 很難判斷是否有錯誤
? 造成相同性能下降的原因有很多
? 結果可能對超參數和數據集構成的微小變化很敏感
2.1 存在隱藏bugs
在深度學習中,大部分錯誤并不會被輕易察覺到,比如標簽順序錯誤。
2.2 超參數選擇
深度學習模型對超參數的選擇非常敏感。即使是微妙的調整,如學習率和權重的初始化,也會對結果產生顯著的影響。
2.3 數據/模型擬合
我們可以在ImageNet數據集上預訓練模型,然后將其應用到更為復雜的自動駕駛汽車圖像數據集上進行擬合。
2.4 數據集構造
在此過程中,常見的問題包括:樣本數量不足、
原文鏈接:一網打盡!深度學習常見問題!
聯系作者
文章來源:大數據文摘
作者微信:BigDataDigest
作者簡介:普及數據思維,傳播數據文化
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...

粵公網安備 44011502001135號