AIGC動態歡迎閱讀
內容摘要:
大數據文摘受權轉載自數據派THU
作者:賈恩東編輯:黃繼彥本文將介紹在異常檢測領域中的一種具有線性時間復雜度和較高精準度且在學術界和工業界都有著不錯反響的算法:孤立森林。異常檢測是機器學習研究領域中和現實應用聯系緊密,有廣泛的直接需求的一大類問題。這一類問題的解決方案往往可以直接應用于網絡安全中的攻擊檢測,金融交易欺詐檢測,敵方活動的軍事異常監測,罕見疾病偵測,和噪聲數據
過濾等實際業務,具有較為明顯的商業價值。
背景介紹
我們先來簡單了解一下孤立森林算法所屬的機器學習分類領域,即異常檢測。異常檢測 (anomaly detection),或者又被稱為“離群點檢測” (outlier detection),指的是在數據中發現不符合預期行為模式的特別數據的問題。在不同的應用領域中,這些不一致模式的特別數據通常被稱為異常、異常值、不一致觀察、離群值、異常、畸變、意外、特殊性或污染物。但對于“異常”的具體定義,在不同的問題上往往其實并沒有標準答案,甚至在同一個問題上,在不同的角度下,所謂何為“異常”的答案可能也不盡然相同。事實上,正常和異常之間的界限往往是不清晰的。在靠近邊界處,正常觀測常被
原文鏈接:一文讀懂孤立森林
聯系作者
文章來源:大數據文摘
作者微信:
作者簡介:
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
相關文章
暫無評論...