一文讀懂孤立森林
AIGC動(dòng)態(tài)歡迎閱讀
原標(biāo)題:一文讀懂孤立森林
關(guān)鍵字:樣本,數(shù)據(jù),森林,算法,特征
文章來源:大數(shù)據(jù)文摘
內(nèi)容字?jǐn)?shù):0字
內(nèi)容摘要:
大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載自數(shù)據(jù)派THU
作者:賈恩東編輯:黃繼彥本文將介紹在異常檢測(cè)領(lǐng)域中的一種具有線性時(shí)間復(fù)雜度和較高精準(zhǔn)度且在學(xué)術(shù)界和工業(yè)界都有著不錯(cuò)反響的算法:孤立森林。異常檢測(cè)是機(jī)器學(xué)習(xí)研究領(lǐng)域中和現(xiàn)實(shí)應(yīng)用聯(lián)系緊密,有廣泛的直接需求的一大類問題。這一類問題的解決方案往往可以直接應(yīng)用于網(wǎng)絡(luò)安全中的攻擊檢測(cè),金融交易欺詐檢測(cè),敵方活動(dòng)的軍事異常監(jiān)測(cè),罕見疾病偵測(cè),和噪聲數(shù)據(jù)
過濾等實(shí)際業(yè)務(wù),具有較為明顯的商業(yè)價(jià)值。
背景介紹
我們先來簡(jiǎn)單了解一下孤立森林算法所屬的機(jī)器學(xué)習(xí)分類領(lǐng)域,即異常檢測(cè)。異常檢測(cè) (anomaly detection),或者又被稱為“離群點(diǎn)檢測(cè)” (outlier detection),指的是在數(shù)據(jù)中發(fā)現(xiàn)不符合預(yù)期行為模式的特別數(shù)據(jù)的問題。在不同的應(yīng)用領(lǐng)域中,這些不一致模式的特別數(shù)據(jù)通常被稱為異常、異常值、不一致觀察、離群值、異常、畸變、意外、特殊性或污染物。但對(duì)于“異常”的具體定義,在不同的問題上往往其實(shí)并沒有標(biāo)準(zhǔn)答案,甚至在同一個(gè)問題上,在不同的角度下,所謂何為“異常”的答案可能也不盡然相同。事實(shí)上,正常和異常之間的界限往往是不清晰的。在靠近邊界處,正常觀測(cè)常被
原文鏈接:一文讀懂孤立森林
聯(lián)系作者
文章來源:大數(shù)據(jù)文摘
作者微信:
作者簡(jiǎn)介: