广州学习什么是孤立森林?_广州哪里有学软件测试
作者:广州电脑培训甘发布时间:2020-10-17分类:软件开发培训浏览:990
导读:孤立森林算法应用于网络安全中的攻击检测,金融交易欺诈检测,疾病侦测,和噪声数据过滤等。 1.孤立森林简介 &n...
孤立森林算法应用于网络安全中的攻击检测,金融交易欺诈检测,疾病侦测,和噪声数据过滤等。
1. 孤立森林简介
iForest(IsolationForest)孤立森林是一个基于Ensemble 的快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的state-of-the-art算法。
iForest 适用于连续数据的异常检测,将异常定义为“容易被孤立的离群点”,可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释,在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因而可以认为落在这些区域里的数据是异常的。
iForest 即不用定义数学模型也不需要有标记的训练。对于如何查找哪些点是否容易被孤立,iForest 使用了一套非常高效的策略。
假设我们用一个随机超平面来切割数据空间, 切一次可以生成两个子空间。之后我们再继续用一个随机超平面来切割每个子空间,循环下去,直到每子空间里面只有一个数据点为止。直观上来讲,我们可以发现那些密度很高的簇是可以被切很多次才会停止切割,但是那些密度很低的点很容易很早的就停到一个子空间了。
- 软件开发培训排行
- 最近发表
- 标签列表
-