python 异常值处理
在Python中,异常值处理可以通过以下方法进行:
1. 使用z-score方法判断异常值:对原始值进行正态标准化,计算(X-mean(X))/std(X),根据计算结果判断样本值与中心的偏离程度。
2. 重复数据的预处理:对于重复数据,可以通过简单的比较算法剔除。
3. 缺失数据的预处理:缺失数据的处理主要有4种方式:均值补差、利用同类均值补差、极大似然估计、多重补差。
需要注意的是,标准化后的绝对值越大,数据越有可能异常,是否异常根据设定的阈值判断。
标签: #科技数码
郑重声明:图文由自媒体作者发布,我们尊重原作版权,但因数量庞大无法逐一核实,图片与文字所有方如有疑问可与我们联系,核实后我们将予以删除。
联系我们 关于我们 版权申明 天唯网数码 广州小漏斗信息技术有限公司 版权所有 粤ICP备20006251号