← 返回首页

项目09: 异常值检测

统计描述与分位数,基于IQR或3σ原则识别异常

📊 数据集预览

使用 retail_orders 数据集,包含价格、数量等数值列。

retail_orders.csv(前5行)

🎯 学习目标

  • 查看数据的统计描述
  • 计算分位数与IQR
  • 使用IQR方法检测异常值
  • 使用3σ原则检测异常值
  • 处理异常值(删除或替换)

💻 实战练习

1. 加载数据并查看统计描述

使用 describe() 查看数据分布。

代码编辑器
点击"运行代码"查看输出...

2. 计算IQR

IQR = Q3 - Q1。

代码编辑器
点击"运行代码"查看输出...

3. 使用IQR方法检测异常值

异常值范围:< Q1-1.5*IQR 或 > Q3+1.5*IQR。

代码编辑器
点击"运行代码"查看输出...

4. 使用3σ原则检测异常值

异常值范围:< mean-3*std 或 > mean+3*std。

代码编辑器
点击"运行代码"查看输出...

5. 处理异常值

删除或用中位数替换异常值。

代码编辑器
点击"运行代码"查看输出...