文档目录
查看数据
缺失值和异常值
了解如何查找缺失值、发现异常值、以及使用筛选和排序功能。
缺失值和异常值是数据质量问题的主要表现。在创建清洗方案之前,先识别这些问题可以帮助你决定如何处理。
IMD 提供工具来高亮显示缺失值和异常值,并支持通过筛选和排序来详细查看数据。
查找缺失值
在数据表视图中,缺失值通常显示为空或特定标记。使用 Diagnostics 面板可以快速查看哪些字段有大量缺失值。
如果某个重要字段有较多缺失值,需要在清洗方案中决定是填充、删除还是保留。
查找异常值
异常值是与其他数据点明显不同的值。检查数值字段的范围、分布和极值可以发现异常。
在数据视图中筛选极端值可以快速定位可能的异常。如果某个数值看起来不合理(如年龄为 999),可能需要校正或标记。
筛选和排序
使用筛选功能可以按字段值或条件过滤行。使用排序功能可以按一个或多个字段对数据进行排序。
筛选和排序可以帮助你集中查看特定子集,例如缺失值较多的行或异常值的记录。
