文檔目錄
查看資料
缺失值和异常值
了解如何查找缺失值、发现异常值、以及使用筛选和排序功能。
缺失值和异常值是資料质量問題的主要表现。在建立清洗方案之前,先识别這些問題可以帮助你决定如何处理。
IMD 提供工具来高亮显示缺失值和异常值,并支援通过筛选和排序来详细查看資料。
查找缺失值
在資料表视图中,缺失值通常显示為空或特定标记。使用 Diagnostics 面板可以快速查看哪些欄位有大量缺失值。
如果某个重要欄位有较多缺失值,需要在清洗方案中决定是填充、删除还是保留。
查找异常值
异常值是與其他資料点明显不同的值。检查数值欄位的范围、分布和极值可以发现异常。
在資料视图中筛选极端值可以快速定位可能的异常。如果某个数值看起来不合理(如年龄為 999),可能需要校正或标记。
筛选和排序
使用筛选功能可以按欄位值或条件过滤行。使用排序功能可以按一个或多个欄位对資料进行排序。
筛选和排序可以帮助你集中查看特定子集,例如缺失值较多的行或异常值的记录。
