主页 返回 进入列表

  • 总根 >计算机与教育 >课程 >高等教育课程 >本科课程 >模式识别与人工智能 >zstu-(2021-2022)-1 >学生作业目录

  • 2019339900019葛航

    数据清理

    1、缺失值的处理

    由于现实世界中,获取信息和数据的过程中,会存在各类的原因导致数据丢失和空缺。针对这些缺失值的处理方法,主要是基于变量的分布特性和变量的重要性(信息量和预测能力)采用不同的方法。主要分为以下几种:

     



    删除变量:若变量的缺失率较高(大于80%),覆盖率较低,且重要性较低,可以直接将变量删除。



     



    定值


    全文(Full Article): https://yvsou.com/dc/single.php?groupid=28.218.81608.81609.81613.85931.86408.83744&pid=1341068&startgroup=