相关考题
-
单项选择题
在处理后台数据时,有一列客户输入变量名为“您的爱好”,共有5个不同的选项,但是有70%左右的客户这一项的数据没有填写,那么那一项的处理方式更合理()?
A.建模前先将这个变量删除
B.将这一项没有填写的客户归为第6类
C.用前5项的众数替换缺失值
D.提出这部分未填写爱好的客户信息 -
单项选择题
假设一组数据的取值从923到899。数据中最大绝对值为923。因此,我们用1000除每个值。因此,923被规范化为0.923,而899被规范化为0.899,这种数据规范化被称为()。
A.小数定标规范化
B.z-score规范化
C.对数规范化
D.归一化规范化 -
单项选择题
如果一组数据不是对称分布,按照切比雪夫不等式,至少约有()的观测值落在距均值4个标准差的区间范围内。
A.75%
B.89%
C.94%
D.98%