首页
题库
网课
在线模考
搜标题
搜题干
搜选项
数据挖掘工程师章节练习(2019.11.28)
填空题
确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据拥护需求设计()
答案:
聚合模型
点击查看答案
判断题
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
答案:
错误
点击查看答案解析
名词解释
OLAP
答案:
OLAP是在OLTP的基础上发展起来的,以数据仓库为基础的数据分析处理,是共享多维信息的快速分析,是被专门设计用于支持复...
点击查看完整答案
多项选择题
下面属于数据集的一般特性的有:()。
A.连续性
B.维度
C.稀疏性
D.分辨率
E.相异性
点击查看答案&解析
多项选择题
数据清理的目的是处理数据中的()。
A.空缺值
B.噪声数据
C.不一致数据
D.敏感数据
点击查看答案&解析
判断题
具有较高的支持度的项集具有较高的置信度。
答案:
错误
点击查看答案解析
问答题
何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?
答案:
粒度是指数据仓库的数据单位中保存数据细化或综合程度的级别。
粒度影响存放在数据仓库中的数据量的大小,同时影响数...
点击查看完整答案
填空题
按照事实表中度量的可加性情况,可以把事实表对应的事实分为4种类型:()、快照事实、线性项目事实和事件事实。
答案:
事务事实
点击查看答案
问答题
以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数)1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。请分别用等宽的方法和等高的方法对上面的数据集进行划分。
答案:
(1)等宽方法:划分为3个数据集,每个数据集的宽度为价格10。价格在1—10之间出现次数为13;价格在11&...
点击查看完整答案
单项选择题
字段Hair_color={auburn,black,blond,brown,grey,red,white}属于哪种属性类型?()
A.标称属性
B.二元属性
C.序数属性
D.数值属性
点击查看答案&解析