| 第1题 |
| 下列不属于描述统计的是() A.频次分析 B.平均数 C.回归分析 D.相关系数 答案:C |
| 第2题 |
| 下列不属于数据预处理过程的是 A.特征选择 B.维归约 C.规范化 D.模式过滤 答案:D |
| 第3题 |
| 统计显著性应大于( A.3% B.4% C.5% D.6% 答案:C |
| 第4题 |
| 高维度数据可视化图表不包括( A.矩阵 B.百分位数图 C.平行坐标系 D.星状坐标 答案:B |
| 第5题 |
| 下列描述哪个是中位数的特点: A.体现了样本数据的最大集中点,但它显然对其他数据信息的忽视使得无法客观地反映总体特征。 B.是样本数据所占频率的等分线,它不受少数几个极端值的影响,这是某些情况下的有点,但它对极端值不敏感有时也会成为缺点。 C.任何一个样本数据的改变都会引起它的改变,但受数据中的极端值的影响较大,使它在估计总体是可靠性降低。 D.用来描述变量之间的关联程度。 答案:B |
| 第6题 |
| 数据可视化有效性原则包括 A.可理解性 B.清晰性 C.一致性 D.有效性 E.必要性 F.真实性 答案:A,B,C,D,E,F |
| 第7题 |
| 常用的数据交换技术包括 A.XML B.JSON C.Excel D.文本 E.ZIP文件 答案:A,B,C,D |
| 第8题 |
| 影响公路工程造价的主要因素包括 A.技术标准 B.工程规模 C.地形地质等自然地理环境条件 D.要素成本 E.管理水平 答案:A,B,C,D,E |
| 第9题 |
| 下列哪些属于数据挖掘的主要任务 A.聚类分析 B.预测建模 C.关联分析 D.异常检测 答案:A,B,C,D |
| 第10题 |
| 下列关于回归预测描述正确的是 A.一个大型样本的正确抽样与其代表的群体存在相似关系。 B.任何群体抽样平均值都会在全体平均值的周围,呈正态分布。 C.68%的数值位于一个标准差以内。 D.95%的数值位于二个标准差以内。 答案:A,B,C,D |
| 第11题 |
| 造价指标可分为费用指标及工程数量指标。 答案:正确 |
| 第12题 |
| 推论统计:先发现一些规律和结果,然后再利用概率来证明这些结果背后最有可能的原因。 答案:正确 |
| 第13题 |
| 指标分析的主要目标包括:现状分析、原因分析、预测分析。 答案:正确 |
| 第14题 |
| 答案:错误 |
| 第15题 |
| 大数据的5V特点: Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。 答案:正确 |
| 第16题 |
| 两个变量相关系数为0,表示两个变量完全相关。 答案:正确 |
| 第17题 |
| TXT文件数据具有良好的数据表达能力。 答案:错误 |
| 第18题 |
| 机器学习的核心是“使用算法解析数据,从中学习,然后对世界上的某件事情做出决定或预测”。 答案:正确 |
| 第19题 |
| 数据可视化是指以图形或表格形式显示信息,目标是形成可视化信息的人工解释和信息的意境模型。 答案:正确 |
| 第20题 |
| 数据分析常用工具软件包括:Excel、SPSS、SAS、R软件、Python。 答案:正确 |