视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
山西省职业院校技能大赛高职组大数据技术与应用赛项规程(2)
2025-10-02 18:44:49 责编:小OO
文档
山西省第十一届高等职业学校“四合天地杯”大数据技术与应用技能大赛赛项规程

一、赛项名称

赛项名称:大数据技术与应用 

赛项组别:高职学生组

二、竞赛目的

本赛项的设置,是为适应大数据开发应用产业对高素质技术技能型人才的职业需求,围绕大数据处理相关算法应用与软件工具运用。赛项选取典型的大数据应用业务分析应用场景,重点检验参赛选手掌握大数据业务分析方法和数据分析能力、了解Hadoop基本配置及相关工具软件解决具体业务问题的能力,激发学生对大数据知识和技术的学习兴趣,提升学生职业素养和职业技能,努力为中国大数据应用产业发展储备及输送新鲜血液。

通过举办本赛项,可以搭建校企合作的平台,提升高职电子信息类及相关专业毕业生能力素质,满足企业用人需求,促进校企合作协同育人,对接产业发展,实现行业资源、企业资源与教学资源的有机融合,使高职院校在专业建设、课程建设、人才培养方案和人才培养模式等方面,跟踪社会发展的最新需要,缩小人才培养与行业需求差距,引领职业院校专业建设与课程改革。

三、竞赛内容

赛项以大数据技术与应用为核心内容和基础,重点考察参赛选手在Hadoop平台环境下,对于大规模并行数据处理以及内存计算技术的应用能力。具体包括:

1.Hadoop平台环境部署与基本配置。

2.综合利用numpy、pandas、matplotlib、MapReduce技术、分布式存储系统HDFS、分布式计算框架MapReduce/Yarn、数据仓库Hive、分布式数据库Hbase、Python等开发语言工具和技术,匹配和连接数据源,实现大数据的采集,提取、清洗、转换、分析、挖掘操作,产生分析结果,并且实现可视化呈现。

3.依据竞赛应用需求和分析结果,完成数据分析报告的编写。

竞赛内容构成如下:

考核环节考核知识点和技能点
Hadoop平台

安装部署

Hadoop平台安装部署和基本配置。

HDFS常用操作命令(查询文件类别、上传、删除文件、查询HDFS基本统计信息)。

Hadoop平台常见基础组件应用。
数据抓取常见数据类型的数据抓取,实现数据抓取、解析和初步整理,常见的网络数据、数据文件、关系数据库等数据源的数据抓取

掌握Hive数据仓库导入、导出以及同Hadoop数据文件的转换,掌握Hive数据管理常用命令。

能够通过Python编程,使用分布式计算机制实现数据的抓取。

数据清洗、整理、计算和表达基于MapReduce的HDFS文件系统的文件数据的数据查询、整理和计算。

应用Python编程工具,实现给定数据源的采集,提取、清洗、转换、分析、挖掘等操作。实现给定数据源的预处理。
利用Python编程,实现数据的整理、计算和表达等知识技能,并能够对相关知识技能扩展应用。
综合分析综合应用数据抓取、清洗、整理、计算和表达等相关知识及技术,使用Python编程工具,实现对提供的数据源分析、展现,根据展现结果得出结论,并对结论进行分析,形成分析报告。
竞赛各阶段分值权重如下:

序号分值权重
Hadoop平台安装部署权重20%
数据抓取权重20%
数据清洗、整理、计算和表达权重25%
综合分析权重30%
团队分工明确合理、操作规范、文明竞赛权重5%
四、竞赛方式

大数据技术与应用赛项为团体赛。每支参赛队由3名参赛选手组成,须为同校在籍学生,不允许跨校组队,其中队长1名。

竞赛时间为4个小时,竞赛连续进行。

五、竞赛流程

日期时间事项
比赛前一天8:00—15:00

各参赛队报到

15:00—16:00赛前裁判会议

16:00—16:30各参赛校领队会,抽签决定顺序号

16:30—17:00熟悉赛场
比赛当天7:50—8:20检录入场、抽签决定工位号
8:20—8:30试题发放
8:30—12:30正式比赛
12:30—18:00成绩评定
18:00公布结果
六、竞赛规则    

1. 参赛选手须为3名在籍学生。

2. 严禁参赛选手、赛项裁判、工作人员私自携带通讯、摄录设备进入比赛场地。

3. 竞赛工位通过抽签决定。

4. 竞赛所需的硬件设备、系统软件和辅助工具由组委会统一准备,参赛选手不得自带硬件设备、软件、移动存储、辅助工具、移动通信等进入竞赛现场。

5. 参赛队自行决定选手分工、工作程序和时间安排。

6.所有参赛选手都必须携带参赛证件进行检录。参赛证件包含身份证、学生证、参赛证。

7. 参赛队在赛前10分钟进入竞赛工位并领取竞赛任务,竞赛正式开始后方可展开相关工作。参赛选手迟到超过30分钟不得入场。

8. 比赛期间,不安排指导教师进行现场指导。

9. 竞赛过程中,选手须严格遵守操作规程,确保人身及设备安全,并接受裁判员的监督和警示。如遇到设备或软件等故障,参赛选手应当举手示意;现场裁判应及时予以解决。如确因计算机软件或硬件故障,致使操作无法继续的,由现场裁判协同技术支持人员共同解决。

10. 若因选手因素造成设备故障或损坏,无法继续竞赛的,由现场裁判报告裁判长。裁判长有权决定中止该队竞赛;若因非参赛选手个人因素造成设备故障,由裁判长视具体情况做出裁决。

11. 竞赛结束或提前完成后,参赛队要确认已成功提交所有竞赛文档,由参赛队队长签字(签工位号)确认,参赛队在确认后不得再进行任何操作,经现场裁判确认后方可离开赛场。

12. 大赛最终成绩由大赛组委会公示后公布,任何组织和个人,不得擅自对大赛成绩进行涂改、伪造或用于欺诈等违法犯罪活动。

13. 其它未尽事宜,将在赛前向各领队做详细说明。

七、技术规范

1. 竞赛项目基础标准

标 准内 容
GB/T 11457-2006信息技术、软件工程术语 
GB8566-88计算机软件开发规范
GB/T 12991-2008信息技术数据库语言SQL第1部分:框架
20120567-T-469信息技术云数据存储和管理第1部分:总则
20120568-T-469信息技术云数据存储和管理第2部分:基于对象的云存储应用接口
GB/T 21025-2007XML使用指南
GB/T 20009-2005信息安全技术数据库管理系统安全评估准则 已发布

GB/T 20273-2006信息安全技术数据库管理系统安全技术要求
20100383-T-469信息技术安全技术信息安全管理体系实施指南
2. 软件开发标准

标 准内 容
GB/T 8566 -2001信息技术 软件生存周期过程 
GB/T 15853 -1995软件支持环境 
GB/T 14079 -1993软件维护指南
GB/T 17544-1998信息技术 软件包 质量要求和测试
八、技术平台

(一)服务器环境

1.操作系统(Linux)

2.大数据实训管理系统

3.Web站点

(二)客户端环境

 1.操作系统(windows7)

 2.开发语言(Python2.7.13)

 3.数据分析工具(Pandas 0.9.12)

 4.Python集成开发环境(pycharm-community-2016.3.2)

 5.浏览器(Chrome )

 6.文档编辑器(WPS或office)                                                 

(三)竞赛技术平台

比赛技术平台:《北京四合天地大数据实训管理系统》。

九、成绩评定

评分标准:

考核环节考核知识点和技能点分值
Hadoop平台

安装部署

Hadoop平台安装部署和基本配置。20
HDFS常用操作命令(查询文件类别、上传、删除文件、查询HDFS基本统计信息)。
Hadoop平台常见基础组件应用。
数据抓取常见数据类型的数据抓取,实现数据抓取、解析和初步整理,常见的网络数据、数据文件、关系数据库等数据源20
掌握数据仓库导入、导出以及同Hadoop数据文件的转换,掌握Hive数据管理常用命令。
能够通过Python编程,使用分布式计算机制实现数据的抓取。
数据清洗、整理、计算和表达基于MapReduce的HDFS文件系统的文件数据的数据查询、整理和计算。25
应用Python编程工具,实现给定数据源的采集,提取、清洗、转换、分析、挖掘等操作。实现给定数据源的预处理。
利用Python编程,实现数据的整理、计算和表达等知识技能,并能够对相关知识技能扩展应用。
综合分析综合应用数据抓取、清洗、整理、计算和表达等相关知识及技术,使用Python编程工具,实现对提供的数据源分析、展现,根据展现结果得出结论,并对结论进行分析,形成分析报告。30
团队分工明确合理、操作规范、文明竞赛5
成绩评定是根据竞赛考核目标、内容对参赛队或选手在竞赛过程中的表现和最终成果做出评价。本赛项的评分方法为现场评分和结果评分,现场评分:现场裁判根据参赛队的操作规范以及综合表现情况进行评分;结果评分:依据赛项评价标准,对参赛选手提交的竞赛成果进行评分。

所有的评分表、成绩汇总表备案以供核查,最终的成绩由裁判长进行审核确认并上报大赛组委会。

竞赛成绩经复核无误后,经裁判长、监督人员审核签字后由大赛组委会公布。

十、奖项设定

按照山西省技能大赛相关文件中的奖励办法,竞赛奖项设置个人奖,按总得分,进行排序(总分相同名次并列),设定一等奖10%,二等奖20%,三等奖30%,并颁发相应证书。

十一、赛项安全

赛事安全是技能竞赛工作顺利开展的先决条件,是赛事筹备和运行工作必须考虑的核心问题。大赛组委会应采取切实有效措施保证大赛期间参赛选手、指导教师、裁判员等人员的人身安全。

(一)比赛环境

1.所有参赛人员必须凭有效证件进入场地,防止无关人员进入发生意外事件。比赛现场内应参照相关职业岗位的要求为选手提供必要的劳动保护。在具有危险性的操作环节,裁判员要严防选手出现错误操作。

2.严格控制与参赛无关的易燃易爆以及各类危险品进入比赛场地,不许随便携带书包进入赛场。

(二)组队责任

1.各学校组织代表队时,须安排为参赛选手购买大赛期间的人身意外伤害保险。

2.各学校代表队组成后,须制定相关管理制度,并对所有选手、指导教师进行安全教育。

3.各参赛队须加强对参与比赛人员的安全管理,实现与赛场安全管理的对接。

(三)应急处理

比赛期间发生意外事故,发现者应第一时间报告大赛组委会,同时采取措施避免事态扩大。大赛组委会应立即启动预案予以解决。赛项出现重大安全问题可以停赛。

(四)处罚措施

1.因参赛队伍原因造成重大安全事故的,取消其获奖资格。

2.参赛队有发生重大安全事故隐患,经赛场工作人员提示、警告无效的,可取消其继续比赛的资格。

3.赛事工作人员违规的,按照相应的制度追究责任。情节恶劣并造成重大安全事故的,由司法机关追究相应法律责任。

十二、竞赛须知

(一)参赛队须知

1.参赛队名称:每个院校不超过2个参赛队,统一使用规定的学校代表队名称,每个参赛队按照学校参赛队顺序编号;

2.参赛队组成:每支参赛队由3名参赛选手组成,须为同校在籍学生,其中队长1名。每支参赛队可配2名指导教师。

3.各参赛院校应指定1名负责人任赛项领队,全权负责参赛事务的组织、协调和领导工作。

4.参赛选手及指导教师在报名获得确认后,原则上不再更换。如在筹备过程中,参赛选手因故不能参赛,须由所在上级教育主管部门于赛项开赛10个工作日之前出具书面说明,经大赛组委会办公室核实后予以更换。竞赛开始后,参赛队不得更换参赛选手,允许队员缺席比赛。不允许更换指导教师,允许指导教师缺席比赛现场。

5.参赛队按照大赛赛程安排,凭大赛组委会颁发的参赛证和有效身份证件参加比赛及相关活动。

6.大赛组委会统一安排各参赛队在比赛前一天进入赛场熟悉环境和设施情况。

7.参赛队选手、领队和指导教师要有良好的职业道德,严格遵守比赛规则和比赛纪律,服从裁判,尊重裁判和赛场工作人员,自觉维护赛场秩序。

8.领队应负责赛事活动期间本队所有选手的人身及财产安全,如发现意外事故,应及时向大赛组委会报告。

(二)领队、指导教师须知

1.严格遵守赛场的各项规定,服从裁判,文明竞赛。如发现弄虚作假者,取消参赛资格,名次无效。

2.领队和指导教师务必带好有效证件,在活动过程中佩戴“指导教师证”参加竞赛相关活动。

3.各代表队领队要坚决执行赛项的各项规定,加强对参赛人员的管理,做好赛前准备工作,督促选手带好证件等竞赛相关材料。

4.在比赛期间要严格遵守比赛规则,不得私自接触裁判人员。

5.竞赛过程中,未经裁判许可,领队、指导教师及其他人员一律不得进入竞赛现场。

6.如对竞赛过程有疑义,由领队和指导教师负责以书面形式向大赛仲裁委员会反映,但不得影响竞赛进行。

7.对申诉的仲裁结果,领队要带头服从和执行,并做好选手工作。参赛选手不得因申诉或对处理意见不服而停止竞赛,否则以弃权处理。

8.领队和指导老师应及时查看大赛专用网页有关赛项的通知和内容,认真研究和掌握本赛项竞赛的规程、技术规范和赛场要求,指导选手做好赛前的一切技术准备和竞赛准备。

(三)参赛选手须知

1.参赛选手应严格遵守赛场规章、操作规程和工艺准则,保证人身及设备安全,接受裁判员的监督和警示,文明竞赛。

2.参赛选手应按照规定时间抵达赛场,凭身份证、学生证,以及统一发放的参赛证,完成入场检录、抽签确定竞赛工位号,不得迟到早退。

3.参赛选手进入赛场前,须将身份证、学生证交由检录人员统一保管,不得带入场内。参赛证始终佩戴,以备检查。

4.参赛选手凭竞赛工位号进入赛场,不允许携带任何书籍和其他纸质资料,竞赛统一提供草稿纸。不允许携带任何电子设备及通信工具和存储设备(如U盘),竞赛统一提供计算机以及应用软件。

5.参赛选手应在规定的时间段进入赛场,认真核对竞赛工位号,在指定位置就座。

6.参赛选手入场后,赛场工作人员与参赛选手共同确认操作条件及设备状况,填写相关确认文件,并由参赛队长确认签字(签竞赛工位号)。

7.参赛选手在收到开赛信息前不得启动操作。在竞赛过程中,确因计算机软件或硬件故障,致使操作无法继续的,经裁判长确认,予以启用备用计算机。

8.参赛选手需及时保存工作记录。对于因各种原因造成的数据丢失,由参赛选手自行负责。

9.参赛队所提交的答卷采用竞赛工位号进行标识,不得出现地名、校名、姓名、参赛证编号等信息,否则取消竞赛成绩。

10.竞赛过程中,因严重操作失误或安全事故不能进行比赛的(例如因人为操作原因发生短路导致赛场断电的、造成设备不能正常工作的),现场裁判员有权中止该队比赛。

11.参赛期间,选手连续工作。选手休息、入厕等时间均计算在比赛时间内。

12.在参赛期间,选手应注意保持工作环境及设备摆放符合企业生产“5S”(即整理、整顿、清扫、清洁和素养)的原则,如果过于脏乱,裁判长有权酌情处置。 

13.参赛期间如遇非人为因素造成的设备故障,经裁判确认后,可向裁判长申请补足排除故障的时间。

14.参赛期间,选手如确因不可抗因素需要离开赛场的,须向现场裁判员举手示意,经裁判员许可并完成记录后,方可离开。

15.竞赛操作结束后,参赛选手需要根据任务书要求,将相关成果文件拷贝至U盘,填写结束比赛相关确认文件,并由现场裁判和参赛队长共同签字确认竞赛相关确认文件及U盘内容(签竞赛工位号)。因参赛选手未能按要求,将相应的文档等上传到平台指定位置及U盘的,竞赛成绩计为零分。

16.参赛队提前结束比赛,应提交竞赛结果,向现场裁判举手示意,由裁判员记录竞赛终止时间,由现场裁判和参赛队长共同签字确认后可提前离开。

17.在赛事期间,未经组委会批准,参赛选手不得接受其他单位和个人进行的与竞赛内容相关的采访。参赛选手不得将竞赛的相关信息私自公布。

18.符合下列情形之一的参赛选手,经裁判组裁定后中止其竞赛:

(1)不服从裁判员/监考员管理、扰乱赛场秩序、干扰其他参赛选手比赛,裁判员应提出警告,二次警告后无效,或情节特别严重,造成竞赛中止的,经裁判长确认,中止比赛,并取消竞赛资格和竞赛成绩。

(2)竞赛过程中,由于选手人为造成计算机、仪器设备及工具等严重损坏,负责赔偿其损失,并由裁判组裁定其竞赛结束与否、是否保留竞赛资格、是否累计其有效竞赛成绩。

(3)竞赛过程中,产生重大安全事故、或有产生重大安全事故隐患,经裁判员提示没有采取措施的,裁判员可暂停其竞赛,由裁判组裁定其竞赛结束,保留竞赛资格和有效竞赛成绩。

(四)工作人员须知

1.竞赛现场设现场裁判组,裁判要秉公裁判,如遇疑问或争议,须请示裁判长裁决,裁判长的决定为现场最终裁定。

2.赛场工作人员由大赛组委会统一聘用并进行工作分工,进入竞赛现场须佩戴大赛组委会统一提供的胸牌。

3.赛场工作人员需服从大赛组委会的管理,严格执行赛项各项比赛规则,执行各项工作安排,积极维护好赛场秩序,坚守岗位,为赛场提供有序的服务。

4.赛场工作人员进入现场,不得携带任何通讯工具或与竞赛无关的物品。

5.赛场工作人员在竞赛过程中不回答选手提出的任何有关比赛技术问题,如遇争议问题,应及时报告裁判长。

十三、申诉与仲裁

本赛项在比赛过程中若出现有失公正或有关人员违规等现象,参赛队领队可在比赛结束后2小时之内向仲裁组提出书面申诉。

书面申诉应对申诉事件的现象、发生时间、涉及人员、申诉依据等进行充分、实事求是的叙述,并由领队亲笔签名。非书面申诉不予受理。

赛项设仲裁工作组。赛项仲裁工作组在接到申诉后的2小时内组织复议,并及时反馈复议结果。仲裁工作组的仲裁结果为最终结果。

    下载本文

显示全文
专题