赛题讲解培训实录!2025年(第18届)中国大学生计算机设计大赛大数据主题赛“数据解读科技创新与社会变革”

B站影视 港台电影 2025-03-11 14:48 2

摘要:2025 年(第 18 届)中国大学生计算机设计大赛大数据主题赛 “数据解读科技创新与社会变革” 赛题已于和鲸平台正式开赛。开赛以来,已吸引了来自全国各高校的 600+ 优秀本科生积极响应,完成报名工作。为帮助参赛选手更好地理解赛题、顺利参赛,和鲸配合赛道组织

导读

2025 年(第 18 届)中国大学生计算机设计大赛大数据主题赛 “数据解读科技创新与社会变革” 赛题已于和鲸平台正式开赛。开赛以来,已吸引了来自全国各高校的 600+ 优秀本科生积极响应,完成报名工作。为帮助参赛选手更好地理解赛题、顺利参赛,和鲸配合赛道组织单位特为参赛选手提供两场线上培训。

首场培训“赛题破局·参赛启航专场”邀请了中国人民大学信息管理学院副教授黄科满老师进行赛题解读;同时,和鲸科技的竞赛专家韦琪也为大家详细介绍了和鲸平台的操作流程。现特发布本篇赛题解读与平台使用实录整理,以期为各位同学顺利参赛提供支持。


黄科满,博士,现任中国人民大学信息学院副教授,中国人民大学吴玉章青年学者,麻省理工斯隆管理学院网络安全研究中心兼职研究员。长期围绕数字创新生态、网络安全和数据治理开展多学科交叉研究,目前已经在计算机、商科和政策等跨学科领域相关主流期刊、会议和杂志发表论文 70 余篇,部分相关研究成果被国家部委和国内外企业所采纳,主持和参与国家级项目多项。

韦琪,和鲸科技数据科学竞赛专家。与众多高校、企业深度沟通,熟悉数据人才能力培养全流程。善于结合高校教学内容策划数据创新类赛事,将学生置于真实行业问题锻炼实践能力。竞赛组织与评审工作多维、中肯,注重选手综合素质培养。

以下是实录整理内容。

01

赛题核心剖析:聚焦问题,驱动创新

中国人民大学信息学院副教授黄科满老师就本次大数据应用主题赛的赛题进行了深入解读。他强调,赛事旨在通过真实问题训练学生的数据思维,这也是本科人才培养的重要内容。

01 赛题解读

大数据应用赛分为实践赛和主题赛,本次培训聚焦的主题赛有着独特的要求与特色。与盲目进行数据分析不同,主题赛要求学生围绕特定主题展开,每个主题都有相应的数据支持。

本届赛事大数据主题赛的赛题是 “数据解读科技创新与社会变革”,科技创新与社会变革紧密相连,是国家发展的重要战略,与数字时代的发展息息相关。在研究过程中,不能仅仅从数据到数据进行表面分析,而要深入思考,寻找有效的、聚焦的维度,结合数据来回答核心问题。例如,在探讨国内独角兽企业数量少的原因,以及中国大模型发展水平相关争议时,学生可以利用赛事提供的数据,深入挖掘数据背后的联系,用数据驱动分析过程,形成具有深度和说服力的主题分析报告。

左右滑动查看更多

02 数据说明

在数据使用方面,赛事提供了丰富多样的数据集,涵盖科技研发和创新数据、高新技术产业数据、各国经济发展数据等多个维度,这些数据从不同角度反映了科技发展与社会变革的关系。同时也鼓励选手在参赛过程中补充其他数据集以充实数据分析。但学生需要注意,要有效设计分析维度和视角,挑选合适的数据,避免将大量数据简单罗列成表格,却无法得出有价值的结论。

03 作品提交

对于作品的提交,学生需要准备两部分内容。一是主题分析报告,这要求学生围绕选定主题,清晰地阐述从哪些维度展开分析,每个维度对应的数据情况,以及这些数据所反映的现象和内在联系,形成完整的叙事逻辑。二是数据处理源程序,学生要展示数据处理的代码,包括数据清洗、处理、分析的过程,以及最终得出的结论。若使用了额外数据,需注明数据来源,确保在和鲸平台上能够有效复现。

04 案例解读

黄科满老师还通过两个实际案例,进一步阐释了如何运用数据思维解决社会问题。

第一个案例展示了《Nature》一篇刊文在研究人工智能在气候变化场景中的作用时,先以专利数据为分析维度,围绕核心问题筛选相关数据,再通过对数坐标处理数据以更好地展现趋势,并深入分析不同领域使用人工智能的差异,层层递进,从而形成了完整的故事线。

另一个案例则是通过分析微博上关于气候变化的讨论数据,探究公众对碳中和话题的态度、人群分布及变化,以及影响共识形成的因素,同样展现了清晰的故事线和以问题为导向的数据处理思路。

这两个案例都体现了数据、问题和结论之间的迭代循环关系。以此为例,黄老师鼓励学生在参赛过程中一定要充分发挥创造力,深入思考,培养与展现数据思维。

02

参赛平台与流程详解

和鲸平台助力赛事之旅

和鲸科技的竞赛经理韦琪为大家详细介绍了参赛平台的使用方法和参赛流程。

下方主要列举了一些必要的、常规性的步骤与平台使用方法,更多教程可在赛事页面查看和鲸平台的用户手册。

Step 1 在和鲸社区完成报名

作为赛道平台,选手首先需要在和鲸社区平台上完成报名。报名前需要注册和鲸平台账号,可通过微信扫码、短信登录、密码登录等方式注册。报名时选手务必确保填写的信息真实有效,学生选择 “学生” 身份填写,若有多位指导老师参与,相关信息可用顿号分隔开提交。

Step 2 创建项目

报名完成后,选手需要在平台创建项目(作品)。

在项目创建页面,选手可以填写项目名称、短描述等基本信息,同时可选择挂载赛事提供的约十个数据集,以满足自己的研究需求。项目创建支持使用 python 或 R 语言,既可在平台的 notebook 中直接新建,也可上传本地代码文件。创建好项目后,则会进入项目运行界面。该界面提供了数据分析的常用功能,如查看本地文件存储与调用、挂载数据集及读取路径、调用和鲸平台提供的常用代码等。选手可以将项目生成版本,分享给队友或用于作品提交。每次代码修改后最好及时生成最新版本。

为保证比赛公平,和鲸平台统一提供了 2C8G 的算力资源,联网即可使用。环境方面,平台提供了涵盖数据分析和机器学习工具包的基础镜像环境,选手也可根据需求构建自己的环境,在基础镜像上再叠加所需工具包。编程过程中,界面右上角和左下角能实时观察到资源接入和镜像准备情况,下方检测区则可查看项目运行目录和实时情况,平台提供的磁盘空间支持文件读写。

Step 3 数据操作

在数据相关操作方面,赛事提供的数据集存储在共享空间内,学生可在编程页面查看并调用。韦经理还同时演示了新建数据集、在项目中添加数据集时、获取数据挂载路径等相关操作。

和鲸平台也提供项目协作功能方便队友之间协作创作作品,选手们可根据协作需求为队友开放作品权限。队友收到共享内容后,可以在版本列表处申请提交合并。

Step 4 作品提交

作品提交环节需要上传两份材料。

首先需在比赛详情页上传数据分析报告;其次选择数据处理源程序的最终版本 Notebook 提交,提交后会生成提交记录和作品链接。

提交时要注意检查 Notebook 是否为最终版本,多次提交时需要确保复制的链接是最新版本链接。

03

赛题讲解培训回放及

往届优秀选手经验分享直播预告

此实录为精简部分,您可在赛事主页查看培训回放(报名参赛后方可查看,建议 pc 端访问)。

和鲸始终贯彻大赛“以赛促学、以赛促教、以赛促创”的精神与理念,为参赛师生提供多层面、多角度、全方位的工作支持,希望学生们能够充分利用这些信息,在比赛中发挥出自己的最佳水平,用数据驱动创新,在大赛中取得优异成绩。衷心期待本届中国大学生计算机设计大赛能够涌现出更多的优秀作品。

承办:华东理工大学、东华大学、华东师范大学

协办:中国人民大学

上海和今信息科技有限公司

来源:和鲸

相关推荐