1.Spark 项目运行结果截图
2.接口测试结果截图
3.数据可视化结果网页截图
4.分别导出Spark项目,后端项目的Zip(压缩包)【前端项目不用导出】
注意:
1.所有截图请统一粘贴到一个 Word 文件答题模板中,命名为:
提交截图_姓名_班级.docx;2.最终考生提交内容打包为一个总压缩包,命名格式如下:
张三-大数据高23-1班-大数据实训.rar
启动 Hadoop 分布式文件系统(HDFS)与 YARN;
启动 Hive Metastore 与 HiveServer2 服务。
启动 HDFS 成功:4分
启动 YARN 成功:2分
启动 Hive Metastore 成功:2分
启动 HiveServer2 成功:2分
x
创建数据库 salesdb;
创建表 salesinfo,包含订单与分类字段;
从本地路径 /opt/exam_spark/sales_data.csv 加载数据;
查询前 3 行,验证导入是否成功。
数据库创建成功:2分
表结构正确(字段和类型匹配):4分
数据加载语句正确:2分
查询成功显示数据:2分
创建 Scala 类 CategorySalesStats,路径为:
src/main/scala/org/example/CategorySalesStats.scala
使用 Spark SQL 分析 Hive 表 salesinfo:
统计2023年各类产品的销售数量与销售额;
按销售额升序排序;
将结果保存至 Hive 表 category_sales_result。
SparkSession 初始化和 Hive 支持:5分
SQL 查询语句编写正确:10分
查询结果正确展示:10分
写入 Hive 表:10分
程序结构规范、能运行无误:5分
创建 Spring Boot 项目 ,名称为Backend,并导入 Pom.xml 文件;
创建类 CategoryController,路径为:
src/main/java/com/example/backend/controller/CategoryController.java
使用 Spring Boot 创建接口 /category-sales,请求方式为 GET;
在接口中通过 JDBC 查询 Hive 表 category_sales_result;
查询字段包括:category, order_count, total_quantity, total_sales;
将结果以 JSON 列表的形式返回,每条记录包含上述字段键值对。
连接 Hive 成功:5分
正确输出 JSON:5分
创建 VUE 项目 ,名称为Frontend;
创建组件文件 components/CategoryStatsChart.vue 和主页面 App.vue,配置代理文件 vite.config.js;
使用 Vue3 + ECharts 创建饼图组件;
从接口 /api/category-sales 获取各产品分类的销售额数据;
展示各分类销售额在总销售中的占比情况,并以饼图形式进行可视化展示(单位:万元)。
网页(标签页)的标题为”数据大屏+个人姓名“
页面的副标题是考生的“班级 + 姓名“
表格的样式与内容要求与图示一致
获取数据成功:5分
图表加载正确:15分
配置美观清晰:5分
页面结构完整:5分
vite.config.js
App.vue
CategoryStatsChart.vue
