李翔-大数据技术

Big data technology!

练习题D

《大数据综合项目实训》练习 D


提交材料清单

  1. 截图1:在slave1验证Kafka实时数据流动

  2. 截图2:DESC 查询表结构

  3. 截图3:执行Flink后,MySQL 查询到写入数据

  4. 截图4:在浏览器访问接口返回正确 JSON 数据

  5. 截图5:浏览器能正确显示图表

  6. 项目上传:分别导出 Flink 项目、前后端项目的 Zip(压缩包)上传


一、Flink 环境启动

【题目要求】

  • 启动 ZooKeeper 集群;

  • 启动 Kafka 服务;

  • 启动 Flink 集群;

  • 运行设备数据模拟器,确认 Kafka Topic 有数据流入。

【提交截图】

  • 截图1:在slave1验证Kafka实时数据流动的截图

【操作步骤】

# 在 master/slave1/slave2 分别执行,启动 ZooKeeper
zkServer.sh start

# 检查 ZooKeeper 状态(需看到 Mode: leader 或 follower)
zkServer.sh status

# 在 master/slave1/slave2 分别执行,启动 Kafka
kafka-server-start.sh -daemon /opt/apps/kafka/config/server.properties

# 启动 Flink 集群
start-cluster.sh

# 运行数据模拟器,持续向 Kafka 写入设备状态数据
python /opt/datas/01_device_status_sim.py | \
  kafka-console-producer.sh --broker-list master:9092 --topic device_status_topic

# 在slave1,验证实时数据流动
kafka-console-consumer.sh --bootstrap-server master:9092 --topic device_status_topic

二、MySQL 数据库初始化

【题目要求】

  • 创建数据库 bigdata1/bigdata2/bigdata3

  • 创建表 rt_kpi_d,用于存储 Flink 实时统计结果;

  • 查询表结构,验证创建成功。

【提交截图】

  • 截图2:DESC 查询表结构的截图

【操作步骤】

-- 进入数据库
mysql -uroot -p123456

-- 删除数据库
DROP DATABASE IF EXISTS bigdata1;

-- 创建数据库【注意:按班级建数据库名称:bigdata1/bigdata2/bigdata3】
CREATE DATABASE IF NOT EXISTS bigdata1
  CHARACTER SET utf8mb4;

-- 选择数据库
USE bigdata1;

-- 创建 Flink 写入的结果表
DROP TABLE IF EXISTS rt_kpi_d;

CREATE TABLE rt_kpi_d (
    window_start    DATETIME  NOT NULL ,
    device_count   INT       NOT NULL ,
    PRIMARY KEY (window_start)
) ENGINE=InnoDB
DEFAULT CHARSET=utf8mb4;

-- 查询表结构
DESC rt_kpi_d;

三、Flink 实时统计任务

【题目要求】

  • 在 IDEA 中创建 Maven 项目 flink-kpi-job,导入考场提供的 pom.xml

  • 创建 FlinkJobD.java ;路径:src/main/java/com/exam/flink/FlinkJobD.java

  • 5 秒滚动窗口内统计离线(status=0)的设备数,写入 MySQL;

  • 等待约 30 秒后,查询 MySQL 的 rt_kpi_d 表,验证数据写入成功。

【提交截图】

  • 截图3:执行Flink后,MySQL 查询到写入数据的截图

【操作步骤】

FlinkJobD.java

package com.exam.flink;

import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.bridge.java.StreamTableEnvironment;

public class FlinkJobD {

    static final String KAFKA_BROKERS = "master:9092";
    static final String MYSQL_URL     =
            "jdbc:mysql://master:3306/bigdata1" +
            "?useSSL=false&serverTimezone=Asia/Shanghai";
    static final String MYSQL_PASS    = "123456";

    public static void main(String[] args) throws Exception {

        // 步骤1:屏蔽 Flink 内部日志,只输出 ERROR 级别
        System.setProperty("org.slf4j.simpleLogger.defaultLogLevel", "error");

        // 步骤2:创建流执行环境,并行度设为 1
        StreamExecutionEnvironment env =
                StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        // 步骤3:在流环境上构建 Table/SQL 环境
        StreamTableEnvironment tEnv = StreamTableEnvironment.create(env);

        // 步骤4:注册 Kafka 源表,event_time 转换为 TIMESTAMP 并声明 5 秒水位线
        tEnv.executeSql(
                "CREATE TABLE device_status (" +
                "  device_id    STRING," +
                "  status       INT," +
                "  temperature  DOUBLE," +
                "  `load`       DOUBLE," +
                "  voltage      DOUBLE," +
                "  event_time   STRING," +
                "  ts AS TO_TIMESTAMP(event_time)," +
                "  WATERMARK FOR ts AS ts - INTERVAL '5' SECOND" +
                ") WITH (" +
                "  'connector'                    = 'kafka'," +
                "  'topic'                        = 'device_status_topic'," +
                "  'properties.bootstrap.servers' = '" + KAFKA_BROKERS + "'," +
                "  'properties.group.id'          = 'exam_group_d'," +
                "  'scan.startup.mode'            = 'latest-offset'," +
                "  'format'                       = 'json'" +
                ")"
        );

        // 步骤5:注册 MySQL 结果表,window_start 作为逻辑主键支持 upsert
        tEnv.executeSql(
                "CREATE TABLE rt_kpi_d (" +
                "  window_start   TIMESTAMP(3)," +
                "  device_count  BIGINT," +
                "  PRIMARY KEY (window_start) NOT ENFORCED" +
                ") WITH (" +
                "  'connector'  = 'jdbc'," +
                "  'url'        = '" + MYSQL_URL + "'," +
                "  'table-name' = 'rt_kpi_d'," +
                "  'username'   = 'root'," +
                "  'password'   = '" + MYSQL_PASS + "'" +
                ")"
        );

        // 步骤6:5 秒滚动窗口内统计离线(status=0)的设备数,写入 MySQL
        tEnv.executeSql(
                "INSERT INTO rt_kpi_d " +
                "SELECT " +
                "  TUMBLE_START(ts, INTERVAL '5' SECOND) AS window_start, " +
                "  COUNT(CASE WHEN status = 0 THEN device_id END) AS device_count " +
                "FROM device_status " +
                "GROUP BY TUMBLE(ts, INTERVAL '5' SECOND)"
        );

        System.out.println("FlinkJobD 已启动:离线设备数实时统计");
        System.out.println("统计口径: 每 5 秒统计 status = 0 的设备数");
        System.out.println("写入 MySQL 表: bigdata1.rt_kpi_d");
        System.out.println("请等待约 30 秒后查询 MySQL 验证结果。");
    }
}

MySQL 验证命令:

USE bigdata1;

SELECT * FROM rt_kpi_d ORDER BY window_start DESC LIMIT 10;



四、Spring Boot 接口开发

【题目要求】

  • 创建 Spring Boot 项目,名称为 Backend,并导入 pom.xml 文件;

  • 配置 application.properties 参数,连接数据库;

  • 创建类 KpiControllerD,路径为:src/main/java/com/exam/backend/controller/KpiControllerD.java

  • 使用 Spring Boot 创建接口 /kpi-d,请求方式为 GET

  • 在接口中通过 JDBC 查询 MySQL 表 rt_kpi_d

  • 查询最新一条记录的 window_startdevice_count

  • 将查询结果以 JSON 对象形式返回。

【提交截图】

  • 截图4:在浏览器访问接口返回正确 JSON 数据截图

【操作步骤】

application.properties 配置文件:

# ===== 服务器配置 =====
server.address=0.0.0.0
server.port=8080

# MySQL 配置【注意数据库更改班级】
spring.datasource.url=jdbc:mysql://master:3306/bigdata1?useSSL=false&serverTimezone=Asia/Shanghai
spring.datasource.username=root
spring.datasource.password=123456
spring.datasource.driver-class-name=com.mysql.cj.jdbc.Driver

KpiControllerD

package com.exam.backend.controller;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RestController;
import java.sql.*;
import java.util.*;

// @RestController:标识这是一个 REST 控制器,方法返回值会直接序列化成 JSON 返回给前端
@RestController
public class KpiControllerD {

    // @GetMapping:映射 HTTP GET 请求,访问路径为 /kpi-d
    @GetMapping("/kpi-d")
    public Map<String, Object> getKpiD() {
        // 只返回一条记录(一个 Map),供仪表盘展示当前值;LinkedHashMap 保证 JSON 字段顺序
        Map<String, Object> result = new LinkedHashMap<>();
        try {
            // 加载 MySQL JDBC 驱动类
            Class.forName("com.mysql.cj.jdbc.Driver");

            // 建立数据库连接:连接 master 节点的 bigdata1 库,关闭 SSL,设置时区为上海
            Connection conn = DriverManager.getConnection(
                    "jdbc:mysql://master:3306/bigdata1?useSSL=false&serverTimezone=Asia/Shanghai",
                    "root", "123456"); // 数据库账号 root / 密码 123456

            // 创建 Statement 对象,用于执行 SQL 语句
            // 取最新一条数据,供仪表盘展示当前值
            Statement stmt = conn.createStatement();

            // 执行查询:按 window_start 倒序,只取最新的 1 条(LIMIT 1)
            ResultSet rs = stmt.executeQuery(
                    "SELECT window_start, device_count " +
                    "FROM rt_kpi_d ORDER BY window_start DESC LIMIT 1");

            // 只有一条结果,用 if 判断是否查到(不同于多条数据用 while 循环遍历)
            if (rs.next()) {
                result.put("window_start",  rs.getString("window_start"));  // 窗口开始时间
                result.put("device_count", rs.getInt("device_count"));    // 离线设备计数值
            }

            // 依次关闭资源,释放数据库连接(注意:异常时不会执行,存在泄漏风险)
            rs.close();
            stmt.close();
            conn.close();
        } catch (Exception e) {
            // 捕获所有异常并打印堆栈信息(生产环境建议用日志框架记录)
            e.printStackTrace();
        }
        // 返回结果(单条记录),Spring 自动转成 JSON
        return result;
    }
}

【接口测试】

浏览器访问 http://localhost:8080/kpi-d



五、Vue + ECharts 数据可视化

【题目要求】

  • 创建 Vue 项目,名称为 Frontend

  • 创建组件 components/ChartD.vue 和主页面 App.vue,配置代理文件 vite.config.js

  • 使用 Vue3 + ECharts 展示仪表盘;

  • 从接口 /api/kpi-d 获取最新一条数据;

  • 仪表盘展示当前窗口的离线设备数量,范围 0~60;

  • 网页标签页标题为"数据大屏";

【提交截图】

  • 截图5:浏览器能正确显示图表截图

【操作步骤】

1. 创建 Vue 项目

# 切换到 D 盘
D:

# 进入代码存放文件夹【注意切换班级】
cd D:\bigdata1\test

# 创建 Vue3 项目
npm create vite@latest Frontend -- --template vue

# 进入项目并安装依赖
cd Frontend
npm install

# 安装前后端通信库和图表库
npm i axios echarts

2. 编写代码

vite.config.js
import { defineConfig } from 'vite'
import vue from '@vitejs/plugin-vue'

export default defineConfig({
  plugins: [vue()],
  server: {
    port: 5173,
    proxy: {
      '/api': {
        target: 'http://localhost:8080',
        changeOrigin: true,
        rewrite: path => path.replace(/^\/api/, '')
      }
    }
  }
})
App.vue
<template>
  <div class="chart-wrapper">
    <h1>数据可视化大屏</h1>
    <h2>操作员:Admin</h2>
    <ChartD />
  </div>
</template>

<script setup>
import ChartD from './components/ChartD.vue'
</script>

<style>
body {
  background-color: #f0f2f5;
  margin: 0;
  padding: 20px;
  font-family: "Microsoft YaHei", sans-serif;
}

.chart-wrapper {
  max-width: 1400px;
  margin: 40px auto;
  padding: 20px;
}
</style>
components/ChartD.vue
<template>
  <!-- 图表容器,ref 用于让 ECharts 挂载到这个 DOM 上 -->
  <div ref="chartRef" class="chart-container"></div>
</template>

<script setup>
import { ref, onMounted, onUnmounted } from 'vue'
import * as echarts from 'echarts'   // 引入 ECharts 图表库
import axios from 'axios'            // 引入 HTTP 请求库

const chartRef = ref()     // 图表 DOM 引用,对应模板里的 ref="chartRef"
let chart = null           // ECharts 实例,初始为空,首次渲染时创建
let timer = null           // 定时器句柄,用于定时刷新数据,卸载时需清除

// 渲染图表数据(async 因为内部要 await 请求接口)
const renderChart = async () => {
  // 请求后端实时数据,_t 传当前时间戳,每次都不同,用于防止浏览器缓存
  const res = await axios.get('/api/kpi-d', { params: { _t: Date.now() } })
  const data = res.data   // 后端返回的单条记录,形如 { window_start, device_count }

  // 取出离线设备数;?? 是空值合并运算符:当值为 null/undefined 时取 0,避免仪表盘显示异常
  const value = data.device_count ?? 0

  // 如果 chart 还没创建(为 null),就执行下面创建实例的代码
  // 只初始化一次图表实例,避免每次刷新都重复创建(否则会内存泄漏/报错)
  if (!chart) {
    chart = echarts.init(chartRef.value)
  }

  // 设置图表配置项(setOption 默认合并模式,重复调用会更新已有图表)
  chart.setOption({
    title: {
      text: '当前离线设备数',                                // 主标题
      subtext: '统计周期:每 5 秒 | 实时刷新',               // 副标题,说明统计规则
      left: 'center',                                     // 标题水平居中
      top: 10,                                            // 标题距顶部 10px
      subtextStyle: { fontSize: 12, color: '#888' }       // 副标题样式:小号灰字
    },
    series: [{
      type: 'gauge',            // 仪表盘(表盘式展示单个数值,无 X/Y 轴)
      min: 0,                   // 表盘最小刻度
      max: 60,                  // 表盘最大刻度
      splitNumber: 6,           // 表盘分成 6 大格(每格代表 10)
      center: ['50%', '58%'],   // 表盘中心位置:水平居中,垂直往下移约 8%(给标题腾位置)
      radius: '75%',            // 表盘半径,占容器的 75%
      // 表盘外圈刻度线:按比例分段着色(绿→黄→红,越往大值越警示)
      axisLine: {
        lineStyle: {
          width: 20,            // 刻度线宽度
          color: [
            [0.2, '#2ECC71'],   // 0~20% 区间:绿色(正常)
            [0.5, '#F39C12'],   // 20%~50% 区间:橙色(注意)
            [1,   '#E74C3C']    // 50%~100% 区间:红色(告警)
          ]
        }
      },
      pointer: { width: 6 },    // 指针宽度
      // 中心数值显示
      detail: {
        formatter: '{value} 台',     // 数值格式:在数字后拼接"台"
        fontSize: 24,
        color: '#333',
        offsetCenter: [0, '60%']     // 相对表盘中心的偏移:水平不动,垂直下移 60%
      },
      // 数值下方的名称文字(即 data 里的 name)
      title: {
        fontSize: 14,
        color: '#666',
        offsetCenter: [0, '85%']     // 相对表盘中心的偏移:垂直下移 85%
      },
      data: [{ value: value, name: '离线设备数' }]   // 表盘数据:value 为指针指向值,name 为名称
    }]
  })
}

onMounted(() => {
  renderChart()                           // 组件挂载后立即渲染一次,避免首屏空白
  timer = setInterval(renderChart, 5000)  // 每 5 秒调用一次 renderChart,实现实时刷新
})

onUnmounted(() => {
  clearInterval(timer)                    // 组件卸载时清除定时器,防止内存泄漏和无效请求
  chart?.dispose()                        // 销毁图表实例,释放占用的资源(?. 防止 chart 为 null 报错)
})
</script>

<style scoped>
.chart-container {
  width: 100%;                               /* 容器宽度占满父级 */
  height: 400px;                             /* 图表高度固定 400px */
  min-width: 700px;                          /* 最小宽度,防止图表过窄导致 X 轴文字挤在一起 */
  background: #fff;                          /* 白色背景 */
  border: 1px solid #e0e0e0;                 /* 浅灰色边框 */
  border-radius: 15px;                       /* 圆角效果 */
  padding: 10px;                             /* 内边距,让图表不贴边 */
  box-shadow: 0 2px 8px rgba(0, 0, 0, 0.05); /* 轻微阴影,增加层次感 */
}
</style>

3. 启动 Vue 项目

npm run dev

浏览器访问 http://localhost:5173,查看仪表盘并截图。

六、项目提交

  • 截图

  • 导出的 Flink 项目压缩包;

  • 导出的后端项目压缩包;

  • 导出的前端项目压缩包;


发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Powered By Z-BlogPHP 1.7.3

版权:李翔
备案/许可证编号为:新ICP备2024006115号-1