黑马程序员推出的《数据湖架构开发Hudi》课程,是一套聚焦大数据存储、实时数仓以及数据湖架构实战的进阶型课程。课程围绕当前热门的数据湖技术体系展开,重点讲解Apache Hudi核心原理、实时数据处理、湖仓一体架构以及企业级数据平台开发实践,帮助学习者掌握新一代大数据架构核心技术。课程特别适合具备一定大数据基础、希望向实时数仓与数据平台架构方向发展的开发者学习。
随着企业数据规模不断增长,传统离线数仓已经难以满足实时分析需求,而数据湖与湖仓一体架构正在成为大数据行业的重要发展方向。课程以Apache Hudi为核心,深入讲解数据湖技术在企业中的实际应用场景,包括实时数据写入、增量更新、数据回溯以及海量数据管理等关键能力。
课程前期会系统介绍数据仓库与数据湖基础概念,帮助学习者理解传统Hive数仓与现代湖仓架构之间的区别。随后重点讲解Hudi底层存储机制、表类型设计、索引原理、事务机制以及数据版本管理等核心知识,让学员真正理解Hudi为何能够实现高效实时数据处理。
在技术栈方面,课程还会结合Apache Spark、Apache Flink、Apache Hive以及Kafka等主流大数据组件进行实战开发,帮助学习者掌握完整的数据湖生态体系。通过真实案例,课程会演示如何实现实时数据采集、数据清洗、增量同步以及实时数仓搭建。
课程最大的亮点在于“企业级项目实战”。学习过程中,学员将参与真实业务场景开发,例如用户行为日志分析、电商实时数仓、数据同步平台以及实时指标计算系统等项目。通过完整项目实践,能够深入理解数据湖架构在企业中的实际落地方式,并掌握高并发、大规模数据处理场景下的开发技巧。
此外,课程还会重点讲解湖仓一体化设计思想,包括数据治理、数据分层、元数据管理、性能优化以及查询加速等高级内容,帮助学习者建立完整的大数据架构思维。同时还会涉及集群部署、资源调优以及生产环境问题排查等企业开发中非常重要的实战技能。
随着实时数据分析需求不断增长,掌握数据湖与湖仓架构技术的人才越来越受到企业重视。相比传统离线开发岗位,熟悉Hudi、Flink、Spark等实时数据技术的开发者,在大数据行业具备更强竞争力与更广阔的发展空间。
总体来看,《黑马程序员数据湖架构开发Hudi》是一套兼顾理论深度与企业实战的大数据进阶课程,能够帮助学习者系统掌握数据湖核心技术与实时数仓开发能力,为进入大数据平台开发、实时数仓架构以及数据工程方向打下坚实基础。
课程截图:

课程目录:
📁 3.Hudi 应用进阶篇(Flink 集成)视频
3.Hudi 应用进阶篇(Flink 集成)视频文档.png [493.5 KB]
13--Flink CDC Hudi--CDC 概念和类型.wmv [17.9 MB]
10--Flink SQL Writer--编程实现流式增量读取Hudi表数据.wmv [37.3 MB]
11--Flink SQL Client 写入Hudi--整体思路流程及环境配置.wmv [64.3 MB]
02--快速入门使用--Flink Standalone 集群安装部署.wmv [21.8 MB]
05--快速入门使用--流式查询StreamingQuery.wmv [38.1 MB]
12--Flink SQL Client 写入Hudi--编写DDL和DML语句数据实时入湖Hudi.wmv [48.0 MB]
17--Flink CDC Hudi--创建视图View存储中间数据.wmv [15.6 MB]
19--Flink CDC Hudi--使用Hive查询Hudi表数据.wmv [21.6 MB]
14--Flink CDC Hudi--重新编译Hudi源码集成Flink与Hive.wmv [28.6 MB]
21--Hudi 应用进阶篇之集成Flink--课程内容内容总结和作业.wmv [5.6 MB]
01--Hudi 应用进阶篇之集成Flink--课程内容大纲和学习目标.wmv [7.9 MB]
16--Flink CDC Hudi--使用Flink CDC创建表及测试.wmv [24.9 MB]
06--Flink SQL Writer--Flink SQL集成Kafka.wmv [49.7 MB]
08--Flink SQL Writer--采用Flink SQL编程加载Kafka数据.wmv [67.1 MB]
20--Flink CDC Hudi--Hudi管理命令hudi-cli使用.wmv [70.6 MB]
18--Flink CDC Hudi--插入视图数据插入Hudi表.wmv [32.6 MB]
15--Flink CDC Hudi--开启MySQL binlog和创建表.wmv [15.5 MB]
09--Flink SQL Writer--编程实现数据实时增量存储Hudi表.wmv [73.9 MB]
04--快速入门使用--创建表及数据插入更新查询.wmv [40.4 MB]
07--Flink SQL Writer--构建Maven开发环境.wmv [24.0 MB]
03--快速入门使用--集成方式及启动SQL Client.wmv [27.7 MB]
📁 2.Hudi 应用进阶篇(Spark 集成)视频
2.Hudi 应用进阶篇(Spark 集成)视频必看.png [493.5 KB]
06--滴滴运营数据分析--业务数据调研和需求分析.wmv [29.6 MB]
02--大数据环境准备--离线tar安装MySQL 5.7.wmv [59.6 MB]
25--结构化流写入Hudi--订单数据查询分析.wmv [87.9 MB]
03--大数据环境准备--安装部署Hive.wmv [58.5 MB]
14--滴滴运营数据分析--指标查询分析--加载Hudi表数据.wmv [39.5 MB]
21--滴滴运营数据分析--集成Hive查询--创建表和添加分区.wmv [79.5 MB]
13--滴滴运营数据分析--业务数据加载存储--保存Hudi表.wmv [32.1 MB]
04--大数据环境准备--安装部署Zookeeper.wmv [20.2 MB]
10--滴滴运营数据分析--业务数据加载存储--思路分析.wmv [59.7 MB]
08--滴滴运营数据分析--工具类SparkUtils.wmv [27.9 MB]
07--滴滴运营数据分析--构建开发环境.wmv [23.2 MB]
18--滴滴运营数据分析--指标查询分析--订单价格区间统计.wmv [35.5 MB]
29--集成 SparkSQL--MergeInto语句.wmv [93.5 MB]
27--集成 SparkSQL--快速体验数据CRUD.wmv [248.8 MB]
22--滴滴运营数据分析--集成Hive查询--编写SQL指标分析.wmv [36.5 MB]
20--滴滴运营数据分析--指标查询分析--订单星期统计.wmv [27.7 MB]
12--滴滴运营数据分析--业务数据加载存储--数据ETL转换.wmv [34.8 MB]
19--滴滴运营数据分析--指标查询分析--订单距离区间统计.wmv [22.5 MB]
23--结构化流写入Hudi--模拟交易订单数据和流程分析.wmv [47.0 MB]
17--滴滴运营数据分析--指标查询分析--订单交通类型统计.wmv [15.2 MB]
15--滴滴运营数据分析--指标查询分析--订单类型统计.wmv [31.3 MB]
09--滴滴运营数据分析--日期转换星期测试.wmv [20.9 MB]
24--结构化流写入Hudi--流式程序开发.wmv [91.2 MB]
05--大数据环境准备--安装部署Kafka.wmv [24.2 MB]
11--滴滴运营数据分析--业务数据加载存储--加载CSV数据.wmv [30.9 MB]
01--Hudi 应用进阶篇之集成Spark--课程内容大纲和学习目标.wmv [8.0 MB]
16--滴滴运营数据分析--指标查询分析--订单时效性统计.wmv [12.6 MB]
26--结构化流写入Hudi--工具类DeltaStreamer.wmv [21.3 MB]
28--集成 SparkSQL--创建表方式.wmv [10.4 MB]
30--Hudi 应用进阶篇之集成Spark--课程内容内容总结和作业.wmv [8.1 MB]
📁 5.传智教育数据中心Hudi案例实战
5.传智教育数据中心Hudi案例实战文档.zip [1.8 MB]
07--Flink CDC 实时数据采集--基于CDC编写DDL和DML语句同步其他业务表数据.wmv [49.0 MB]
16--FlinkSQL 流式分析--流式查询Hudi表进行指标计算并存储MySQL.wmv [48.0 MB]
05--Flink CDC 实时数据采集--开发环境准备(SQLClient和程序代码).wmv [43.1 MB]
02--实战案例技术架构--MySQL+FlinkCDC+Hudi+FlinkSQL+Presto+FineBI.wmv [15.7 MB]
04--Flink CDC 实时数据采集--开启MySQL binlog及FlinkSQL开发步骤.wmv [25.1 MB]
14--FlinkSQL 流式分析--业务需求说明和开发步骤流程.wmv [17.1 MB]
10--Presto 即席查询Hudi--Presto 单机安装部署启动.wmv [77.3 MB]
08--Flink CDC 实时数据采集--验证CDC是否将数据同步Hudi表.wmv [40.4 MB]
06--Flink CDC 实时数据采集--基于CDC编写DDL和DML语句同步客户信息表数据.wmv [41.9 MB]
18--传智教育数据中心Hudi案例实战--课程内容总结和作业.mp4 [13.0 MB]
09--Presto 即席查询Hudi--Presto功能架构及数据模型.wmv [22.6 MB]
03--业务数据调研--MySQL数据库初始化5张表业务数据.wmv [102.8 MB]
12--Presto 即席查询Hudi--Presto与Hudi集成配置.wmv [32.0 MB]
13--Presto 即席查询Hudi--编写SQL离线指标分析及保存MySQL.wmv [92.5 MB]
17--FineBI 报表可视化--开发不同图表展示实时和离线指标.wmv [68.0 MB]
15--FlinkSQL 流式分析--MySQL数据库创建实时指标存储结果表.wmv [46.2 MB]
11--Presto 即席查询Hudi--Hive创建表关联Hudi表.wmv [79.0 MB]
01--传智教育数据中心Hudi案例实战--课程内容大纲和学习目标.mp4 [19.8 MB]
📁 4.传智教育博学谷Hudi案例实战视频
4.传智教育博学谷Hudi案例实战视频资料.zip [1.8 MB]
08--实时存储七陌数据--创建模块及编写流式程序开发步骤.wmv [27.2 MB]
14--SparkSQL 离线指标分析--离线批量加载Hudi表数据.wmv [43.1 MB]
11--集成Hive指标分析--创建Hive表和添加分区信息.wmv [35.7 MB]
02--实战案例技术架构--Flume+Kafka+StructuredStreaming+Hudi+Hive+MySQL.wmv [18.9 MB]
03--业务数据调研--运行程序实时产生社交数据.wmv [53.1 MB]
22--FineBI 报表可视化--开发饼图展示发送信息量Top10省份.wmv [17.0 MB]
10--实时存储七陌数据--存储Hudi表及测试运行.wmv [69.8 MB]
19--FineBI 报表可视化--配置FineBI数据源和添加数据集.wmv [48.7 MB]
09--实时存储七陌数据--消费Kafka数据及转换处理.wmv [94.4 MB]
23--FineBI 报表可视化--开发地图展示各省份信息量.wmv [20.0 MB]
17--SparkSQL 离线指标分析--编写SQL实现业务指标分析.wmv [48.3 MB]
06--七陌数据采集--ApacheFlume入门案例.wmv [42.2 MB]
12--集成Hive指标分析--编写SQL进行业务指标分析.wmv [37.2 MB]
07--七陌数据采集--编写配置运行Agent实时采集数据至Kafka.wmv [54.1 MB]
21--FineBI 报表可视化--开发柱形图展示发送信息量Top10用户.wmv [19.4 MB]
16--SparkSQL 离线指标分析--Hudi表数据选择字段和转换数据.wmv [39.4 MB]
15--SparkSQL 离线指标分析--自定义UDF函数解析IP地址为省份.wmv [45.8 MB]
13--SparkSQL 离线指标分析--业务指标需求分析和创建MySQL结果表.wmv [15.6 MB]
18--SparkSQL 离线指标分析--指标结果保存MySQL表.wmv [62.5 MB]
05--七陌数据采集--ApacheFlume安装部署及开发步骤.wmv [48.1 MB]
24--传智教育博学谷Hudi案例实战--课程内容总结和作业.wmv [8.6 MB]
04--七陌数据采集--ApacheFlume是什么及运行机制.wmv [26.4 MB]
20--FineBI 报表可视化--创建仪表盘及添加总信息量.wmv [22.9 MB]
01--传智教育博学谷Hudi案例实战--课程内容大纲和学习目标.wmv [12.7 MB]
📁 资料
第5部分、传智教育数据中心Hudi案例实战-资料.rar [884.8 MB]
Flink + Hudi 构建实时仓湖一体化.pdf [15.5 MB]
从Apache Hudi基础到项目实战【课程导学】.pptx [1.5 MB]
第4部分、传智教育博学谷Hudi案例实战-资料.rar [673.0 MB]
第1部分、Hudi 基础入门篇-资料.rar [2.3 GB]
Flink + Hudi 构建实时仓湖一体化.docx [18.8 MB]
第2部分、Hudi 应用进阶篇(Spark 集成)-资料.rar [722.2 MB]
HudiLinux.zip [12.2 GB]
第3部分、Hudi 应用进阶篇(Flink 集成)-资料.rar [439.8 MB]
📁 1.Hudi 基础入门篇视频
07--Hudi 快速体验使用--编译Hudi 源码.wmv [58.0 MB]
17--基于IDEA编程使用Hudi--模拟数据并插入Insert.wmv [64.2 MB]
24--Apache Hudi 核心概念剖析--Hudi数据三种查询类型.wmv [11.5 MB]
18--基于IDEA编程使用Hudi--快照查询及日期时间过滤查询.wmv [61.1 MB]
27--Apache Hudi 核心概念剖析--数据写操作流程.wmv [10.8 MB]
03--为什么要学习Apache Hudi--数据仓库和数据湖区别.wmv [14.2 MB]
05--为什么要学习Apache Hudi--Hudi 框架基本介绍.wmv [27.7 MB]
25--Apache Hudi 核心概念剖析--COW 类型表.wmv [10.3 MB]
11--Hudi 快速体验使用--启动spark-shell添加jar包.wmv [23.1 MB]
14--Hudi 快速体验使用--查询Hudi表数据.wmv [28.4 MB]
23--Apache Hudi 核心概念剖析--数据计算三种模型.wmv [10.5 MB]
16--基于IDEA编程使用Hudi--构建Maven模块环境.wmv [42.1 MB]
08--Hudi 快速体验使用--大数据环境准备概述.wmv [7.6 MB]
02--为什么要学习Apache Hudi--什么是数据湖DataLake.wmv [10.1 MB]
22--Apache Hudi 核心概念剖析--三大基本概念.wmv [24.3 MB]
09--Hudi 快速体验使用--HDFS 安装部署测试.wmv [38.5 MB]
04--为什么要学习Apache Hudi--三大流式数据湖框架.wmv [10.5 MB]
20--基于IDEA编程使用Hudi--增量查询Incremental数据.wmv [48.2 MB]
06--为什么要学习Apache Hudi--Hudi 快速发展.wmv [14.4 MB]
10--Hudi 快速体验使用--Spark 安装部署测试.wmv [27.3 MB]
13--Hudi 快速体验使用--保存数据到Hudi表.wmv [22.1 MB]
12--Hudi 快速体验使用--模拟产生乘车Trip数据.wmv [17.8 MB]
19--基于IDEA编程使用Hudi--更新数据Update.wmv [44.0 MB]
00--Apache Hudi 课程内容提纲.mp4 [12.8 MB]
01--Hudi 基础入门篇--课程内容大纲和学习目标.wmv [7.5 MB]
21--基于IDEA编程使用Hudi--删除数据Delete.wmv [57.6 MB]
28--Hudi 基础入门篇--课程内容内容总结和作业.mp4 [19.8 MB]
26--Apache Hudi 核心概念剖析--MOR 类型表.wmv [13.9 MB]
15--Hudi 快速体验使用--初识Hudi数据管理.wmv [18.8 MB]
从Apache Hudi基础到项目实战【课程导学】.mp4 [18.8 MB]
