《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》是一套针对有志于成为大数据工程师或数据仓库架构师的学习者设计的实战课程。该课程通常分为10章,以下是详细的介绍:

课程简介

本课程深入探讨了如何利用Spark和ClickHouse构建企业级数据仓库,涵盖了数据集成、数据处理、数据存储和分析的全流程。课程结合实际业务场景,通过实战案例,帮助学员掌握大数据平台的核心技术和企业级应用。

课程目标

  1. 掌握Spark和ClickHouse的核心概念和操作。
  2. 学会构建企业级数据仓库的整体架构。
  3. 熟悉数据集成、清洗、存储和分析的实战技巧。
  4. 提升解决大数据问题的能力和进军大厂的竞争力。

课程内容

第1章:大数据和数据仓库概述

  • 大数据概念和关键技术
  • 数据仓库的定义和作用
  • Spark和ClickHouse的简介和优势

第2章:Spark基础和环境搭建

  • Spark架构和核心概念
  • Spark环境搭建和配置
  • Spark DataFrame和DataSet编程基础

第3章:Spark SQL和DataFrame操作

  • Spark SQL的语法和特性
  • DataFrame的创建、转换和操作
  • 复杂查询和数据聚合

第4章:数据集成与Spark数据源

  • Spark数据源介绍(如HDFS, JDBC, Kafka等)
  • 数据读取和写入操作
  • 数据清洗和转换技术

第5章:ClickHouse基础和架构

  • ClickHouse的设计理念
  • ClickHouse的安装和配置
  • ClickHouse的数据类型和表引擎

第6章:ClickHouse数据模型和索引

  • 物化视图和索引原理
  • 数据分区和压缩策略
  • 数据插入和查询优化

第7章:Spark与ClickHouse的数据集成

  • Spark到ClickHouse的数据写入
  • ClickHouse的Spark连接器使用
  • 实时数据同步和批量数据导入

第8章:企业级数据仓库架构设计

  • 数据仓库架构模式和设计原则
  • 实时数据仓库和离线数据仓库的整合
  • 元数据管理和数据治理

第9章:实战案例分析与优化

  • 实战案例1:用户行为数据分析
  • 实战案例2:电商销售数据分析
  • 性能优化和监控

第10章:数据仓库项目实践和面试准备

  • 完成一个完整的数据仓库项目
  • 数据仓库项目的测试和部署
  • 面试技巧和常见问题解析

学习方式:

  • 视频教学
  • 实战案例讲解和代码演示
  • 项目实战
  • 在线讨论和答疑

面向人群:

  • 大数据开发工程师
  • 数据仓库工程师
  • 数据分析师
  • 数据科学家

结业认证:

完成课程的学员将获得官方认证的结业证书,有助于提升个人的职业竞争力。

本课程提供了一个全面的学习路径,旨在帮助学员掌握Spark和ClickHouse在企业级数据仓库中的实际应用,从而在实际工作中能够高效地处理和分析大规模数据集,为未来的职业发展打下坚实的基础。

课程截图:

课程目录:

├──第1章 从0到1搭建项目开发环境,快速上手大数据开发
| ├──1-1大数据时代你还不知道数据仓库么1028_ev.mp4 21.81M
| ├──1-2本章概览0205_ev.mp4 3.07M
| ├──1-3基于IDEAMaven构建Spark工程1218_ev.mp4 36.19M
| ├──1-4 数据开发环境(SparkHiveHadoopMySQLIDEA)搭建.txt 0.05kb
| ├──1-5 Maven安装配置.txt 0.05kb
| ├──1-6源码启动脚本配置等自动构建打包1307_ev.mp4 49.38M
| └──1-7项目多模块规划与自动构建打包1611_ev.mp4 56.90M
├──第2章 项目关键技术准备,学习通用的数据处理技术
| ├──2-10在Spark中集成Grok0943_ev.mp4 32.65M
| ├──2-11Grok的序列化问题与源码修改0548_ev.mp4 20.59M
| ├──2-12 Spark源码优化,支持对MySQL的数据进行更新.txt 0.05kb
| ├──2-1本章概览0400_ev.mp4 5.96M
| ├──2-2IPv4和数值转换1051_ev.mp4 21.63M
| ├──2-3IP地址简写和全写的格式转换0423_ev.mp4 10.04M
| ├──2-4IP地址二分查找1224_ev.mp4 35.01M
| ├──2-5Spark自定义IP函数0426_ev.mp4 9.96M
| ├──2-6初识Grok通用数据解析器1557_ev.mp4 53.70M
| ├──2-7在程序中解析Grok0723_ev.mp4 22.78M
| ├──2-8自定义Grok表达式0637_ev.mp4 25.70M
| └──2-9Grok工具类封装0557_ev.mp4 21.72M
├──第3章 项目数据准备,操练基于Spark的数据开发与优化
| ├──3-1本章概览0131_ev.mp4 2.31M
| ├──3-2项目业务数据0629_ev.mp4 13.26M
| ├──3-3生成IP域名IP位置的中间数据上0905_ev.mp4 24.49M
| ├──3-4生成IP域名IP位置的中间数据下1356_ev.mp4 42.86M
| ├──3-5生成域名备案IP位置违规实体数据0943_ev.mp4 28.78M
| ├──3-6基于Grok模拟安全访问日志1655_ev.mp4 59.88M
| └──3-7安全访问日志生成之广播变量优化0249_ev.mp4 10.20M
├──第4章 初识OLAP数仓架构
| ├──4-1本章概览0109_ev.mp4 1.64M
| ├──4-2基于Lambda架构的数仓0554_ev.mp4 9.89M
| ├──4-3基于Kabada架构的数仓0253_ev.mp4 4.94M
| ├──4-4基于实时OLAP架构的数仓0619_ev.mp4 9.99M
| └──4-5 【面试官来啦】面试讨论题.txt 0.05kb
├──第5章 详解数据仓库基础理论,掌握数据仓库的实施流程
| ├──5-10 【面试官来啦】面试讨论题.txt 0.01kb
| ├──5-1本章概览0242_ev.mp4 3.90M
| ├──5-2数据仓库的定义0525_ev.mp4 8.51M
| ├──5-3 3NF范式建模0423_ev.mp4 8.04M
| ├──5-4Kimball和Inmon数据仓库架构0457_ev.mp4 8.55M
| ├──5-5数据仓库建模方法0626_ev.mp4 11.68M
| ├──5-6事实表与维度表0558_ev.mp4 10.29M
| ├──5-7星型雪花和星座维度模型0327_ev.mp4 6.33M
| ├──5-8数据仓库构建流程0521_ev.mp4 10.45M
| └──5-9数据仓库分层模型0848_ev.mp4 16.85M
├──第6章 【项目实战第一篇】项目业务流程与ODS层数据同步
| ├──6-1课程目录0125_ev.mp4 2.10M
| ├──6-2项目业务流程与技术架构0326_ev.mp4 6.17M
| ├──6-3ODS数据同步技术架构0510_ev.mp4 7.98M
| ├──6-4基于HDFSAPI的数据同步1730_ev.mp4 58.65M
| ├──6-5基于HDFSAPI的数据同步工具封装1737_ev.mp4 76.65M
| └──6-6业务数据库的数据同步1148_ev.mp4 38.40M
├──第7章 快速上手OLAP分析引擎ClickHouse
| ├──7-10ClickHouse学习建议0744_ev.mp4 24.18M
| ├──7-1本章概览0156_ev.mp4 2.94M
| ├──7-2初识OLAP分析引擎ClickHouse1310_ev.mp4 26.10M
| ├──7-3ClickHouse与MySQLHbaseElasticsearch0538_ev.mp4 13.37M
| ├──7-4ClickHouse单机版安装0222_ev.mp4 9.11M
| ├──7-5ClickHouse快速入门0655_ev.mp4 25.76M
| ├──7-6ClickHouse-client使用1428_ev.mp4 30.06M
| ├──7-7 ClickHouse常用的数据格式.txt 0.01kb
| ├──7-8可视化工具DBeaver安装配置0535_ev.mp4 13.61M
| └──7-9ClickHouse表引擎快速入门0543_ev.mp4 9.70M
├──第8章 基于Spark源码自定义ClickHouse外部数据源,简化数据写入流程
| ├──8-1本章概览0215_ev.mp4 3.13M
| ├──8-2JDBC操作ClickHouse1535_ev.mp4 56.68M
| ├──8-3使用Spark将数据写入ClickHouse1445_ev.mp4 57.30M
| ├──8-4Spark写ClickHouse的配置化改造1313_ev.mp4 47.38M
| ├──8-5在Spark中集成写ClickHouse的通用能力2252_ev.mp4 77.31M
| └──8-6基于Spark源码自定义ClickHouse外部数据源2046_ev.mp4 81.94M
├──第9章 数仓高级之维度模型设计
| ├──9-10 【面试官来啦】面试讨论题.txt 0.01kb
| ├──9-1本章概览0224_ev.mp4 3.65M
| ├──9-2维度相关基本概念0543_ev.mp4 10.14M
| ├──9-3维度设计的基本方法0308_ev.mp4 4.47M
| ├──9-4维度设计的反规范化0308_ev.mp4 5.21M
| ├──9-5一致性维度集成0357_ev.mp4 7.57M
| ├──9-6维度模型设计原则和方式1007_ev.mp4 16.90M
| ├──9-7缓慢变化维度SCD1240_ev.mp4 24.11M
| ├──9-8维度的层次关系0629_ev.mp4 11.08M
| └──9-9其他常见的维度模型0605_ev.mp4 11.33M
├──第10章
| ├──10-1本章概览0156_ev.mp4 3.04M
| ├──10-2反规范化维度合并之应用内容的模型设计与实现1841_ev.mp4 53.62M
| ├──10-3公共方法封装0441_ev.mp4 20.74M
| ├──10-4维度合并拆分之IP域名备案模型设计0228_ev.mp4 3.86M
| ├──10-5IP域名备案维度代码实现0843_ev.mp4 26.80M
| ├──10-6违规IP域名数据入库0742_ev.mp4 30.09M
| ├──10-7维度层次结构扁平化之IP地址段区域维度模型设计0346_ev.mp4 6.03M
| └──10-8IP地址段区域维度代码实现1026_ev.mp4 36.60M

声明:本站所发布的一切视频课程仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站所有课程来自网络,版权争议与本站无关。如有侵权请联系联系客服QQ:1960026872或登录本站账号进入个人中心提交工单留言反馈,我们将第一时间处理!