admin 发表于 2024-5-10 09:02:20

9大业务场景实战Hadoop+Flink,完成大数据能力进修 -

**** Hidden Message ***** 9大业务场景实战Hadoop+Flink,完成大数据能力进修
一课掌握热门技术栈,从0到1构建数据思维
随着互联网、大数据的快速发展,许多企业都加入了大数据的 抢人大战 ,人才需求很强。但大数据对新人并不友好,技术栈众多,学习曲线陡峭,项目体量大,都成了入门路上的绊脚石。我结合自己十余年的从业经验,设计了这门大数据入门课程,从大数据基石 Hadoop讲起,再到Flink、ClickHouse、Hudi等热门核心技术,并通过一系列大型项目的实战,让你成为实力派岗位人才!
2大企业级项目,9种业务场景,实战中掌握大数据主流框架的应用能力
经典教学模型,多轮内容打磨,实现「轻松」入门
覆盖热门技术,直击底层能力,不论是毕
业生还是技术转型,都能轻松学懂学会,
完成入门第一步。
从理论入门到环境搭建,从小案例到大项
目,从方案到思维,稳扎稳打掌握大数据
技能。
资深面试官针对核心技术点,选择典型面
试题,深度剖析解法及思路,带你敲开大
厂之门。
每个关键章节都搭配案例讲解,并最终手
把手完成一个大型项目的搭建,掌握实战
能力。
从源码、工具到项目实操,快速掌握大数据核心技术框架
删繁就简,直击核心,成为合格的岗位人才

掌握使用Scala进行面向对象编程、方法和函数的区别、集合的操作、函数式编程及自定义开发

高阶函数、泛型的使用,掌握基于Scala语言的Akka高并发编程

掌握实时处理最佳CP的Kafka框架的架构、部署、监控、消息发送全流程及调优、消息消费全流

程及调优、消息存储全流程及调优、整合Flume&Flink的使用

掌握ZK架构、部署、命令行使用、监听器、四字命令
掌握Flink架构、部署、各种运行模式、 DataStream API开发、State、Window、Watermark、

Table&SQL API开发、使用Flink CDC完成实时数据收集的功能

掌握CH架构、部署、数据类型、DDL&DML、库表引擎、函数、元数据管理、API开发

掌握数据湖常用框架、Hudi架构、部署、核心组件、应用开发、对接Flink构建实时数据湖

掌握Hive中从Hive QL发起后,中间经历了哪些过程,是如何将Hive QL翻译成分布式作业并执行的

掌握随时基于核心API进行源码的走读
离线数仓被广泛应用于电商、安全、教育等行业,通过数据的整合与
调度,可以直观发现问题,作出最优决策。
从通俗易懂的电商行业案例出发,基于Flink、ClickHouse和
Hudi等技术框架,实现多场景、多业务的实时处理以及数据湖
十二年互联网公司一线研发经验,某大型互联网公司大数据技术专家。
主要从事基于Spark/Flink为核心打造的大数据公有云、私有云数据平台产品的研发。改造过Hadoop、
Spark等框架的源码为云平台提供更高的执行性能。集群规模过万,有丰富的大数据项目实战经验以及授
课经验(授课数千小时,深受学员好评)。
第1章 高薪择业:为什么大数据行业更有前途?
本章将从什么是大数据说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的。课程中,将介绍大数据的特性、大数据对我们带来的技术变革、大数据处理过程中涉及到的技术以及大数据典型应用。在这里,希望大家掌握学习的方法,得以真正不变应万变。
第2章 急速入门大数据Hadoop:到底什么是Hadoop
本章中,将带领大家一起认识Hadoop:Hadoop生态系统、Hadoop的发展史、Hadoop的优势、Hadoop的三个核心组件(HDFS、YARN、MapReduce);探讨Hadoop生态圈的常用框架及职责,以及在工作中如何选择更适合的Hadoop的发行版,为后续深入学习打下坚实的基础。
第3章 大数据基石之文件系统:系统玩转分布式文件系统HDFS
本章中,将从Hadoop的设计目标、架构及文件系统命令空间出发,带领大家快速搭建单节点伪分布式HDFS的环境。通过讲解使用hdfs shell以及Java API的方式操作HDFS文件系统,详细分析HDFS文件的读写流程以及安全模式在Hadoop中的使用,并结合HDFS API来实现词频统计案例,帮助大家对Hadoop分布式文件系统HDFS有深刻的认识并能轻松上手实战。
第4章 大数据基石之计算框架:系统玩转分布式计算框架MapReduce
本章将从架构、编程模型等角度带大家认识Hadoop的分布式计算框架MapReduce,掌握MapReduce整体执行流程以及各个核心组件编程,并通过N个实战案例让大家深入掌握,如何结合各种不同场景的应用基于MapReduce进行开发。本章中会详细剖析如何在MapReduce中实现JOIN,这也是面试中经常被考察到的点,考察你的MapReduce功底以及优化策略。
第5章 大数据基石之计算框架:系统玩转分布式计算框架MapReduce
本章将从YARN的产生背景、YARN的架构及执行流程的角度,带大家认知Hadoop的资源调度框架YARN,能够快速搭建单节点伪分布式YARN的实验环境,掌握如何提交MapReduce作业提交到YARN上运行,以及资源调度器的配置、使用及区别。
查看完整目录
**** Hidden Message *****
页: [1]
查看完整版本: 9大业务场景实战Hadoop+Flink,完成大数据能力进修 -