适合人群

有编程语言基础,例如 Scala、Python、Java 或 C++ 等,对大数据分析应用感兴趣即可参加

(不满足技能要求?不担心,在开课前学习这门蓝桥的课程即可。点击这里,学习《Scala 开发教程》)

  • 每周付出的时间:每周至少12小时用于在线完成实验,挑战任务
  • 坚持到底的决心:不会因为遇到困难半途而废,有毅力坚持到最后
  • 积极主动的态度:遇到问题能与同学及助教讨论,积极主动寻求答案
每周付出的时间

每周至少有 12 小时用于完成实验、挑战任务

坚持到底的决心

不会因为遇到困难而半途而废,有毅力坚持到最后

积极主动的态度

遇到问题能与小组同学及助教讨论,积极主动寻求答案

课程安排

技能准备阶段

第0周

预备知识

楼+课程全部在蓝桥完成,正式开课前,你需要学习Scala语言,在开课前学习这门蓝桥的课程即可。 点击这里,学习《Scala开发教程》。另外由于课程 将在Linux系统上学习,你还需要了解下Linux和Vim基本命令。

Hadoop 实战阶段

第1周

Hadoop基础实战

Hadoop 基础实验中将实践 Hadoop 基本概念、HDFS 及 YARN 架构与操作、MapReduce 原理与编程思想。 还会涉及到 HBase 及 Sqoop 组件,不会涉及太深,以能够了解和使用这些组件为目的。”模仿学习“阶段,6 个实验, 需要你一步步按照实验文档和实验视频完成。“运用实战“阶段,5 个简单的挑战,涉及 Hadoop 组件的最重要的知识点, 完成挑战作业,获得 PASS。

第2周

Hadoop 数据分析实战

学习 Solr、Hive、Flume、Kafka、Pig 等常见大数据分析组件,并结合第一周学习的 Hadoop 基础组件进行实战 Web 日志分析,让你能够在实验和挑战中学习结合多个不同的产品共同构建数据分析系统的思路。3 个挑战作业, 包含若干关键知识点,需要你在实验中足够认真和编程中足够细心才能够获得 PASS。

Spark实战阶段

Spark 实战阶段,4 周的内容包含 Spark 基础及相关组件,其中包含基础实验(或小型项目示例)及真实 数据的实战项目。第1周学习 Spark 基础的概念和开发,后续三周针对 Spark SQL、Streaming 实时分 析及机器学习三个方向进行项目实战。 在这个阶段,每周都有一系列的实验和挑战任务。实验会提供完整 的代码和详细的文档,同时嵌入关键步骤的录制视频,是模仿练习阶段;挑战是实战中会遇到的问题或项目任务, 包含若干知识点,需要在线完成,系统自动评判PASS或FAIL。

第3周

Spark 基础实战

本周快速上手 Spark 大数据分析框架,涉及到 Spark 基础与部署、RDD 操作及持久化、Spark 应用开发入门、 Spark Streaming、Spark SQL、Spark GraphX 以及 Spark 机器学习的入门实战。本周的核心目的是能够结合 Spark 多个组件使用 Scala 开发简单的应用,“模仿学习”之后必须要能够“运用实战”。

第4周

Spark SQL 项目实战

结合实际项目学习 Spark SQL 数据分析。会应用到之前学习到的多个组件,实验中会开发一个完整的 Spark SQL 应用, 从数据 ETL(提取-转换-加载) 贯穿到使用该应用进行分析,最后到数据可视化或存储。会涉及使用一些新的 知识去解决遇到的新问题,重点学习项目中解决问题的思路。完成本周的内容,有能力使用 Spark SQL 开 发应用解决简单的数据分析问题。

第5周

Spark Streaming 项目实战

结合实际项目学习 Spark Streaming 进行实时数据分析。会应用到之前学习到的多个组件,实验中会搭建 一个实时分析系统,并开发一个 Spark Streaming 应用,从数据 ETL(提取-转换-加载) 贯穿到使 用该应用进行分析,最后到数据可视化或存储。会涉及使用一些新的知识去解决遇到的新问题,重点学习项目 中解决问题的思路。完成本周的内容,有能力使用 Spark Streaming 开发应用解决简单的实时数据分析问题。

第6周

Spark 机器学习项目实战

本周需要一定的数学基础,结合实际项目学习 Spark 机器学习进行建模、分析和运算。实验中会涉及多个 小的机器学习项目,在项目提供的数据中进行建模。本周的内容涉及到多个常见的机器学习算法,并学习如何使用 Spark 机器学习的模块进行应用开发,根据已有的数据中进行预测和分析。完成本周的内容,有能力使用 Spark 机器学习模块进行常见机器学习算法实践。

FAQ

学完能找到工作吗?

课程涉及的知识点是很全面的,符合大部分大数据相关岗位的岗位要求。但因为课程时间比较短(只有6周), 对某个特定的方向都需要继续深入学习。 如果你在课程的学习中,认真完成所有的实验,挑战,积极提问, 肯定会让你的简历增加分量,提高找到工作的概率。

课程主要是什么形式?

课程核心采用实验+挑战+教学服务模式,不是直播和录播:

对于课程中的挑战,我们会提供实际工作中会遇到的问题或项目任务,包含若干知识点,需要在线完成,系统自动评判PASS或FAIL。

点击此处了解如何学习楼+课程

如果你还不熟悉蓝桥,点击这里了解蓝桥

开课前需要做什么准备?

  1. 只需要准备一台能上网的电脑,学习将在蓝桥的在线环境进行,无需安装配置本地环境;

  2. 阅读课程须知,并完成第0周的课程学习(你可以报名后在课程详情页找到它)

课程中如何进行答疑?

蓝桥共有3种答疑方式:QQ群/微信群实时答疑,1V1桌面共享答疑,讨论区答疑。

其中周一至周五每天 09:00-18:30 可使用QQ群实时答疑,必要的时候会使用蓝桥的共享桌面功能提供 1V1 共享桌面协作; 其余时间,无法保证及时回复,可以在讨论区提问,助教上班后第一时间回复解决。

课程使用什么编程语言?

Hadoop 阶段用到少量 Java,Spark 阶段 Scala 为主,少量 Python。Spark 选择 Scala 的主要原因是:

  1. Spark 是 Scala 实现的,原生支持。企业里用 Java 和 Scala 的偏多,同样的项目使用 Scala 比 Java 精简很多,开发效率更高。

  2. Scala 并且支持 Scala shell,交互式开发,利于初学者上手学习。

  3. Python 性能比 Scala 差,规模大点的 Spark 项目很少用 Python,为了尽量接近企业的场景选择 Scala。少量的实验选择 Python 是让大家了解下 Python 的 Spark 开发。

是否支持退款?

报名起72小时内,学习章节小于阶段2,支持无理由退费。

支持什么付款方式?

目前支持微信,支付宝付款,花呗分期。

课程是否有有效期?

课程有效期180天,超过有效期只能查看文档不能使用在线环境。

楼+课程与其他课程的区别是什么?

楼+ 面向的是希望系统化学习某一技术的用户,提供了更完善的学习路径和教学服务。楼+课程与其它课程最大 的不同体现在教学服务上:

loupus features