本课程系统地讲述了大数据时代背景下的大数据生态体系,从分布式协调开始,逐步深入到分布式,流处理等计算引擎,通过系统的剖析当前典型的企业级大数据平台架构设计。

课程目录

【六期-01day】开学+常见业务+MR
【六期-02day】MR+Hive
【六期-03day】Hive02_03
【六期-04day】scala+spark
【六期-05day】yarn和spark
【六期-06day】LR+商品项目
【六期-07day】数据采集业务+flume
【六期-08day】实时采集kafka+SparkStreaming
【六期-09day】Spark Streaming02+Flink
【六期-10day】streaming补充+Flink
【六期-11day】数据仓库
【六期-12day】数据仓库+Hbase
【六期-13day】协同过滤
【六期-14day】结巴切词+基于内容推荐+项目作业
【六期-15day】隐马HMM算法
【六期-16day】音乐推荐项目
【六期-17day】音乐推荐+NLP
【六期-18day】分类Bayes
【六期-19day】k-means+svm
【六期-20day】kmeans_smo+决策树
【六期-21day】神经网络与深度学习
【六期-22day】面试讲解

声明:内容搜集于网络,如有侵权,请联系删除