[图片0]
潮流技能 颠覆性课程
拒绝用老掉牙的淘汰项目练手 要做就做前沿
覆盖大数据行业主流技术岗位,课程半年升级一次,紧跟市场与企业步伐
01 大数据入门基础课程
;;;;;;;;;
02 大数据Hadoop基础
1.大数据概论;框架;分布式文件系统;计算模型;5.全真实训项目
03 大数据离线分析
数据仓库; ETL工具;工作流引擎;;;6.全真实训项目
04 大数据实时计算
分布式协调系统;分布式数据库;数据库;数据库;列式存储系统;实时数据处理平台;分布式发布订阅消息系统;海量日志采集系统;9.全真实训综合项目
05 Spark数据计算
;;3RDD; SQL;5. Streaming;6. Mahout;;; R;;;爬虫;;
Hadoop基础实战
项目名称:搜狗搜索日志分析系统
数据体量:5000W+/日
硬件环境:Hadoop集群 12台
软件环境:++MR+Oracle10g
项目描述:搜狗每天产生大量的日志数据,从日志数据里面能提取到有用的数据包括每个用户的ID、浏览次数、月/日浏览频率、访问源、浏览内容等等,提取这些内容、统计数据分析每个用户行为,从而做出有利的决定。
大数据离线实战
项目名称:新浪微博数据分析系统
日均数据体量:3GB+
硬件环境:Hadoop集群 50台
软件环境:MapReduce+++++Zooke
+CentOS--X86
项目描述:此次项目我们需要处理微博产生的数据,通过对数据的处理得到所需的数据,微博拥有大量的用户,大量的用户潜在的价值是巨大,怎么挖掘这些潜在的宝藏就是我们项目最直接的目的,为了能够实时的进行数据处理使用Storm流式计算系统,和Hba
se、Zookeeper、Kafka组成框架,对数据进行处理,当然这些都是建立在hadoop集群上实现的,底层的存储还是HDFS。
大数据实时计算
项目名称:网络流量流向异常账号统计项目
数据体量:每天1000亿,每秒峰值100 000
硬件环境:Hadoop集群 600台
软件环境:++MR+Oracle10g
项目描述:运营商骨干网上采集现网流量流向信息,根据这些原始信息检测账号是否存在异常,如果多个终端使用同一个宽带账号,超过一定阈值则触发报警机制,例如阈值为5时,同一个账号同时连接的终端数量不能超过该值,如果超过则报警。
Spark阶段项目
项目名称:京东网上商城数据统计分析平台
数据体量:5000W+/日
硬件环境:centos--x86 集群:spark standalone(Master-1,Worker-3)
软件环境:hadoop,spark,hive,mysql,idea,navicat,kafka,flume
每日处理的数据量:3GB
项目描述:基于京东网上商城数据统计分析平台--该项目采用了目前大数据领域非常流行的技术——Spark。本项目使用了Spark技术生态栈中最常用的三个技术框架,Spark Core、Spark SQL和Spark Streaming,进行离线计算和实时计算业务模块的开发。实现了包括:统计和分析UV、PV、登录、留存、热门商品离线统计、广告流量实时统计3个业务模块。
点击咨询
大数据在各行各业中应用广泛 没有什么能逃出你的掌心
大数据特点 数据量大 数据种类多 要求实时性强 主导气质无法掩盖
[图片1]+
同时推出大数据hadoop
[图片2]+
网站后台维护
[图片3]+
大数据处理服务器开发
[图片4]+
金融机构大数据应用
[图片5]+
智能家居家电
[图片6]+
银行管理系统
点击咨询
学习氛围浓厚 求学圣地带你一站成才
集衣食住学为一体,舒适生活区域,先进教学设备
兄弟连注重细节,倾力为学员打造贴心学习环境
[图片7]
[图片8]
[图片9]
[图片10]
[图片11]
[图片12]
[图片13]
[图片14]
技术过硬 关系够铁 雇主企业喊你来上班!
兄弟连与企业联合共建、定向输出Linux运维人才
每月至少一期招聘会,学习、就业一站式服务平台。
[图片15]