熟练地在Hadoop和操作系统以及关系型数据库之前传递数据
能独立制定数据集成方案
熟练地向Hadoop提交作业以及查询作业运行情况
了解Map-Reduce原理,能书写Map-Reduce程序
了解HDFS原理,能熟练地对HDFS中的文件进行管理
能独立完成pig的安装并且利用pig做简单的数据分析工作
能独立完成Hbase的安装和配置
了解Hbase的原理并能进行简单的shell操作
能独立完成Hive的安装和配置
了解Hive的原理及进行HiveQL操作
课程涉及大致内容:
服务器:ESXi,可以在上面部署10多台虚拟机,能同时启动4台
PC:要求linux环境或windows+Cygwin,linux可以是standalone或者使用虚拟机
SSH:windows下可以使用SecureCRT或putty等ssh client程序,作用是用来远程连
接linux服务器,linux下可以直接使用ssh命令
Vmware client:用于管理ESXi
Hadoop:使用0.20.2
详细内容请观看本视频
下载地址:
查看当前『隐藏内容』需花费 60资源豆,【支付查看】