Hive的安装配置与示例

Alex / 5-23 11:33 / Hive / Tag: hive

1.上传hive安装包

2.解压
tar -zxvf hive-0.9.0.tar.gz -C /cloud/
3.配置Hive(在一台机器上即可)
          mv hive-env.sh.template hive-env.sh
4.运行hive
发现内置默认的metastore存在问题(1.换执行路径后,原来的表不存在了。2.同一路径下只能有一个用户访问同一个表)
在同一目录下只能启动一个hive客户端---- 这样怎么用?大家排队?
5.配置mysql metastore(切换到root用户)
配置HIVE_HOME环境变量
#查看本机是否安装mysql
rpm -qa | grep mysql
#如果安装请强制不考虑依赖的无情删除
rpm -e mysql-libs-5.1.66-2.el6_3.i686 --nodeps
安装mysql 
rpm -ivh MySQL-server-5.1.73-1.glibc23.i386.rpm 
rpm -ivh MySQL-client-5.1.73-1.glibc23.i386.rpm 
运行mysql配置向导 修改mysql的密码
/usr/bin/mysql_secure_installation
(注意:删除匿名用户,允许用户远程连接)
肯定会出现其他主机访问权限的问题,下边我们有说道,我的另外一篇博文,也详细的说过这个问题
登陆mysql
mysql -u root -p

6.配置hive
cp hive-default.xml.template hive-site.xml 
修改hive-site.xml(删除所有内容,只留一个<property></property>)
添加如下内容:
<property>
 <name>javax.jdo.option.ConnectionURL</name>
 <value>jdbc:mysql://lishiyu01:3306/hive?createDatabaseIfNotExist=true</value>
 <description>JDBC connect string for a JDBC metastore</description>
</property>
<property>
 <name>javax.jdo.option.ConnectionDriverName</name>
 <value>com.mysql.jdbc.Driver</value>
 <description>Driver class name for a JDBC metastore</description>
</property>

<property>
 <name>javax.jdo.option.ConnectionUserName</name>
 <value>root</value>
 <description>username to use against metastore database</description>
</property>
<property>
 <name>javax.jdo.option.ConnectionPassword</name>
 <value>123</value>
 <description>password to use against metastore database</description>
</property>

7.安装hive和mysq完成后,将mysql的连接jar包拷贝到$HIVE_HOME/lib目录下

如果出现没有权限的问题,在mysql授权(在安装mysql的机器上执行)
mysql -uroot -p
#(执行下面的语句  *.*:所有库下的所有表   %:任何IP地址或主机都可以连接)
GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' IDENTIFIED BY '123' WITH GRANT OPTION;
FLUSH PRIVILEGES;


#下边是内部表,外部表,以及分区表创建的示例(!!无论什么时候别忘了指定你的分隔符,虽然系统有默认的分隔符,BUT 这个真的好吗?!!)
8建表(默认是内部表)
create table trade_detail(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t';
建分区表
create table td_part(id bigint, account string, income double, expenses double, time string) partitioned by (logdate string) row format delimited fields terminated by '\t';
建外部表
create external table td_ext(id bigint, account string, income double, expenses double, time string) row format delimited fields terminated by '\t' location '/td_ext';

9.创建分区表
普通表和分区表区别:有大量数据增加的需要建分区表
create table book (id bigint, name string) partitioned by (pubdate string) row format delimited fields terminated by '\t'; 
分区表加载数据
load data local inpath './book.txt' overwrite into table book partition (pubdate='2014-08-22');
load data local inpath '/root/data.am' into table beauty partition (nation="USA");

select nation, avg(size) from beauties group by nation order by avg(size);


发表留言:

Hive问题记录0523 FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. org/apache/hadoop/ hbase/HBaseConfiguration Centos下的rpm与yum安装
返回顶部
Themes by lishiyu.cn