微信搜索bigdata029 | 邀请体验:数阅–数据管理、OLAP分析与可视化平台 | 订阅本站 | 赞助作者:赞助作者

 分类:Hive

一起学Hive系列文章

一起学Hive系列文章
[一起学Hive]之一–Hive概述,Hive是什么 [一起学Hive]之二–Hive函数大全-完整版 [一起学Hive]之三–Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和...

2年前 (2015-07-06) 9247℃ 26喜欢

[一起学Hive]之十三-Hive整合HBase,操作HBase表

[一起学Hive]之十三-Hive整合HBase,操作HBase表
关键字:Hive整合HBase、Hive操作HBase表 十二、Hive整合HBase,操作HBase表 HBase是被设计用来做k-v查询的,但有时候,也会遇到基于HBase表的复杂统计,写MR很不方便。Hive考虑到了这点,提供了操作HBase表的接口。 关于Hive操作HB...

2年前 (2015-06-30) 10086℃ 4喜欢

[一起学Hive]之十二-Hive SQL的优化

[一起学Hive]之十二-Hive SQL的优化
关键字: Hive 优化、HQL 优化、Hive数据倾斜 十一、Hive SQL的优化   本章只是从HQL层面介绍一下,日常开发HQL中需要注意的一些优化点,不涉及Hadoop层面的参数、配置等优化。 其中大部分是我之前发过的博客文章,这里整理了下。 11.1 使用分...

2年前 (2015-06-29) 6106℃ 3喜欢

[一起学Hive]之十一-Hive中Join的类型和用法

[一起学Hive]之十一-Hive中Join的类型和用法
关键字:Hive Join、Hive LEFT|RIGTH|FULL OUTER JOIN、Hive LEFT SEMI JOIN、Hive Cross Join Hive中除了支持和传统数据库中一样的内关联、左关联、右关联、全关联,还支持LEFT SEMI JOIN和CROSS...

2年前 (2015-06-25) 7838℃ 5喜欢

[一起学Hive]之十-Hive中Join的原理和机制

[一起学Hive]之十-Hive中Join的原理和机制
关键词:Hive MapJoin、Hive Common Join、Hive Reduce Join、Hive Join 九、Hive中Join的原理和机制 笼统的说,Hive中的Join可分为Common Join(Reduce阶段完成join)和Map Join(Map阶段完...

2年前 (2015-06-25) 5232℃ 6喜欢

[一起学Hive]之九-Hive的查询语句SELECT

[一起学Hive]之九-Hive的查询语句SELECT
关键字:Hive SELECT、ORDER BY、SORT BY、DISTRIBUTE BY、CLUSTER BY、Hive子查询、Hive虚拟列 八、Hive的查询语句SELECT 在所有的数据库系统中,SELECT语句是使用最多,也最复杂的一块,Hive中的查询语句SELEC...

2年前 (2015-06-24) 4891℃ 2喜欢

Hive中修改表的字段顺序

Hive中修改表的字段顺序
Hive中可以修改表的字段顺序。 如果发现Hive中创建的表字段顺序有问题,那么可以使用ALTER TABLE命令来修改,语法为: ALTER TABLE table_name CHANGE col_old_name col_new_name column_type AFTER ...

2年前 (2015-06-23) 2363℃ 2喜欢

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数

Spark1.4.0-SparkSQL与Hive整合-支持窗口分析函数
Spark1.4发布,除了重量级的SparkR,其中的SparkSQL支持了我期待已久的窗口分析函数(window functions),关于Hive中窗口分析函数的用法可参考 Hive分析函数系列 文章。 在我们的数据平台中,90%以上的离线分析任务都是使用Hive实现,其中必...

2年前 (2015-06-17) 15942℃ 10喜欢

[一起学Hive]之八-使用Hive命令行

[一起学Hive]之八-使用Hive命令行
Hive提供的几种用户交互接口中,最常用的就是命令行接口。本文简单介绍一下Hive命令行接口(Hive Command Line)及Hive交互Shell(Hive Interactive Shell)的一些使用。 七、使用Hive命令行 7.1 Hive Command Lin...

2年前 (2015-06-16) 7594℃ 4喜欢

[一起学Hive]之七-向Hive表中加载数据

[一起学Hive]之七-向Hive表中加载数据
在Hive中建好表之后,需要将数据加载进来,以便做后续查询分析,本文介绍向Hive表中加载数据的几种方式。 6.1 建表时候直接指定 如果你的数据已经在HDFS上存在,已经为结构化数据,并且数据所在的HDFS路径不需要维护,那么可以直接在建表的时候使用location指定数据所在...

2年前 (2015-06-15) 4161℃ 3喜欢

[一起学Hive]之六-Hive的动态分区

[一起学Hive]之六-Hive的动态分区
前面文章介绍了Hive中是支持分区的。 关系型数据库(如Oracle)中,对分区表Insert数据时候,数据库自动会根据分区字段的值,将数据插入到相应的分区中,Hive中也提供了类似的机制,即动态分区(Dynamic Partition),只不过,使用Hive的动态分区,需要进行...

2年前 (2015-06-15) 7823℃ 6喜欢

[一起学Hive]之五-Hive的视图和分区

[一起学Hive]之五-Hive的视图和分区
同关系型数据库一样,Hive中也支持视图(View)和分区(Partition),但与关系型数据库中的有所区别,本文简单介绍Hive中视图和分区的示例。 在真实业务场景下,视图的应用比较少,分区使用的非常多,因此建议对分区这块多花的时间来了解。   四、Hive的视图和...

2年前 (2015-06-15) 7923℃ 5喜欢

[一起学Hive]之四-Hive的安装配置

[一起学Hive]之四-Hive的安装配置
其实Hive的安装配置应该放在第二章来介绍,晚了些,希望对Hive初学者有用。 三、Hive的安装配置 3.1 环境需求 Hadoop Client Mysql 3.2 下载并解压Hive0.13.1安装包 下载地址:http://archive.apache.org/dis...

2年前 (2015-06-05) 5374℃ 4喜欢

[一起学Hive]之三–Hive中的数据库(Database)和表(Table)

[一起学Hive]之三–Hive中的数据库(Database)和表(Table)
在前面的文章中,介绍了可以把Hive当成一个“数据库”,它也具备传统数据库的数据单元,数据库(Database/Schema)和表(Table)。 本文介绍一下Hive中的数据库(Database/Schema)和表(Table)的基础知识,由于篇幅原因,这里只是一些常用的、基础...

2年前 (2015-06-03) 8575℃ 13喜欢

[一起学Hive]之二–Hive函数大全-完整版

[一起学Hive]之二–Hive函数大全-完整版
Hive函数大全–完整版 现在虽然有很多SQL ON Hadoop的解决方案,像Spark SQL、Impala、Presto等等,但就目前来看,在基于Hadoop的大数据分析平台、数据仓库中,Hive仍然是不可替代的角色。尽管它的相应延迟大,尽管它启动MapRedu...

2年前 (2015-06-03) 13432℃ 23喜欢