Hive 提供了类 SQL 语法 HQL,封装了底层的 MapReduce 过程。
目录 | 概述 |
---|---|
操作数据库 | 创建、修改、删除数据库,查看数据库信息 |
操作数据表 | 创建、修改、删除表,查看表的信息,数据类型,复杂数据类型用例 |
插入数据 | INSERT 关键字的使用 |
加载数据 | LOAD 关键字的使用 |
多表插入 | 扫描一遍源表就可以生成多个不相交的输出 |
动态分区插入 | 在插入数据到分区表时,根据源表的列值自动创建分区 |
导入导出表数据 | EXPORT 和 IMPORT 关键字的使用 |
保存查询结果 | 保存查询结果到本地、HDFS 或 Hive 表 |
清空表数据 | TRUNCATE 关键字的使用 |
查询数据 | SELECT 关键字的使用 |
子查询部分 | 将子查询部分产生的结果集保存在内存中,供整个 SQL 使用 |
UNION | 将多个查询结果合并为一个结果集 |
聚合函数 | COUNT 、MAX 、MIN 、SUM 、AVG 聚合函数的使用 |
分组 | GROUP BY 和 HAVING 关键字的使用 |
排序 | ORDER BY 、S BY 、DIRIBUTE BY 、CLUSTER BY 关键字的使用 |
连接 | 内连接、外连接、多表连接、分桶表连接 |
数据抽样 | 块抽样、分桶抽样、随机抽样 |
常用内置函数 | 日期函数、字符函数、解析json、条件函数、窗口函数、排名函数、行列转换 |
案例 | 复制分区表、统计分析与排名、ETL |