Java 通过 Apache Hive 查询关系型数据383

Apache Hive 是一个基于 Hadoop 的数据仓库系统，它允许用户使用熟悉的 SQL 语法查询和处理存储在 Hadoop 分布式文件系统（HDFS）中的大型数据集。本文将重点介绍如何使用 Java 代码通过 Hive 查询关系型数据并展示代码示例。

先决条件
已安装并配置的 Java 开发环境 (JDK)
已安装并运行的 Apache Hive 服务
Hive JDBC 驱动程序

添加 Hive JDBC 驱动程序

将 Hive JDBC 驱动程序添加到您的 Java 项目中，以便能够与 Hive 建立连接。您可以从 Maven Central 存储库下载驱动程序并在您的项目中添加以下依赖项：```xml

hive-jdbc
3.1.2

```

建立数据库连接

使用 `DriverManager` 类建立到 Hive 数据库的连接。提供 Hive Server 地址、端口以及用户名和密码：```java
import ;
import ;
public class HiveJdbcExample {
public static void main(String[] args) throws Exception {
// Hive Server 地址和端口
String hiveServerHost = "localhost";
int hiveServerPort = 10000;
// Hive 数据库用户名和密码
String hiveUsername = "hive";
String hivePassword = "";
// 建立到 Hive 的 JDBC 连接
Connection conn = (
"jdbc:hive2://" + hiveServerHost + ":" + hiveServerPort + "/default",
hiveUsername,
hivePassword);
}
}
```

执行 SQL 查询

使用 `Statement` 对象执行 SQL 查询。可以使用 `executeQuery()` 方法将结果集存储在 `ResultSet` 中：```java
import ;
import ;
public class HiveJdbcExample {
public static void main(String[] args) throws Exception {
// ...
// 创建一个 Statement 对象
Statement stmt = ();
// 执行 SQL 查询
ResultSet rs = ("SELECT * FROM employees");
// 遍历结果集
while (()) {
// 获取结果集中的值
int employeeId = ("employee_id");
String name = ("name");
double salary = ("salary");
// 打印结果
(employeeId + ", " + name + ", " + salary);
}
// 关闭 Statement 和 ResultSet
();
();
}
}
```