Java查询MongoDB数据：从基础操作到高级聚合的全面指南326

作为一名专业的程序员，在现代数据驱动的应用开发中，处理非关系型数据库如MongoDB已成为一项核心技能。MongoDB以其文档模型和高扩展性，在需要灵活数据结构和大规模存储的场景中广受欢迎。本文将深入探讨如何使用Java语言高效、灵活地查询MongoDB数据，从最基本的连接与查询，到复杂的过滤、排序、分页，再到强大的聚合框架，为您提供一份全面的实战指南。

1. 准备工作：环境搭建与依赖引入

在开始Java查询MongoDB之前，我们首先需要确保开发环境已准备就绪。

1.1 Java开发环境

确保您的系统已安装Java JDK 8或更高版本。

1.2 MongoDB实例

您需要一个运行中的MongoDB实例。可以是本地安装、Docker容器，或者是MongoDB Atlas等云服务。

1.3 Maven/Gradle依赖

我们需要引入MongoDB官方的Java驱动。如果您使用Maven，请在``中添加以下依赖：<dependency>
<groupId></groupId>
<artifactId>mongodb-driver-sync</artifactId>
<version>4.11.1</version> 
</dependency>

如果您使用Gradle，请在``中添加：implementation ':mongodb-driver-sync:4.11.1'

2. 连接MongoDB数据库

连接是所有操作的第一步。我们将使用`MongoClient`来建立与MongoDB的连接。import ;
import ;
import ;
import ;
import ;
public class MongoDBConnector {
private static final String CONNECTION_STRING = "mongodb://localhost:27017"; // 或 "mongodb+srv://user:pass@/?retryWrites=true&w=majority"
private static final String DATABASE_NAME = "mydatabase";
private static final String COLLECTION_NAME = "mycollection";
public static void main(String[] args) {
try (MongoClient mongoClient = (CONNECTION_STRING)) {
MongoDatabase database = (DATABASE_NAME);
MongoCollection<Document> collection = (COLLECTION_NAME);
("成功连接到MongoDB数据库: " + DATABASE_NAME + ", 集合: " + COLLECTION_NAME);
// 示例：插入一些测试数据（如果集合为空）
if (() == 0) {
("集合为空，插入测试数据...");
(new Document("name", "Alice").append("age", 30).append("city", "New York").append("score", 95));
(new Document("name", "Bob").append("age", 24).append("city", "London").append("score", 88));
(new Document("name", "Charlie").append("age", 35).append("city", "New York").append("score", 72));
(new Document("name", "David").append("age", 28).append("city", "Paris").append("score", 90));
(new Document("name", "Eve").append("age", 24).append("city", "London").append("score", 92));
("测试数据插入完成。");
}
// 在这里执行查询操作
// ...
} catch (Exception e) {
("连接MongoDB或执行操作时发生错误: " + ());
();
}
}
}

`MongoClient`是线程安全的，并且驱动程序内部管理连接池，因此通常在应用程序生命周期中只创建一次`MongoClient`实例即可。使用`try-with-resources`可以确保`MongoClient`在不再需要时正确关闭。

3. 基本数据查询：`find()`方法

`find()`方法是MongoDB最基本的查询操作，用于从集合中检索文档。它可以不带任何参数，以获取集合中的所有文档，也可以接受一个查询过滤器。

3.1 查询所有文档

import ;
// ... (之前的导入和连接代码)
// 在main方法中添加
("--- 查询所有文档 ---");
FindIterable<Document> allDocuments = ();
for (Document doc : allDocuments) {
(());
}

`find()`方法返回一个`FindIterable`对象，我们可以遍历它来获取每个`Document`。`Document`是MongoDB Java驱动中表示BSON文档的通用类，它本质上是一个`Map<String, Object>`。

3.2 按条件查询文档 (`Filters`工具类)

``类提供了丰富的静态方法，用于构建复杂的查询条件，极大地简化了查询语法的编写。

3.2.1 相等查询 (``)

查询`name`为"Alice"的文档：import static .*; // 静态导入Filters
// ...
("--- 查询name为Alice的文档 ---");
for (Document doc : (eq("name", "Alice"))) {
(());
}

3.2.2 比较查询 (``, ``, ``, ``)

查询`age`大于25的文档：("--- 查询age大于25的文档 ---");
for (Document doc : (gt("age", 25))) {
(());
}

查询`score`小于等于90的文档：("--- 查询score小于等于90的文档 ---");
for (Document doc : (lte("score", 90))) {
(());
}

3.2.3 逻辑组合查询 (``, ``, ``)

查询`city`为"New York"且`age`大于30的文档：("--- 查询city为New York且age大于30的文档 ---");
for (Document doc : (and(eq("city", "New York"), gt("age", 30)))) {
(());
}

查询`city`为"London"或`score`大于90的文档：("--- 查询city为London或score大于90的文档 ---");
for (Document doc : (or(eq("city", "London"), gt("score", 90)))) {
(());
}

3.2.4 范围查询 (``, ``)

查询`city`在"New York"和"Paris"中的文档：import ;
// ...
("--- 查询city在New York或Paris的文档 ---");
for (Document doc : (in("city", "New York", "Paris"))) {
(());
}

或者使用List：`in("city", ("New York", "Paris"))`。

3.2.5 存在性查询 (``)

查询存在`email`字段的文档（即使该字段为空）：// 假设某些文档可能没有email字段
// (new Document("name", "Grace").append("age", 22).append("email", "grace@"));
("--- 查询存在email字段的文档 ---");
for (Document doc : (exists("email", true))) { // true表示存在，false表示不存在
(());
}

4. 投影 (`Projection`)：选择返回字段

在很多情况下，我们不需要文档的所有字段。投影允许我们只返回需要的字段，减少网络传输和内存开销。

``类提供了构建投影的静态方法。import static .*;
// ...
("--- 查询name为Alice的文档，并只返回name和score字段 ---");
for (Document doc : (eq("name", "Alice"))
.projection(fields(include("name", "score"), excludeId()))) { // excludeId()排除默认的_id字段
(());
}

`include()`方法用于包含指定的字段，`excludeId()`用于排除默认包含的`_id`字段。`exclude()`方法用于排除指定字段。

5. 排序 (`Sort`)：控制结果顺序

`sort()`方法用于指定查询结果的排序规则。

``类提供了构建排序的静态方法。import static .*;
// ...
("--- 查询所有文档，按age升序，再按score降序排序 ---");
for (Document doc : ()
.sort(orderBy(ascending("age"), descending("score")))) {
(());
}

`ascending()`用于升序，`descending()`用于降序。`orderBy()`可以接受多个排序条件。

6. 分页 (`Pagination`)：`skip()`和`limit()`

在处理大量数据时，分页是必不可少的。`skip()`用于跳过指定数量的文档，`limit()`用于限制返回文档的数量。("--- 分页查询：跳过第一条，返回两条文档 (按name升序) ---");
int pageNumber = 1; // 第二页 (从0开始)
int pageSize = 2;
for (Document doc : ()
.sort(ascending("name")) // 分页通常需要稳定的排序
.skip(pageNumber * pageSize)
.limit(pageSize)) {
(());
}

注意：对于非常大的数据集和深分页，`skip`的性能会下降。在这种情况下，推荐使用基于游标或上次查询到的`_id`进行范围查询的分页方式。

7. 高级查询：聚合框架 (`Aggregation Framework`)

聚合框架是MongoDB中最强大的数据处理工具之一，它允许您通过管道（pipeline）的方式对数据进行转换和分析。每个管道阶段（stage）对文档流进行处理，然后将结果传递给下一个阶段。

核心方法是`()`，它接受一个`List<Bson>`作为管道阶段。

7.1 常用聚合阶段

`$match`: 过滤文档（类似于`find()`）。
`$project`: 选择、重命名或添加新字段。
`$group`: 按指定键对文档分组，并对每个组执行聚合函数（如`$sum`, `$avg`, `$count`）。
`$sort`: 排序。
`$limit`: 限制文档数量。
`$skip`: 跳过文档。
`$lookup`: 执行左外连接（类似SQL JOIN）。

7.2 聚合查询示例：计算城市人口和平均分数

需求：按城市分组，计算每个城市的用户数量和平均分数。import ;
import static .*;
import static .*;
import static .*;
// ...
("--- 聚合查询：按城市统计人数和平均分数 ---");
// 聚合管道
List<Bson> pipeline = (
// 阶段1: $match - 可选，这里我们匹配所有文档
// (exists("city")),
// 阶段2: $group - 按城市分组，计算人数和平均分数
("$city",
sum("totalUsers", 1), // 每找到一个文档，totalUsers加1
avg("averageScore", "$score") // 计算score字段的平均值
),
// 阶段3: $project - 调整输出字段，_id默认是分组键
(fields(
computed("city", "$_id"), // 将_id字段重命名为city
include("totalUsers", "averageScore"),
excludeId() // 排除原来的_id
)),
// 阶段4: $sort - 按用户数量降序排序
(descending("totalUsers"))
);
for (Document doc : (pipeline)) {
(());
}

这个例子展示了如何结合`$group`和`$project`来获得经过转换和汇总的数据。`Aggregates`类提供了构建各种聚合阶段的静态方法，`Accumulators`类则用于`$group`阶段的累加器。

8. 使用POJO进行对象映射

直接使用`Document`对象操作数据虽然灵活，但在复杂的应用中，将MongoDB文档映射到Java的普通Java对象（POJO）通常更为方便和类型安全。

8.1 定义POJO类

import ;
import ;
public class User {
private ObjectId id; // MongoDB的_id通常是ObjectId类型
private String name;
private int age;
private String city;
private int score;
private String email; // 可能存在，也可能不存在
// 构造函数
public User() {}
public User(String name, int age, String city, int score) {
= name;
= age;
= city;
= score;
}
// Getters and Setters
public ObjectId getId() { return id; }
public void setId(ObjectId id) { = id; }
public String getName() { return name; }
public void setName(String name) { = name; }
public int getAge() { return age; }
public void setAge(int age) { = age; }
public String getCity() { return city; }
public void setCity(String city) { = city; }
public int getScore() { return score; }
public void setScore(int score) { = score; }
public String getEmail() { return email; }
public void setEmail(String email) { = email; }
@Override
public String toString() {
return "User{" +
"id=" + id +
", name='" + name + '\'' +
", age=" + age +
", city='" + city + '\'' +
", score=" + score +
", email='" + email + '\'' +
'}';
}
}

8.2 配置POJO编解码器

我们需要配置一个CodecRegistry，让MongoDB驱动知道如何将BSON文档转换为POJO，反之亦然。import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import ;
import static ;
public class MongoDBPojoQuery {
private static final String CONNECTION_STRING = "mongodb://localhost:27017";
private static final String DATABASE_NAME = "mydatabase";
private static final String COLLECTION_NAME = "mycollection"; // 仍然使用这个集合
public static void main(String[] args) {
// 配置POJO编解码器
CodecProvider pojoCodecProvider = ().automatic(true).build();
CodecRegistry pojoCodecRegistry = ((),
(pojoCodecProvider));
// 构建MongoClientSettings
MongoClientSettings settings = ()
.applyToClusterSettings(builder ->
((new ServerAddress("localhost", 27017))))
.codecRegistry(pojoCodecRegistry) // 应用POJO编解码器
.build();
try (MongoClient mongoClient = (settings)) {
MongoDatabase database = (DATABASE_NAME);
MongoCollection<User> userCollection = (COLLECTION_NAME, ); // 指定POJO类型
("成功连接到MongoDB数据库 (POJO): " + DATABASE_NAME + ", 集合: " + COLLECTION_NAME);
// 示例：查询age为24的用户
("--- 查询age为24的用户 (POJO) ---");
for (User user : (eq("age", 24))) {
(user); // User的toString方法会打印友好格式
}
// 示例：插入一个新的User对象
("--- 插入新的User对象 ---");
User newUser = new User("Frank", 29, "Berlin", 85);
(newUser);
("新用户插入成功: " + newUser);
// 验证插入
("--- 验证新用户Frank ---");
for (User user : (eq("name", "Frank"))) {
(user);
}
} catch (Exception e) {
("连接MongoDB或执行操作时发生错误: " + ());
();
}
}
}