🔥码云GVP开源项目 12k star Uniapp+ElementUI 功能强大 支持多语言、二开方便! 广告
>[info] MongoDB 聚合 MongoDB 中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似**SQL**语句中的 **count(*)**。 #### **1. 聚合方法:aggregate()** **1.1 语法:** ~~~ db.collection.aggregate(AGGREGATE_OPERATION) ~~~ **1.2 示例:** ~~~ // 集合中数据如下: { _id: ObjectId(7df78ad8902c) title: 'MongoDB Overview', description: 'MongoDB is no sql database', by_user: 'runoob.com', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 100 }, { _id: ObjectId(7df78ad8902d) title: 'NoSQL Overview', description: 'No sql database is very fast', by_user: 'runoob.com', url: 'http://www.runoob.com', tags: ['mongodb', 'database', 'NoSQL'], likes: 10 }, { _id: ObjectId(7df78ad8902e) title: 'Neo4j Overview', description: 'Neo4j is no sql database', by_user: 'Neo4j', url: 'http://www.neo4j.com', tags: ['neo4j', 'database', 'NoSQL'], likes: 750 } // 合计算每个作者所写的文章数(select by_user, count(*) from mycol group by by_user) >db.test.aggregate([{$group : {_id : "$by_user",num_tutorial : {$sum : 1}}}]) // 用户为:runoob.com 文章为:2条,用户为:Neo4j 文章为:1条 { "_id" : "runoob.com", "num_tutorial" : 2 }, { "_id" : "Neo4j", "num_tutorial" : 1 } ~~~ | 表达式 | 描述 | 实例 | | --- | --- | --- | | $sum | 计算总和。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", num\_tutorial : {$sum : "$likes"}}}\]) | | $avg | 计算平均值 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", num\_tutorial : {$avg : "$likes"}}}\]) | | $min | 获取集合中所有文档对应值得最小值。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", num\_tutorial : {$min : "$likes"}}}\]) | | $max | 获取集合中所有文档对应值得最大值。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", num\_tutorial : {$max : "$likes"}}}\]) | | $push | 将值加入一个数组中,不会判断是否有重复的值。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", url : {$push: "$url"}}}\]) | | $addToSet | 将值加入一个数组中,会判断是否有重复的值,若相同的值在数组中已经存在了,则不加入。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", url : {$addToSet : "$url"}}}\]) | | $first | 根据资源文档的排序获取第一个文档数据。 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", first\_url : {$first : "$url"}}}\]) | | $last | 根据资源文档的排序获取最后一个文档数据 | db.mycol.aggregate(\[{$group : {\_id : "$by\_user", last\_url : {$last : "$url"}}}\]) | >[info] MongoDB 管道 管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。 MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。 ### **聚合框架中常用的几个操作:** * $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。 * $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。 * $limit:用来限制MongoDB聚合管道返回的文档数。 * $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。 * $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。 * $group:将集合中的文档分组,可用于统计结果。 * $sort:将输入文档排序后输出。 * $geoNear:输出接近某一地理位置的有序文档。 #### **1. $project 示例:** ``` // 只查询 title 和 descripytion 两个列 >db.test.aggregate({$project : {title : 1,description : 1}}) { "_id" : ObjectId("620e1d752131f8f45ef39e28"), "title" : "NoSQL Overview", "description" : "说明" } { "_id" : ObjectId("620e1de02131f8f45ef39e29"), "title" : "NoSQL Overview1", "description" : "说明1" } // 默认情况下_id字段是被包含的,如果要想不包含_id话可以这样 >db.test.aggregate({$project : {id : 0,title : 1,description : 1}}) ``` #### **2. $match 示例:** ``` // 查询 likes 字段 大于等于10 并且 小于等于10的数据集 >db.test.aggregate([{$match : {likes : {$gte : 10 , $lte : 10}}}]) { "_id" : ObjectId("620e1d752131f8f45ef39e28"), "title" : "NoSQL Overview", "description" : "说明", "by_user" : "wqs", "url" : "www.baidu.com", "tags" : [ "mongodb", "database", "NoSQL" ], "likes" : 10 } // 并进行分组统计结果 >db.test.aggregate([{$match : {likes : {$gte : 10 , $lte : 10}}},{$group : {_id : null , count : {$sum : 1}}}]) { "_id" : null, "count" : 1 } ``` #### **3. $skip 示例:** ``` // 过滤(跳过)第一条数据,得到了第二条数据集 >db.test.aggregate({$skip : 1}) { "_id" : ObjectId("620e1de02131f8f45ef39e29"), "title" : "NoSQL Overview1", "description" : "说明1", "by_user" : "wqs1", "url" : "www.baidu1.com", "tags" : [ "mongodb", "database", "NoSQL1" ], "likes" : 11 } ```