文章出處

回到目錄

mongoDB的管道是個好東西,它可以將很多操作批處理實現,即將多個命令放入一個管道,然后去順序的執行它們,今天我要說的是,利用管道中的分組來實現實現中的ditinct+group的效果,即先對一個元素去重,然后即一個字段進行分組,如你的userinfoID,它對應多個planID,而我們在planID在表中肯定是重復的,這時,我們需要統計userinfo對應多個種planID,這時問題就來了,尤于planID是重復的,所以分組的結果可能是錯誤的,它并不是真正意思上的(planID種類),正確的作法應該是先對planID去重復,然后再根據userinfoID去作分組,而這個在大多數的數據庫里,是通過多重分組實現的,即選對userinfoID和planID進行分組,然后對結果進行userinfoID的分組,這種就把多于的planID去掉了。

具體作法:

//多分組(group+distinct)
db.M_User_Footprints.aggregate([
                 { $group: { _id: { UserInfoID: "$UserInfoID", ObjID: "$PlayVideo.ObjID" } } },
                 { $group: { _id: "$_id.UserInfoID", count: { $sum: 1 } } },
                 { $sort: { "_id": 1 } }
]);

注意,這里的第二個分組用的是第一個分組的_id,所以加上了$_id,這表示使用上面group的數據源來作為第二個分組的鍵。

而如果只是單個分組,就很容易實現了,也看一下代碼

//單分組
db.M_User_Footprints.aggregate([
    { $group: { _id: "$UserInfoID", result: { $sum: 1 } } }
])

從上面兩段代碼我們可以看到,分組鍵必須用_id,分組的結果名稱可以自己定義,{$sum:1}每次自加1。

下面使用map...reduce也可以實現分組的功能

db.runCommand({
    mapreduce: "M_User_Footprints",
    map: function Map() {
       emit(
        { "UserInfoID": this.UserInfoID, "ObjID": this.PlayVideo.ObjID }
        ,
         { count: 1 }
        );
    },
    reduce: function Reduce(key, values) {
        total = 0;//定義一個變量total , values是一個數組
        for (var i in values) {
            total += values[i].count
        }

        return { "count": total };
    },
    finalize: function Finalize(key, reduced) {
        return reduced;
    },
    out: { inline: 1 }
});

 

回到目錄


文章列表




Avast logo

Avast 防毒軟體已檢查此封電子郵件的病毒。
www.avast.com


arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()