One - One Code All

Blog Content

MongoDB中ObjectId生成规则参考

Nosql   2016-08-03 22:48:56

如果插入文档时没有 _id 键,系统会自动创建。MongoDB中存储的文档必须有这个“_id”键。这个键的值可以是任意类型,默认是个ObjectId对象,每个文档有唯一的 _id ,确保集合中的每个文档都会被唯一标示。 

ObjectId是 _id 的默认类型,不同的机器都能用全局唯一的同种方法方便的生成。因为MongoDB初衷是用作分布式数据库,在多个服务器的分片环境中生成唯一标识符非常重要。 

ObjectId使用12字节的存储空间,是一个由24个十六进制数组组成的字符串。 

- 0-3位,共4位,是从标准纪元开始的时间戳,单位为秒。 

- 时间戳与4-8这5位,提供了秒级别的唯一性。 

- 由于时间戳在前,意味着ObjectId大致会按照插入的顺序排列。 

- 隐含了文档创建时间,绝大多数驱动也都会提供一个方法来从ObjectId中获取这个时间 

- 4-6位,共3位,是所在主机的唯一标识符。通常是机器主机名的散列值。这样能确保不同主机生成不同的ObjectId,不产生冲突。 

- 7-8位,共2位,来自产生ObjectId的进程的进程标识符,为了确保在同一台机器上并发的多个进程产生的ObjectId是唯一的。 

- 这样前9个字节就保证了同一秒钟不同机器不同进程产生的ObjectId是唯一的。最后3个字节是一个自动增加的计数器,确保相同进程的同一秒产生的ID也是不同的。一秒钟最多运行每个进程拥有256^3(共16777216)个不同的ObjectId。


另外,_id 主键的生成,可以由MongoDB服务器来做,但通常是由客户端由客户端的驱动程序完成的。这个做法很好的体现了MongoDB的哲学:能交给客户端驱动程序来做的事情就不要交给服务器来做。原因是,即便像MongoDB这样扩展性非常好的数据库,扩展应用层也要比扩展数据库层容易得多。将工作交给客户端来处理,就减轻了数据库扩展的负担。


ObjectId构成


之前我们使用MySQL等关系型数据库时,主键都是设置成自增的。但在分布式环境下,这种方法就不可行了,会产生冲突。为此,MongoDB采用了一个称之为ObjectId的类型来做主键。ObjectId是一个12字节的 BSON 类型字符串。按照字节顺序,一次代表:


4字节:UNIX时间戳 

3字节:表示运行MongoDB的机器 

2字节:表示生成此_id的进程 

3字节:由一个随机数开始的计数器生成的值 

ObjectId获取时间


从ObjectId的构造上来看,内部就嵌入了时间类型。我们肯定可以从中获取时间信息:即插入此文档时的时间。MongoDB对ObjectId对象提供了getTimestamp()方法来获取ObjectId的时间。


a = new ObjectId() 

ObjectId(“53102b43bf1044ed8b0ba36b”) 

a.getTimestamp() 

ISODate(“2014-02-28T06:22:59Z”) 

根据时间构造ObjectId


上例是直接使用MongoDB提供的新建方法来构造ObjectId的,我们自己可不可以通过字符串来构造呢?看下例:


// 使用Date的字符串构造方法生成日期 

// 然后使用Date对象的getTime获取毫秒数,再除以1000得到标准时间戳


a = new Date(“2012-12-12 00:00:00”).getTime()/1000 

1355241600 

// 获取时间戳的标准十六进制表示 

a = a.toString(16) 

50c75880


// 在后面填补16个0


a = a + new Array(17).join(“0”) 

50c758800000000000000000


// 使用24个字符串构造ObjectId


b = new ObjectId(a) 

ObjectId(“50c758800000000000000000”)


// 获取时间以验证


b.getTimestamp() 

ISODate(“2012-12-11T16:00:00Z”) 

上述过程中 new Array(17).join(“0″)目的是生成16个0拼接的字符串。


这里使用了点小技巧。new Array(17)构造了一个17个元素的数组,但是数组里面没有元素,join(atr)方法的作用是连接数组元素并且以其参数分割。17个元素正好有16个间隔,所以最终拼接起来的字符串为16个。


根据ObjectId按照插入时间排序


MongoDB默认在ObjectId上建立索引,是按照插入时间排序的。我们可以使用此索引进行查询和排序。


// 按序插入三个文档


db.col.insert({“num”:1}) 

db.col.insert({“num”:2}) 

db.col.insert({“num”:3}) 

db.col.find().pretty() 

{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 } 

{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 } 

{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }


// 按照_id升序,即按照插入时间升序


db.col.find().sort({“_id”:1}).pretty() 

{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 } 

{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 } 

{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }


// 按照_id降序,即按照插入时间降序


db.col.find().sort({“_id”:-1}).pretty() 

{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 } 

{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 } 

{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 }


// 抽取num = 2的ObjectId用来过滤


num2 = ObjectId(“53102fb9bf1044ed8b0ba36d”) 

ObjectId(“53102fb9bf1044ed8b0ba36d”)


// 找出插入时间在num2之后的数据


db.col.find({ “_id”:{$gt:num2}}).pretty() 

{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }



上一篇:Mongodb中插入数据后自动返回自增ID
下一篇:MongoDB初步使用

The minute you think of giving up, think of the reason why you held on so long.