如果插入文档时没有 _id 键,系统会自动创建。MongoDB中存储的文档必须有这个“_id”键。这个键的值可以是任意类型,默认是个ObjectId对象,每个文档有唯一的 _id ,确保集合中的每个文档都会被唯一标示。
ObjectId是 _id 的默认类型,不同的机器都能用全局唯一的同种方法方便的生成。因为MongoDB初衷是用作分布式数据库,在多个服务器的分片环境中生成唯一标识符非常重要。
ObjectId使用12字节的存储空间,是一个由24个十六进制数组组成的字符串。
- 0-3位,共4位,是从标准纪元开始的时间戳,单位为秒。
- 时间戳与4-8这5位,提供了秒级别的唯一性。
- 由于时间戳在前,意味着ObjectId大致会按照插入的顺序排列。
- 隐含了文档创建时间,绝大多数驱动也都会提供一个方法来从ObjectId中获取这个时间
- 4-6位,共3位,是所在主机的唯一标识符。通常是机器主机名的散列值。这样能确保不同主机生成不同的ObjectId,不产生冲突。
- 7-8位,共2位,来自产生ObjectId的进程的进程标识符,为了确保在同一台机器上并发的多个进程产生的ObjectId是唯一的。
- 这样前9个字节就保证了同一秒钟不同机器不同进程产生的ObjectId是唯一的。最后3个字节是一个自动增加的计数器,确保相同进程的同一秒产生的ID也是不同的。一秒钟最多运行每个进程拥有256^3(共16777216)个不同的ObjectId。
另外,_id 主键的生成,可以由MongoDB服务器来做,但通常是由客户端由客户端的驱动程序完成的。这个做法很好的体现了MongoDB的哲学:能交给客户端驱动程序来做的事情就不要交给服务器来做。原因是,即便像MongoDB这样扩展性非常好的数据库,扩展应用层也要比扩展数据库层容易得多。将工作交给客户端来处理,就减轻了数据库扩展的负担。
ObjectId构成
之前我们使用MySQL等关系型数据库时,主键都是设置成自增的。但在分布式环境下,这种方法就不可行了,会产生冲突。为此,MongoDB采用了一个称之为ObjectId的类型来做主键。ObjectId是一个12字节的 BSON 类型字符串。按照字节顺序,一次代表:
4字节:UNIX时间戳
3字节:表示运行MongoDB的机器
2字节:表示生成此_id的进程
3字节:由一个随机数开始的计数器生成的值
ObjectId获取时间
从ObjectId的构造上来看,内部就嵌入了时间类型。我们肯定可以从中获取时间信息:即插入此文档时的时间。MongoDB对ObjectId对象提供了getTimestamp()方法来获取ObjectId的时间。
a = new ObjectId()
ObjectId(“53102b43bf1044ed8b0ba36b”)
a.getTimestamp()
ISODate(“2014-02-28T06:22:59Z”)
根据时间构造ObjectId
上例是直接使用MongoDB提供的新建方法来构造ObjectId的,我们自己可不可以通过字符串来构造呢?看下例:
// 使用Date的字符串构造方法生成日期
// 然后使用Date对象的getTime获取毫秒数,再除以1000得到标准时间戳
a = new Date(“2012-12-12 00:00:00”).getTime()/1000
1355241600
// 获取时间戳的标准十六进制表示
a = a.toString(16)
50c75880
// 在后面填补16个0
a = a + new Array(17).join(“0”)
50c758800000000000000000
// 使用24个字符串构造ObjectId
b = new ObjectId(a)
ObjectId(“50c758800000000000000000”)
// 获取时间以验证
b.getTimestamp()
ISODate(“2012-12-11T16:00:00Z”)
上述过程中 new Array(17).join(“0″)目的是生成16个0拼接的字符串。
这里使用了点小技巧。new Array(17)构造了一个17个元素的数组,但是数组里面没有元素,join(atr)方法的作用是连接数组元素并且以其参数分割。17个元素正好有16个间隔,所以最终拼接起来的字符串为16个。
根据ObjectId按照插入时间排序
MongoDB默认在ObjectId上建立索引,是按照插入时间排序的。我们可以使用此索引进行查询和排序。
// 按序插入三个文档
db.col.insert({“num”:1})
db.col.insert({“num”:2})
db.col.insert({“num”:3})
db.col.find().pretty()
{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 }
{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 }
{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }
// 按照_id升序,即按照插入时间升序
db.col.find().sort({“_id”:1}).pretty()
{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 }
{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 }
{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }
// 按照_id降序,即按照插入时间降序
db.col.find().sort({“_id”:-1}).pretty()
{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }
{ “_id” : ObjectId(“53102fb9bf1044ed8b0ba36d”), “num” : 2 }
{ “_id” : ObjectId(“53102fb4bf1044ed8b0ba36c”), “num” : 1 }
// 抽取num = 2的ObjectId用来过滤
num2 = ObjectId(“53102fb9bf1044ed8b0ba36d”)
ObjectId(“53102fb9bf1044ed8b0ba36d”)
// 找出插入时间在num2之后的数据
db.col.find({ “_id”:{$gt:num2}}).pretty()
{ “_id” : ObjectId(“53102fbabf1044ed8b0ba36e”), “num” : 3 }