发布于 2014-11-27 01:58:22 | 245 次阅读 | 评论: 0 | 来源: 网友投递

这里有新鲜出炉的MongoDB手册,程序狗速度看过来!

MongoDB 分布式文件存储的数据库

MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。


本文为大家整理汇总了MongoDB使用技巧,感兴趣的同学参考下。

MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。

1、使用正确的类型

用正确的类型存放数据大有裨益。数据类型影响数据的查询方式、数据存放顺序和以及占用多少空间。 
 
数字:做为数字使用的字段就用数字存储。也就是做计算或按照大小排序的字段
数据库会自动转换溢出的(比如由于$inc操作导致的溢出) 32位浮点数,将其变为64位整数。 
 
日期:一班的用yyy-mm-dd形式的字符串就可以,如果date类型就会总会匹配到毫秒级别
 
objectId就要作为objectId存储,千万不要存成字符串。这点非常重要,原因是方便查询 二是objectd中含有用的信息,绝大多数驱动都是从有方法中获得文档的创建日期。 第三objectId表示要多占两陪的磁盘空间。 

2、用简单唯一的id替代_id

要是数据库没用唯一的字段,那么就用默认的objetId来做_id。但是若是数据本身就有唯一的字段,并且不需要objectId的功能,那么就用自己唯一的之覆盖默认的id就好了。

3、不要用文档做_id

除了不可避免的情况(mapreduce的输出),通常都不应该将文档作为_id。问题在于索引一个文档中的字段和索引文档完全不一样。如果没有每次查询每个子文档的计划,最后会有多个索引。

4、不要用数据库引用

数据库引用一般形式是:{$id:主键,$ref:collectionName}(也可以有可选的$db字段,表示数据库)。若被引用的文档集合是确定的,不妨只用_id引用,这样就同时比用Id和集合名要节省空间。 如果知道要引用的集合,数据库引用就显得浪费空间。
 

5、不要用GridFS处理小的二进制数据

GridFS需要查询两次,一次获取文件的元信息,另一次获取内容,所以如果用GridFS存储小文件,会使应用查询次数加倍。从根本上说,GridFS是用来将大的二进制对象切成小片存在数据库中。

6、处理“无缝”故障切换

假设发送给服务器一个请求,得到了网络错误,这时驱动有很多选择。若驱动知道有另一台服务器是否自动对其发送请求?要是驱动发送原请求后发生网络故障,或者在服务端响应时候发送故障怎么办?数据库可能已经处理了请求,就不必再次发送。

7、处理复制组失效以及故障恢复 

可能出现的情况:
应用抛出异常“not master”异常可能原因:1 . 复制组正在进行故障恢复 2, 网络状况不好,无法链接诶主节点。3.应用链接节点有问题,无法降级为只读节点。
 

8、尽量减少磁盘访问

内存访问要比磁盘访问快得多。所以使用优化的本质就是尽可能地减少对磁盘的访问。 
 
内存的读取速度要比磁盘速度快一百万倍。读磁盘要消耗很长时间。几种简单的办法:
使用SSD(固态硬盘);增加内存可以减少对硬盘的读取,让常用的文档在内存中;

9、使用索引减少内存占用

索引是有序的,所以不必遍历全部项。当查询时候会先根据索引查到索引中的结果,然后符合条件的文档加载到内存中,从而减少内存占用。

10、不要到处使用索引

这里要注意,不是所有的查询都可以用索引的。索引一般用在返回结果只是总体数据的一小部分的时候。根据经验,一旦要大约返回集合一半的数据就不要使用索引了。 
 
若是已经对某个字段建立了索引,又想在大规模模糊查询时候不使用它(因为使用时候可能较低效)可以使用自然排序,用{“$natural”:1}来强制mongodb禁用索引。自然排序就是“按照磁盘上的存储顺序返回数据”,这样mongodb就不会使用索引了。 

11、索引覆盖查询

如果只想返回某些字段且所有这些字段都可放在索引中,mong odb可以做索引覆盖查询(covered index query),这种查询不会访问指针指向的文档,二是直接用索引的数据返回结果。
 
例如: db.foo.ensuIndex({x:1, y :1,z:1})
现在查询被索引的字段,并只要求返回这些字段,mongodb就没必要加载整个文档。
db,foo.find({x: ceriteria, y: ceriteria})
 
这样的查询仅仅访问了索引的数据,而没有访问整个集合的数据;

12、使用复合索引加快多个查询

查询只要和索引开头部分匹配就能利用索引,所以创建索引时要考虑这些查询依赖的所有字段。并且根据各个字段查询的频率定义索引字段顺序;

13、通过建立分级文档加快扫描

将数组组织有层次话,不仅可以让其看着更有条理,还可以让mongodb在偶尔没有索引时候也能快速查询。 
如果文档没有层次结构的话,mongodb必须遍历文档中的每个字段。合理使用层次可以减少mongodb对字段的访问。 
 

14、AND型查询要点

假设要查询满足条件A,B和C的文档,满足A的文档有4万,满足B的有9K,满足C的是200,那么应该用C and B and A 这样只需要查询200条记录。
 
这就是说要是已知某个查询条件更加苛刻,那要将放置在最前面;

15:OR型查询要点

OR型查询与AND查询恰好相反,匹配最多的查询语句放在最前面,因为Mongodb每次都要匹配不在结果集中的文档。


最新网友评论  共有(0)条评论 发布评论 返回顶部

Copyright © 2007-2017 PHPERZ.COM All Rights Reserved   冀ICP备14009818号  版权声明  广告服务