发布于 2014-11-27 01:58:22 | 245 次阅读 | 评论: 0 | 来源: 网友投递
这里有新鲜出炉的MongoDB手册,程序狗速度看过来!
MongoDB 分布式文件存储的数据库
MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
本文为大家整理汇总了MongoDB使用技巧,感兴趣的同学参考下。
MongoDB 是一个基于分布式文件存储的数据库。由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。
1、使用正确的类型
用正确的类型存放数据大有裨益。数据类型影响数据的查询方式、数据存放顺序和以及占用多少空间。
数字:做为数字使用的字段就用数字存储。也就是做计算或按照大小排序的字段
数据库会自动转换溢出的(比如由于$inc操作导致的溢出) 32位浮点数,将其变为64位整数。
日期:一班的用yyy-mm-dd形式的字符串就可以,如果date类型就会总会匹配到毫秒级别
objectId就要作为objectId存储,千万不要存成字符串。这点非常重要,原因是方便查询 二是objectd中含有用的信息,绝大多数驱动都是从有方法中获得文档的创建日期。 第三objectId表示要多占两陪的磁盘空间。
2、用简单唯一的id替代_id
要是数据库没用唯一的字段,那么就用默认的objetId来做_id。但是若是数据本身就有唯一的字段,并且不需要objectId的功能,那么就用自己唯一的之覆盖默认的id就好了。
3、不要用文档做_id
除了不可避免的情况(mapreduce的输出),通常都不应该将文档作为_id。问题在于索引一个文档中的字段和索引文档完全不一样。如果没有每次查询每个子文档的计划,最后会有多个索引。
4、不要用数据库引用
数据库引用一般形式是:{$id:主键,$ref:collectionName}(也可以有可选的$db字段,表示数据库)。若被引用的文档集合是确定的,不妨只用_id引用,这样就同时比用Id和集合名要节省空间。 如果知道要引用的集合,数据库引用就显得浪费空间。
5、不要用GridFS处理小的二进制数据
GridFS需要查询两次,一次获取文件的元信息,另一次获取内容,所以如果用GridFS存储小文件,会使应用查询次数加倍。从根本上说,GridFS是用来将大的二进制对象切成小片存在数据库中。
6、处理“无缝”故障切换
假设发送给服务器一个请求,得到了网络错误,这时驱动有很多选择。若驱动知道有另一台服务器是否自动对其发送请求?要是驱动发送原请求后发生网络故障,或者在服务端响应时候发送故障怎么办?数据库可能已经处理了请求,就不必再次发送。
7、处理复制组失效以及故障恢复
可能出现的情况:
应用抛出异常“not master”异常可能原因:1 . 复制组正在进行故障恢复 2, 网络状况不好,无法链接诶主节点。3.应用链接节点有问题,无法降级为只读节点。
8、尽量减少磁盘访问
内存访问要比磁盘访问快得多。所以使用优化的本质就是尽可能地减少对磁盘的访问。
内存的读取速度要比磁盘速度快一百万倍。读磁盘要消耗很长时间。几种简单的办法:
使用SSD(固态硬盘);增加内存可以减少对硬盘的读取,让常用的文档在内存中;
9、使用索引减少内存占用
索引是有序的,所以不必遍历全部项。当查询时候会先根据索引查到索引中的结果,然后符合条件的文档加载到内存中,从而减少内存占用。
10、不要到处使用索引
这里要注意,不是所有的查询都可以用索引的。索引一般用在返回结果只是总体数据的一小部分的时候。根据经验,一旦要大约返回集合一半的数据就不要使用索引了。
若是已经对某个字段建立了索引,又想在大规模模糊查询时候不使用它(因为使用时候可能较低效)可以使用自然排序,用{“$natural”:1}来强制mongodb禁用索引。自然排序就是“按照磁盘上的存储顺序返回数据”,这样mongodb就不会使用索引了。
11、索引覆盖查询
如果只想返回某些字段且所有这些字段都可放在索引中,mong odb可以做索引覆盖查询(covered index query),这种查询不会访问指针指向的文档,二是直接用索引的数据返回结果。
例如: db.foo.ensuIndex({x:1, y :1,z:1})
现在查询被索引的字段,并只要求返回这些字段,mongodb就没必要加载整个文档。
db,foo.find({x: ceriteria, y: ceriteria})
这样的查询仅仅访问了索引的数据,而没有访问整个集合的数据;
12、使用复合索引加快多个查询
查询只要和索引开头部分匹配就能利用索引,所以创建索引时要考虑这些查询依赖的所有字段。并且根据各个字段查询的频率定义索引字段顺序;
13、通过建立分级文档加快扫描
将数组组织有层次话,不仅可以让其看着更有条理,还可以让mongodb在偶尔没有索引时候也能快速查询。
如果文档没有层次结构的话,mongodb必须遍历文档中的每个字段。合理使用层次可以减少mongodb对字段的访问。
14、AND型查询要点
假设要查询满足条件A,B和C的文档,满足A的文档有4万,满足B的有9K,满足C的是200,那么应该用C and B and A 这样只需要查询200条记录。
这就是说要是已知某个查询条件更加苛刻,那要将放置在最前面;
15:OR型查询要点
OR型查询与AND查询恰好相反,匹配最多的查询语句放在最前面,因为Mongodb每次都要匹配不在结果集中的文档。