其实在Mongodb里面存在另一种集群,它可以让满足对MongoDB数据量大量增长的需求,那就是分片技术。
当MongoDB在存储大量的数据时,只有一台机器的话可能会出现存储数据不足的情况,也可能会出现不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。
MongoDB分片
MongoDB中使用分片集群结构分布,下图所示:
图中主要有如下所述三个主要组件:
Shard:用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承担,防止主机单点故障
Config Server:mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。
Query Routers:前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。
那么为什么要使用分片?
复制所有的写入操作到主节点
延迟的敏感数据会在主节点查询
单个副本集限制在12个节点
当请求量巨大时会出现内存不足。
本地磁盘不足
垂直扩展价格昂贵
那么何时才考虑分片呢,出现如下问题时就该考虑使用分片:
当数据量达到T级别的时候,我们的磁盘,内存不够用了
单个mongod进程已经不能满足写数据的性能需要
想将大量的数据放在内存中提高性能