精读-学习笔记

Basic

docs

intro

  • DB-Engines 排名
  • 重新定义OLTP数据库 - (tips:OLAP)
  • JSON Document 以JSON为数据模型的文档数据库
  • MongoDB Inc.
  • 建模可选/横向扩展可以支撑很大的数据量和并发
  • 社区版(SSPL)/企业版(商业协议)
  • 数据容量-理论上没有上限

history

0.x 2008
1.x 2010 - 支持复制集(高可用)和分片集
2.x 2012 - 数据库功能
3.x 2014 - WiredTiger + 生态
4.x 2018 - 分布式事务支持

闲话

  • 竞品:
    14年,微软推出了DocumentDB预览版,17年5月升级为Cosmos DB(包含多个数据模型,文档模型成为子集)
    MongoDB-易用性! 稳定性(丢数据,安全,分布式处理能力)?
    DocumentDB-Leslie Lamport(对事务的处理,自动索引,PaaS服务)
    做成了Windows Azure的一个服务
    17年,提供了兼容MongoDB的API
    (17年1月,黑客大量袭击了默认安装的MongoDB)


  • DoubleCLick原创始人(Dwight Merriman, Kevin Ryan, Eliot Horowitz)
    原先想做一个云计算的服务的
    然后先搭一个数据库

mongo - humongous - 海量数据库 - 面向集合,模式自由,文档型数据库(Accelerate development, address diverse data sets, and adapt quickly to change with a proven application data platform built around the database most wanted by developers 4 years running.)

PS:SQL是IBM出来的

10gen 在 2009年2月正式开源MongoDB的第一个版本

商业上-资助用户组,对社区的支持,技术支持团队-nice(用户体验)

13年更名 MongoDB公司

advantage

  • 面向开发者的易用&&高效数据库
  • 对象模型(Objects=>Database)—— 传统关系数据库,复杂的关系模型
  • 快速响应业务变化(可动态增加新字段)
    • 多形性:同一个集合中,可以包含不同字段的文档对象
    • 动态性:线上修改数据模式,修改时应用与数据库均无需下线
    • 数据治理:支持使用JSON Schema来规范数据模式。在保证模式灵活动态的前提下,提供数据治理能力
  • JSON模型(快速灵活)
    • 数据库引擎只需要在一个存储区读写(对物理存储有优势,节约了定位时间)
    • 反范式,无关联的组织极大优化查询速度
    • 程序API自然,开发快速(API查询)
  • 分布式(原生的高可用)
    • Replica Set 复制集(2-50个成员)3个节点以上
    • 自动恢复
    • 多中心容灾
    • 滚动服务-最小化服务终端(无需下线)
  • 横向扩展能力
    • 需要的时候无缝扩展
    • 对应用全透明
    • 多种数据分布策略
    • 支持TB-PB数量级

install

  • 企业/社区
  • 偶数版
  • version/os/package
  • https://docs.mongodb.com/manual/administration/install-community/
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    34
    35
    36
    37
    38
    39
    40
    41
    42
    43
    44
    45
    46
    47
    48
    49
    50
    51
    52
    53
    54
    55
    56
    57

    # centos - 本地安装
    # 新建一个/etc/yum.repos.d/mongodb-org-4.2.repo,这样我们可以用yum来安装
    [mongodb-org-4.2]
    name=MongoDB Repository
    baseurl=https://repo.mongodb.org/yum/redhat/$releasever/mongodb-org/4.2/x86_64/
    gpgcheck=1
    enabled=1
    gpgkey=https://www.mongodb.org/static/pgp/server-4.2.asc

    # 然后安装最近的稳定版本
    sudo yum install -y mongodb-org

    # 启动社区版
    # 默认会在/var/lib/mongo(data) /var/log/mongodb(log),如果想要改到自己创建的目录,可以修改/etc/mongod.conf文件
    sudo chown -R mongod:mongod <directory> # 注意权限问题

    # 看用systemctl(较新版本Linux) 还是 service (较老版本),可以用"ps --no-headers -o comm 1"查,我这边centos7,用的是systemctl
    systemctl start mongod

    # 如果报错“Failed to start mongod.service: Unit mongod.service not found.”
    systemctl daemon-reload

    # 查看是否成功启动
    systemctl status mongod

    # 如果想随着系统reboot开启
    systemctl enable mongod

    # 关
    systemctl stop mongod

    # 重启
    systemctl restart mongod

    # 使用
    mongo

    # MacOS - 自己下载安装
    # https://docs.mongoing.com/install-mongodb/install-mongodb-community-edition/install-on-macos
    xcode-select --install
    brew tap mongodb/brew
    brew install mongodb-community@4.4
    # 本质上也是下载下面的文件Updating Homebrew...
    ==> Installing mongodb-community from mongodb/brew
    ==> Downloading https://fastdl.mongodb.org/tools/db/mongodb-database-tools-macos-x86_64-100.3.1.zip
    ==> Downloading https://fastdl.mongodb.org/osx/mongodb-macos-x86_64-4.4.5.tgz
    ==> Installing dependencies for mongodb/brew/mongodb-community: mongodb-database-tools
    ==> Installing mongodb/brew/mongodb-community dependency: mongodb-database-tools

    # 如果有报错,```brew uninstall mongodb```之后再安装
    brew services start mongodb/brew/mongodb-community

    # 云部署
    Atlas免费测试账号:
    可以cloud.mongodb.com,注册登录之后就可以免费创建集群了(白名单ip+用户名密码)
    然后用命令行连接集群
1
2
3
4
# mongorestore 
curl -O -k https://xxx.xxx.com/dump.tar.gz
tar -xvf dump.tar.gz
mongorestore /dump

查看工具

  • studio3T
  • NoSQL Booster

grafana:
https://grafana.com/grafana/dashboards/8339

  • mongoDB compass(官方,免费,好用)
    • mongodb compass,左下角,点击 _MONGOSH BETA 也能进入shell模式
    • documents 切换view的模式,Interactive Document Editor.Modify existing documents with greater confidence using the intuitive visual editor, or insert new documents and clone or delete existing ones in just a few clicks.
    • schema 子文档的字段也能看,分析,compass特有功能;Visualize your Schema.MongoDB Compass analyzes your documents and displays rich structures within your collections through an intuitive GUI. It allows you to quickly visualize and explore your schema to understand the frequency, types and ranges of fields in your data set.
    • 执行查询的时候;Visual Explain Plans.Know how queries are running through an easy-to-understand GUI that helps you identify and resolve performance issues.
    • Performance Charts.Real-time server statistics let you view key server metrics and database operations. Drill down into database operations easily and understand your most active collections.
    • Schema Validation.Create schema validation rules with a smart editor that auto-suggests rule components. See immediate results with a live preview and revise rules as needed. See Schema Validation in the MongoDB documentation for more information.
    • Deployment Awareness;Replica set aware connections allow for continued use during replica set configuration changes and provides additional information of the connected cluster.
    • Query History;Easily access and manage executed queries and save favorites for often executed queries.

操作

  • find - 查询,类似于SELECT;返回的是游标;$and:[] $or:[] ;正则 /^B/;
    • 使用游标对象的API可以对全部结果进行遍历
    • DBQuery.shellBatchSize
    • 查询条件和SQL的对照 a <= 1 {a:{$lte:1}} ,a = 1 AND b = 1 {$and: [{a:1},{b:1}]}
    • $ 是mongo里面特殊的符号 查询逻辑运算符 $lt ,因为在mongo里面,需要要key:value
    • 支持使用field.sub_field db.barcode.find({"volumes.pdfUrl": "www.baidu.com"})
    • 使用find搜索数组(注意存的类型是数组,还是数组stringfy之后的字符串),数组子文档也可以搜 . $elemMatch
    • 可以返回指定字段 Projection 投影
    • .pretty()
  • remove
    • 需要配合查询条件使用
  • update
    • 查询条件,更新字段
    • {$set:{}} 各种操作方法
  • drop
    • db..drop() 集合中的全部文档和索引都会被删除
    • 不要在生产上轻易操作
    • db.dropDatabase() 数据库就删了

程序访问mongodb

  • python pip install pymongo
  • mongoDB连接串 比如有—— mongodb://数据库服务器主机地址:端口号
  • 我们可以进行一系列操作(按文档),mongo-无模式
  • 更新用户 update_one 我们没有去数据库修改表结构
  • 代码量少

聚合

  • 做的是sql里面as ,groupby , leftjoin 的操作
  • aggregation framework - 计算框架
  • pipeline = [$stage1,$stage2, …$stageN]
  • db..aggregate(pipeline,{ options })
  • $match -过滤 WHERE | $ project -投影 SELECT AS | $sort -排序 ORDER BY | $group -分组 GROUP BY | $skip/$limit -结果限制 SKIP/LIMIT | $lookup -左外连接(关联) LEFT OUTER JOIN
  • 常见步骤中的运算符
  • 非常见步骤,mongo特有 $unwind - 展开数组 | $graphLookup - 图搜索 | $facet/$bucket - 分面搜索(电商常用)
  • OLTP | OLAP