在PostgreSQL备份和恢复自动化干货分享!

进餐小能手 2021-09-22 18:16:38 浏览数 (2906)
反馈

关键的 PostgreSQL 客户端包含有价值的数据,应定期备份 PostgreSQL 数据库。它的过程非常简单,重要的是要清楚地了解技术和假设。

SQL 转储

这种转储方法背后的想法是使用 SQL 命令从 DataCenter1 生成一个文本文件,当反馈到 DataCenter2 服务器时,将重新创建与转储时相同状态的数据库。在这种情况下,如果客户端无法访问主服务器,他们可以访问 BCP 服务器。PostgreSQL 为此提供了实用程序 pg_dump。该命令的基本用法是:  pg_dump dbname >backupoutputfile.db。

图片标题

如您所见,pg_dump 将其结果写入标准输出。下面,我们将看到这如何有用。

pg_dump 是一个常规的 PostgreSQL 客户端应用程序。这意味着您可以从任何有权访问数据库的远程主机执行此备份过程。pg_dump 不以特殊权限运行。特别是,它必须对您要备份的所有表具有读访问权限,因此在实践中,您几乎总是必须以数据库超级用户身份运行它。

pg_dump 创建的转储在内部是一致的,也就是说,转储代表 pg_dump 开始运行时数据库的快照。pg_dump 在工作时不会阻止对数据库的其他操作。(具有排他锁的例外,例如大多数形式的 ALTER TABLE。)

重要提示:如果您的数据库模式依赖于 OID(例如作为外键),您必须指示 pg_dump 也转储 OID。为此,请使用 -o 命令行选项。

SQL 转储自动化

  • 首先,创建剧本 pgbackup.yml
  • 创建角色 pgbackup,它将从 pgbackup.yml 中调用

Pgbackup.yml

---
- hosts: database_prim:database_replica
  gather_facts: true
  vars_files:
    - mysecret_vars/{{ environ }}.yml
# This is to Identify if DB is Primary and replicating data to secondary
  tasks:
  - name: select pg status
    command: psql -c "SELECT pg_is_in_recovery();"
    register: IsPromoted
    changed_when: False
    environment:
      PGDATABASE: "{{ pg_database }}"
      PGUSER : "{{ pg_username }}"
      PGPASSWORD : "{{ pg_password }}"
#Get the DB parameter from run time on Client application, Not required if you have parameters
  - block:
    - name: Get client database settings
      shell: "awx-manage print_settings | grep '^DATABASES'"
      register: results
      changed_when: False
      delegate_to: "{{ groups['client’][0] }}"
    - name: Ingest client database settings
      set_fact:
        client_db_settings: "{{ results.stdout | regex_replace('DATABASES\\s+= ', '') }}"
      delegate_to: "{{ groups['client'][0] }}" 
    - include_role:
        name: pgbackup
    when: "'f' in IsPromoted.stdout"
  tags: pgbackup
  • pgbackup 角色
---
- name: Determine the timestamp for the backup.
  set_fact:
    now: '{{ lookup("pipe", "date +%F-%T") }}'
- name: Create a directory for a backup to live.
  file:
    path: '{{ backup_dir.rstrip("/") }}/{{ now }}/'
    mode: 0775
    owner: root
    state: directory
- name: Create a directory for non-instance specific backups
  file:
    path: '{{ backup_dir.rstrip("/") }}/common/'
    mode: 0775
    owner: root
    state: directory
# create dump, Here adding runtime param. You can add param whatever ways
- name: Perform a PostgreSQL dump.
  shell: "pg_dump --clean --create --host='{{ client_db_settings.default.HOST }}' --port={{ client_db_settings.default.PORT }} --username='{{ tower_db_settings.default.USER  }}' --dbname='{{ tower_db_settings.default.NAME }}' > pgbackup.db"
  args:
    chdir: '{{ backup_dir.rstrip("/") }}/common/'
  environment:
    PGPASSWORD: "{{ client_db_settings.default.PASSWORD }}"
- name: Copy file with owner and permissions
  copy:
    src: '{{ backup_dir.rstrip("/") }}/common/pgbackup.db'
    dest: '{{ backup_dir.rstrip("/") }}/{{ now }}/'
    remote_src: yes
  • 库存文件
  • [all:vars]
    # database settings
    .linux.us.ams1907.com
    [client]
    linuxclient.us.com
    [database_prim]
    linuxmas.us.com
    [database_replica]
    linuxreplica.us.com
  • 秘密变量存储:如果要存储任何加密数据,请创建此文件
  • mysecret_vars/{{ environ }}.yml
                  ansible-vault encrypt mysecretvar.yml

    存储此类参数:pg_password、pg_username 和 pg_database

    恢复转储

    pg_dump 创建的文本文件旨在由 psql 程序读取。恢复转储的一般命令形式是 psql dbname < infile

    在数据中心 2 中恢复

    图片标题

    Infile 是您用作 pg_dump 命令的备份输出文件的文件。该命令不会创建数据库 dbname,因此您必须在执行 psql 之前从 template0 自己创建它(例如,使用 createdb -T template0 dbname)。psql 支持类似于 pg_dump 的选项,用于指定要连接的数据库服务器和要使用的用户名。有关更多信息,请参阅 psql 参考页。

    在还原 SQL 转储之前,拥有对象或被授予转储数据库中对象权限的所有用户必须已经存在。如果不这样做,则还原将无法重新创建具有原始所有权和/或权限的对象。

    无论哪种方式,您都将拥有一个仅部分恢复的数据库。或者,您可以指定整个转储应作为单个事务恢复,以便完全完成或完全回滚恢复。这种模式可以通过将 -1 或 --single-transaction 命令行选项传递给 psql 来指定。使用此模式时,请注意,即使是最小的错误也可能回滚已运行数小时的还原。但是,这可能仍然比在部分还原转储后手动清理复杂数据库更可取。

    数据库恢复

  • 创建 pgrecover.yml
  • 为 pgrecover 创建角色
  • pgrecover.yml
  • - hosts: database_prim[0] 
      tasks:     
        - name: Get client database settings
          shell: "awx-manage print_settings | grep '^DATABASES'"
          register: results
          changed_when: False
          delegate_to: "{{ groups['client'][0] }}"
        - name: Ingest client database settings
          set_fact:
            tower_db_settings: "{{ results.stdout | regex_replace('DATABASES\\s+= ', '') }}"
          delegate_to: "{{ groups['client'][0] }}"
    # Create User
        - name: PostgreSQL | Create test user if its not there
          postgresql_user:
            name: "test"
            password: "{{ client_db_settings.default.PASSWORD }}"
            port: "5432"
            state: present
            login_user: "postgres"
            no_password_changes: no
          become: yes
          become_user: "postgres"
          become_method: su     
    # Create Database
        - name: PostgreSQL | Create test Database if its not there
          postgresql_db:
            name: "test"
            owner: "test"
            encoding: "UTF-8"
            lc_collate: "en_US.UTF-8"
            lc_ctype: "en_US.UTF-8"
            port: "5432"
            template: "template0"
            state: present
            login_user: "postgres"
          become: yes
          become_user: "postgres"
          become_method: su  
        - include_role:
            name: pgrecover
  • 现在 pgreceover 角色
  • ---
    - name: Create a directory for non-instance specific backups
      file:
        path: '{{ backup_dir.rstrip("/") }}/restore/'
        mode: 0775
        owner: root
        state: directory
    - name: Copy file for restore
      copy:
        src: '{{ backup_dir.rstrip("/") }}/common/client.db'
        dest: '{{ backup_dir.rstrip("/") }}/restore/'
        remote_src: yes
    - name: Perform a PostgreSQL restore 
     shell: "psql --host='{{ client_db_settings.default.HOST }}' --port={{ client_db_settings.default.PORT }} --username='{{ client_db_settings.default.USER }}' --dbname='test' < ./client.db"
      args:
        chdir: '{{ backup_dir.rstrip("/") }}/restore/'
      environment:
        PGPASSWORD: "{{ client_db_settings.default.PASSWORD }}"
  • 库存和秘密变量文件将与我们在 pgbackup 流程中的相同。
  • 使用 pg_dumpall

    pg_dump 一次只转储一个数据库,它不会转储有关角色或表空间的信息(因为它们是集群范围的而不是每个数据库的)。为了支持方便地转储数据库集群的全部内容,提供了 pg_dumpall 程序。pg_dumpall 备份给定集群中的每个数据库,还保留集群范围的数据,例如角色和表空间定义。该命令的基本用法是:

    pg_dumpall > 输出文件

    可以使用 psql 恢复生成的转储: psql -f infile Postgres。

    (实际上,您可以指定任何现有的数据库名称作为开始,但是如果您要重新加载到一个空集群中,那么通常应该使用 Postgres。)在恢复 pg_dumpall 转储时始终需要具有数据库超级用户访问权限,因为那是需要恢复角色和表空间信息。如果您使用表空间,请注意转储中的表空间路径是否适合新安装。

    pg_dumpall 通过发出命令来重新创建角色、表空间和空数据库,然后为每个数据库调用 pg_dump。这意味着虽然每个数据库将在内部保持一致,但不同数据库的快照可能不会完全同步。

    通过在自动化脚本中实现微小的更改,您可以将其更改为 pg_dumpall。


    SQL

    0 人点赞