使用带有gpbackup和gprestore的S3存储插件
S3存储插件应用程序允许您在运行[gpbackup](../../utility_guide/admin_utilities/gpbackup.html)
和[gprestore](../../utility_guide/admin_utilities/gprestore.html)
时使用Amazon Simple Storage Service(Amazon S3)位置来存储和检索备份。
Amazon S3提供安全,持久,高度可扩展的对象存储。
S3存储插件还可以连接到Amazon S3兼容服务,例如Dell EMC Elastic Cloud Storage和Minio。
要使用S3存储插件应用程序,请在配置文件中指定插件的位置以及S3登录和备份位置。
运行gpbackup
或gprestore
时,使用选项--plugin-config
指定配置文件。
有关配置文件的信息,请参阅S3存储插件配置文件格式。
如果使用gpbackup
选项--plugin-config
执行备份操作,则还必须在使用gprestore
还原备份时指定--plugin-config
选项。
S3存储插件配置文件格式
配置文件指定Greenplum数据库S3存储插件可执行文件,连接凭据和S3位置的绝对路径。
S3存储插件配置文件使用YAML 1.1文档格式并实现自己的模式, 以指定Greenplum数据库S3存储插件的位置,连接凭据以及S3位置和登录信息。
配置文件必须是有效的YAML文档。
gpbackup
和gprestore
工具按顺序处理控制文件文档,并使用缩进(空格)来确定文档层次结构以及这些部分之间的关系。
使用空白区域非常重要。
不应仅将白色空间用于格式化目的,并且根本不应使用制表符。
这是S3存储插件配置文件的结构。
[executablepath](#topic_ur2_fsn_ndb__s3-exe-path): <absolute-path-to-gpbackup_s3_plugin>
[options](#topic_ur2_fsn_ndb__s3-options):
[region](#topic_ur2_fsn_ndb__s3-region): <aws-region>
[endpoint](#topic_ur2_fsn_ndb__s3-endpoint): <S3-endpoint>
[aws_access_key_id](#topic_ur2_fsn_ndb__s3-id): <aws-user-id>
[aws_secret_access_key](#topic_ur2_fsn_ndb__s3-key): <aws-user-id-key>
[bucket](#topic_ur2_fsn_ndb__s3-bucket): <s3-bucket>
[folder](#topic_ur2_fsn_ndb__s3-location): <s3-location>
[encryption](#topic_ur2_fsn_ndb__s3-encryption): [on|off]
executablepath
需要。 插件可执行文件的绝对路径。
例如,Pivotal Greenplum数据库安装位置是$GPHOME/bin/gpbackup_s3_plugin
。
该插件必须位于每个Greenplum数据库主机上的相同位置。
options 需要。开始S3存储插件选项部分。
region AWS S3必需。如果连接到S3兼容服务,则不需要此选项。
endpoint S3兼容服务所必需的。 指定此选项可连接到S3兼容服务,例如ECS。 该插件连接到指定的S3端点(主机名或IP地址)以访问S3兼容的数据存储。
如果指定了此选项,则插件将忽略region
选项,并且不使用AWS来解析端点。
如果未指定此选项,插件将使用region
来确定AWS S3端点。
aws_access_key_id 可选的。用于访问存储备份文件的S3存储桶位置的S3 ID。 如果未指定此参数,则使用来自会话环境的S3身份验证信息。见备注。
aws_secret_access_key
仅在指定aws_access_key_id
时才需要。S3 ID的S3密码,用于访问S3存储桶位置。
bucket 需要。AWS区域或S3兼容数据存储中的S3存储桶的名称。桶必须存在。
folder 需要。备份的S3位置。在备份操作期间,如果S3存储桶中不存在,则插件会创建S3位置。
encryption
可选的。连接到S3位置时启用或禁用安全套接字层(SSL)。
默认值为on
,使用通过SSL保护的连接。将此选项设置为off
以连接到未配置为使用SSL的S3兼容服务。
除off
之外的任何值都被视为on
。
示例
这是在下一个gpbackup
示例命令中使用的示例S3存储插件配置文件。
该文件的名称是s3-test-config.yaml
。
executablepath: $GPHOME/bin/gpbackup_s3_plugin
options:
region: us-west-2
aws_access_key_id: test-s3-user
aws_secret_access_key: asdf1234asdf
bucket: gpdb-backup
folder: test/backup3
这个gpbackup
示例使用S3存储插件备份数据库演示。
S3存储插件配置文件的绝对路径是/home/gpadmin/s3-test
。
gpbackup --dbname demo --plugin-config /home/gpadmin/s3-test-config.yaml
S3存储插件将备份文件写入AWS区域us-west-2中的此S3位置。
gpdb-backup/test/backup3/backups/YYYYMMDD/YYYYMMDDHHMMSS/
备注
S3存储插件应用程序必须位于每个Greenplum数据库主机上的相同位置。 仅在master主机上需要配置文件。
使用S3存储插件执行备份时,插件会将备份文件存储在S3存储桶中的此位置。
<folder>/backups/<datestamp>/<timestamp>
其中folder是您在S3配置文件中指定的位置,而datestamp和timestamp是备份日期和时间戳。
使用Amazon S3备份和还原数据需要Amazon AWS账户可以访问Amazon S3存储桶。 这些是备份和还原数据所需的Amazon S3存储桶权限。
上传/删除
上传文件的S3用户ID打开/下载
和查看
访问文件的S3用户ID
如果未在配置文件中指定aws_access_key_id
和aws_secret_access_key
,则S3插件将使用来自运行备份操作的会话的系统环境的S3身份验证信息。
S3插件使用第一个可用源搜索这些源中的信息。
- 环境变量
AWS_ACCESS_KEY_ID
和AWS_SECRET_ACCESS_KEY
。 - 使用AWS CLI命令设置的身份验证信息是
aws configure
。 - 如果从EC2实例运行备份,则为Amazon EC2 IAM角色的凭据。
有关Amazon S3的信息,参考Amazon S3。* 有关Amazon S3区域和端点的信息,参考http://docs.aws.amazon.com/general/latest/gr/rande.html#s3_region。
- 有关S3存储桶和文件夹的信息,请参阅Amazon S3文档https://aws.amazon.com/documentation/s3/。
Parent topic: 使用gpbackup存储插件