博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
GreenPlum数据的装载与卸载之copy命令的使用
阅读量:7177 次
发布时间:2019-06-29

本文共 555 字,大约阅读时间需要 1 分钟。

Copy是PostgreSql数据库自带的数据工具,它不仅支持表于表之间的数据加载,也支持文件于表之间的数据加载和表对文件的数据卸载。对于Greenplum数据库,使用copy命令进行数据加载,数据需要经过Master节点分发到Segment节点;同样使用copy命令进行数据卸载,数据也需要由Segment发送到Master节点,由Master节点汇总后再写入外部文件,这样就限制了数据加载与卸载的效率,数据量较小的情况下,使用copy命令就非常方便。

1、创建测试表

GreenPlum数据的装载与卸载之copy命令的使用

由于在建表语句中,没有指定具体使用哪个字段进行数据分发(分布键),默认使用随机分布。这里系统使用package_id作为分布键进行数据分发。

2、数据的卸载

这里的数据将使用copy命令从PostgreSQL数据库中导出,如下:

GreenPlum数据的装载与卸载之copy命令的使用
如果字段中含有空值,在TEXT模式中默认的字符串是\N(反斜线加上N),在CSV模式中是一个没有引用的空值。如下:
GreenPlum数据的装载与卸载之copy命令的使用
同样,此方法在greenplum上有效。

3、数据的加载

使用copy命令加载数据,必须使用超级用户操作。

GreenPlum数据的装载与卸载之copy命令的使用
如上图所示,加载完成后,通过查询可见数据分布比较均匀,基本平均分布在3个Segment节点上。

转载于:https://blog.51cto.com/candon123/2410841

你可能感兴趣的文章
苹果推送服务器端证书配置.pem生成
查看>>
《将博客搬至CSDN》
查看>>
[转载]步进电机原理介绍与基于STM32的SPWM驱动步进电机,使用软件实现电机细分...
查看>>
Windows下安装Redis服务
查看>>
序列化和反序列化的几种方式(DataContractSerializer)(二)
查看>>
比赛注意事项
查看>>
uva-10905-贪心
查看>>
(转)Google Code SVN密码的解决之道(2010-11-14 20:36:51)转载▼
查看>>
tmux使用笔记
查看>>
Ubuntu12.04.1 LTS Installion
查看>>
Jetty 的工作原理以及与 Tomcat 的比较
查看>>
20170913-构建之法:现代软件工程-阅读笔记
查看>>
实验一 Linux开发环境的配置 20145213祁玮 20145222黄亚奇
查看>>
站立会议4
查看>>
大数据概述
查看>>
微软职位内部推荐-Software Engineer II-Search
查看>>
Java程序的安装、配置、创建项目
查看>>
欧拉函数
查看>>
20155229 2016-2017-2 《Java程序设计》第十周学习总结
查看>>
Linux驱动知识
查看>>