七叶笔记 » 数据库 » Postgresql去重函数distinct的用法说明

Postgresql去重函数distinct的用法说明

分类: 数据库 | 浏览: 362

查询结果：

2、根据 name 查询去重后的数据：

3、根据name 和 age 查询去重后的数据：

4、根据name,age查询重复数据数：

二、查出重复数据后，我们需要删除重复数据

删除重复数据一般几种方式，一般采用临时表或者根据某个字段，例如id等，通过max或者min函数去重。

补充：基于postgresql ctid实现数据的差异同步

项目背景：

最近在做异构数据同步方面（非实时）的工作，从oracle,gbase,postgresql向mysql数据库中同步，对于没有自增字段（自增ID或时间字段）的业务表，做差异同步是一件非常麻烦的事情，主要体现在记录的新增、更新与删除上

备注：源库只提供一个只读权限的用户

ctid在pg中的作用

ctid是用来指向自身或新元组的元组标识符，怎么理解呢？下面能过几个实验来测试一下

查看记录的ctid值

对id为2的记录进行更新

这里可以看到id=2的记录指向了新的元组标识符 (0,5)

删除 id=3的记录后，对应的ctid(0,4)不存在了

再插入一条记录时，看看会不会使用(0,4)这个标识符

这里新插入的记录不会使用(0,4)，而是直接分配新的标识符(0,6)

总结：

1、ctid的作用与oracle rowid类似，可以唯一标识一条记录

2、记录的更新后，后生产新的ctid

3、记录删除后，新插入的记录不会使用已经删除记录的ctid

4、基于ctid可以实现记录的去重操作

5、基于ctid可以实现差异增量同步(新增、删除、更新)

以上为个人经验，希望能给大家一个参考，也希望大家多多支持七叶笔记。如有错误或未考虑完全的地方，望不吝赐教。

Postgresql distinct 用法说明

七叶笔记