博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Oracle vs PostgreSQL,研发注意事项(3)- 事务回滚之UPDATE操作解析
阅读量:2499 次
发布时间:2019-05-11

本文共 1988 字,大约阅读时间需要 6 分钟。

Oracle事务的回滚,通过回滚段保存原有数据实现,但,PG没有回滚段!以下以Update操作为例,说明PG实现机制上存在的空间暴涨问题。

在执行Update时,Oracle就地更新,如出现原block空间不足的情况,通过link的方式链接至新block上(不精确,大体表述);PG的Update,不是原地更新,而是保留原有数据,通过新增新的tuple(数据行)保存新增数据,原有数据通过Vacuum机制清理。Vacuum机制需要满足MVCC(多版本并发控制)的要求,在某些情况下,不会清理“垃圾”数据,在事务繁忙的时候导致会导致数据表空间不断增长。

--------------------------- Session A

-- 开启事务

begin;

-- 查询当前事务

select txid_current();

txid_current

--------------

      1500987

(1 row)

-- 什么都不做,会导致Vacuum不能清理“垃圾”数据

--------------------------- Session B

-- 开启事务

begin;

select txid_current();

txid_current

--------------

      1500988

(1 row)

-- 创建表&插入100数据

drop table if exists t1;

create table t1(id int,c1 varchar(50));

insert into t1 select generate_series(1,100),'#TESTDATA#';

------------------- 以上操作省略输出

select txid_current();

txid_current

--------------

      1500988

(1 row)

-- 提交事务

end;

-- 查看数据表

select ctid, xmin, xmax, cmin, cmax,id from t1;

testdb=# select ctid, xmin, xmax, cmin, cmax,id from t1;

  ctid  |  xmin  | xmax | cmin | cmax | id 

---------+---------+------+------+------+-----

(0,1)  | 1500988 |    0 |    4 |    4 |  1

(0,2)  | 1500988 |    0 |    4 |    4 |  2

(0,3)  | 1500988 |    0 |    4 |    4 |  3

(0,4)  | 1500988 |    0 |    4 |    4 |  4

......

-- 查看数据占用空间

\set v_tablename t1

SELECT pg_size_pretty( pg_total_relation_size(:'v_tablename') );

testdb=# SELECT pg_size_pretty( pg_total_relation_size(:'v_tablename') );

pg_size_pretty

----------------

8192 bytes

(1 row)

-- 使用pgbench进行压力测试,不断更新数据

cat update.sql

\set rowid random(1,100)

begin;

update t1 set c1=c1||:rowid where id= :rowid;

end;

pgbench -c 2 -C -f ./update.sql -j 1 -n -T 600 -U xdb testdb

-- 一段时间后查看数据占用空间

SELECT pg_size_pretty( pg_total_relation_size(:'v_tablename') );

testdb=# SELECT pg_size_pretty( pg_total_relation_size(:'v_tablename') );

pg_size_pretty

----------------

  1344 kB

(1 row)

从原来的8192 Bytes变成了1344 KB,空间“暴涨”。

究其原因,是因为PG的MVCC实现机制导致的:如果存在某个事务,在更新数据前开启,那么更新数据时前后的数据都要存储,无论更新多少次都要存储!

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/6906/viewspace-2158216/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/6906/viewspace-2158216/

你可能感兴趣的文章
RecyclerView 源码深入解析——绘制流程、缓存机制、动画等
查看>>
Android 面试题整理总结(一)Java 基础
查看>>
Android 面试题整理总结(二)Java 集合
查看>>
学习笔记_vnpy实战培训day02
查看>>
学习笔记_vnpy实战培训day03
查看>>
VNPY- VnTrader基本使用
查看>>
VNPY - CTA策略模块策略开发
查看>>
VNPY - 事件引擎
查看>>
MongoDB基本语法和操作入门
查看>>
学习笔记_vnpy实战培训day04_作业
查看>>
OCO订单(委托)
查看>>
学习笔记_vnpy实战培训day06
查看>>
回测引擎代码分析流程图
查看>>
Excel 如何制作时间轴
查看>>
股票网格交易策略
查看>>
matplotlib绘图跳过时间段的处理方案
查看>>
vnpy学习_04回测评价指标的缺陷
查看>>
ubuntu终端一次多条命令方法和区别
查看>>
python之偏函数
查看>>
vnpy学习_06回测结果可视化改进
查看>>