当前位置: gbaiyou->培训 > PostgreSQL技术大讲堂 - 第23讲:缓冲区管理器

PostgreSQL技术大讲堂 - 第23讲:缓冲区管理器

2023-07-21作者:gbaiyou来源:www.gbaiyou.com

PostgreSQL从小白到专家,是从入门逐渐能力提升的一个系列教程,内容包括对PG基础的认知、包括安装使用、包括角色权限、包括维护管理、、等内容,希望对热爱PG、学习PG的同学们有帮助,欢迎持续关注CUUG PG技术大讲堂。

第23讲:缓冲区管理器

内容1 : 缓冲区概述

内容2 : 缓冲区管理器结构

内容3 : 缓冲区管理器锁

内容4 : 缓冲区管理器如何工作

内容5 : 环形缓冲区

内容6 : 脏块写


缓冲区概述

· 缓冲区结构(存放各种类型的数据块)

    数据文件页—表和索引块

    可用空间地图块

    可见性地图块

    缓冲区数组索引--buffer_ids

· Buffer Tag结构

    RelFileNode (分别为表对象oid、数据库oid、表空间oid)

    页面的fork number (分别为0、1、2)

    页面number 示例:

    缓冲区标记{(16821、16384、37721)、0、7}

    1、标识第七个块中的页

    2、其关系的OID和fork号分别为37721和0(0即为存放表数据的文件)

    3、该块存放在OID为16384的数据库中,表空间的OID为16821

· Backend进程读数据块到缓冲区

· 写脏块

    下面进程工作时会导致脏块写:

    · Checkpointer

    · background writer


缓冲区管理器结构

· 管理器结构

· 第一层(Buffer Table)

    在这一层内置的hash函数将buffer_tags映射到插槽,插槽中记录了buffer_tags和描述层的buffer_id的映射关系。

· 第二层(Buffer Descriptor)

    描述层包含了很多重要的信息,包括buffer_tag与缓冲池插槽id的映射关系,访问次数统计,锁等信息。

    · Tag

     · buffer_id

     · refcount (被进程访问过一次加一,被时钟扫描过后减一,为零时可用)

     · usage_count

     · context_lock and io_in_progress_lock

     · Flags

     dirty bit

             valid bit

         io_in_progress bit

     · freeNext

· Buffer Descriptors Layer (Loading the first page)

    先请求一个缓冲区空间,buffer table层把描述层的buffer_id与buffer_tag进行映射;然后在描述层把buffer_tag与缓冲区id进行映射;最后把数据块读到相应的缓冲区槽中。

· 第三层(Buffer Pool)

    缓冲池是存储数据文件页(如表和索引)的简单数组。缓冲池数组的索引称为buffer_ids。

    缓冲池被分割成大小为8 KB的插槽,等于页面大小。因此,每个槽可以存储整个页面。缓冲区管理器锁

· Buffer Manager Locks

    缓冲区管理器为许多不同的目的使用许多锁

    锁是缓冲区管理器同步机制的一部分;它们与任何SQL语句和SQL选项都不相关

· Buffer Table 层的锁

    BufMappingLock保护整个缓冲表的数据完整性。它是一个轻量锁,可以在共享和独占模式下使用。在缓冲区表中搜索条目时,后端进程保存共享的BufMappingLock。当插入或删除条目时,后端进程持有独占锁。

· Buffer Descriptor 层锁

    每个缓冲区描述符使用两个轻量级锁

        · content_lock

        · io_in_progress_lock

· content_lock

content_lock是一种典型的强制访问限制的锁。它可以用于共享和独占模式。

当执行下列操作之一时,将获取独占内容锁:

· dml操作

· 物理删除元组或压缩存储页上的可用空间(vacuum和HOT处理)

· 冻结存储页中的元组

· io_in_progress_lock

    io_in_progress锁用于等待缓冲区上的I/O完成。当PostgreSQL进程从存储器加载/写入页面数据时,该进程在访问存储器时持有相应描述符的独占io_in_progress锁。

· spinlock

    下面显示如何固定缓冲区描述符:

    1、获取缓冲区描述符的自旋锁。

    2、将其refcount和usage_count的值增加1。

    3、松开旋转锁。

    下面显示如何将脏位设置为“1”:

    1、获取缓冲区描述符的自旋锁。

    2、使用按位操作将脏位设置为“1”。

    3、松开旋转锁。


缓冲区管理器如何工作

· 访问已存放在缓冲区中的数据块

· 加载数据块到空的缓冲池插槽

· 加载数据块到一个需要释放的缓冲池插槽

· 缓冲区块替换机制

    替换页面算法

        · 时钟扫描(8.1开始及以后的版本)

        · LRU算法(8.1以前的版本)

· 时钟扫描算法

    缓冲区描述符显示为蓝色或青色框,框中的数字显示每个描述符的使用计数,每扫描一次则减一,缓冲区每被访问过一次则加一。


Ring Buffer

· Ring Buffer

· Bulk-reading

    需要大块的缓冲池时,如果扫描缓冲池时其大小超过(共享缓冲区/4)四分之一的空间时,还没有找到足够的缓冲池,则分配256KB环形缓冲区。

· Bulk-writing

    执行下面列出的SQL命令时。在这种情况下,环缓冲区大小为16MB。

        COPY FROM command.

        CREATE TABLE AS command.

        CREATE MATERIALIZED VIEW or REFRESH MATERIALIZED VIEW command.

        ALTER TABLE command.

· Vacuum-processing

    当自动真空机进行真空处理时。在这种情况下,环缓冲区大小为256 KB。


脏块写

· Flushing Dirty Pages

    检查点进程和后台写入进程将脏页刷新到存储区,检查点与后台写进程分离。

    检查点进程将检查点记录写入WAL段文件,并在检查点启动时刷新脏页。

    后台写进程的作用是减少检查点密集写的影响。后台写进程持续一点一点地刷新脏页,对数据库活动的影响最小。

    默认情况下,后台写入程序每200毫秒唤醒一次(由bgwriter_delay定义),并最多刷新为100页(由bgwriter_lru_maxpages 定义)


共享池缓冲区参数设置

· 共享缓冲区相关参数

    shared_buffers参数设置 show shared_buffers;

    Alter system set shared_buffers=256M;

    wal_buffers参数设置 show wal_buffers;

    Alter system set wal_buffers =4M;

    effective_cache_size 参数设置 show effective_cache_size;

    提供可用于磁盘高速缓存的内存量的估计值。它只是一个建议值,而不是确切分配的内存或缓存大小。它不会实际分配内存,而是会告知优化器内核中可用的缓存量。在一个索引的代价估计中,更高的数值会使得索引扫描更可能被使用,更低的数值会使得顺序扫描更可能被使用。在设置这个参数时,还应该考虑PostgreSQL的共享缓冲区以及将被用于PostgreSQL数据文件的内核磁盘缓冲区。默认值是4GB。

以上就是【PostgreSQL从小白到专家】第23讲 - 缓冲区管理  的内容,欢迎一起探讨交流钉钉交流群:35,82,24,60,往期视频及文档内容联系CUUG

  • 去 IOE 环境下,Oracle OCM认证还值得考吗?
  • 腾讯云tdsql认证的优势和考试费用
  • 11月16日,工信部人才交流中心 & CUUG - PGCP+PGCM认证考试完成
  • 2024年11月14日,工信人才发布红头文件:PostgreSQL数据库管理人才研修与评测班
  • 如何建设国内postgresql数据库生态环境
  • PostgreSQL认证考试费用分析
  • 活动报名 《国产开源数据库PolarDB+PostgreSQL专家训练营》北京站
  • 金仓数据库认证值得考吗
  • 选择PGCA认证,还是选择PGCP认证
  • PostgreSQL技术大讲堂 - 第74讲:PostgreSQL SQL调优二
  • 恭喜CUUG 11月16日考试的同学获得PG中级、PG高级证书
  • 推动国内信创数据库发展,考取信创PostgreSQL认证
  • 为什么要发展信创数据库-信创PostgreSQL认证
  • 12月6日恭喜CUUG郑同学通过OCP考试获得OCP证书
  • PostgreSQL技术大讲堂 - 第76讲:调优(4)分区表索引调优
  • PostgreSQL与MySQL相似之处与不同之处
  • 免费学习PostgreSQL,来这里看看PG从小白到专家技术公开课
  • ocp认证烂大街了吗?并未烂大街
  • 在去Oracle环境下,市场还认可OCP认证吗?
  • PostgreSQL技术大讲堂 - 第77讲:DB4AI 搭建PG向量数据库AI机器人
  • PostgreSQL技术大讲堂 - 第78讲:分布式数据库-GreenPlum应用实践
  • PostgreSQL技术大讲堂 - 第79讲:PG流复制管理利器repmgr应用实践
  • PostgreSQL数据库管理员认证的含金量
  • PostgreSQL认证是什么,值得考吗
  • PostgreSQL证书什么样子的
  • RAG,搭建PG向量数据库AI机器人(文档下载+视频)
  • 从中美贸易战金融战科技战,看我国发展信创的必要性
  • 微软发布基于PostgreSQL的开源文档数据库平台DocumentDB
  • 信创领域的PostgreSQL管理员认证
  • 【会议回顾】11月29日,国产开源数据库PolarDB&PG专家训练营 - 北京站
  • 11月30日,工信部人才交流中心 & CUUG - PGCPPGCM认证考试完成!
  • 2024年12月PostgreSQL排名第四,已对SQL Server造成威胁
  • PostgreSQL技术大讲堂 - 第72讲:索引与SQL调优之禁忌之恋
  • PostgreSQL技术大讲堂 - 第73讲:AI4DB系列公开课--搭建私域大模型
  • 百期PostgreSQL技术公开课进行时,已讲到第73期了
  • 工业和信息化部人才交流中心关于培训考试评价证书更名的通告
  • 签约!北京某大型档案馆、成都市某科研所与CUUG签约工信人才PG认证学习
  • 1月15日证书来啦!工信部人才交流中心PostgreSQL中级高级认证
  • OCP英文全称是什么
  • PolarDB PostgreSQL版高可用原理分析
  • 工信部人才交流中心与教育部学生服务与素质发展中心战略合作
  • 为什么说开展信创数据库势在必行
  • PostgreSQL技术大讲堂 - 第75讲:SQL调优(3)索引调优升级版
  • OCP是什么意思 OCP有用吗
  • PolarDB for PostgreSQL:OSS 外表
  • 中科方德「方德高可信服务操作系统」通过PolarDB产品生态集成认证
  • 【重磅消息】Oracle OCP 认证考试,CUUG赠送一次免费补考机会!
  • OCM认证烂大街了吗?OCM战袍在此,永不过时!
  • 报名OCP认证考试,送一次免费补考机会,限时活动,名额有限!
  • 恭喜CUUG韩同学通过Oracle考试拿到OCP 19c证书