時間:2024-02-03 17:42作者:下載吧人氣:19
作者:張連壯 PostgreSQL 研發負責人
從事多年 PostgreSQL 數據庫內核開發,對 Citus 有非常深入的研究。
PostgreSQL 本身不具備數據閃回和數據誤刪除保護功能,但在不同場景下也有對應的解決方案。本文由作者在 2021 PCC 大會的演講主題《PostgreSQL 數據找回》整理而來,介紹了常見 數據恢復和 預防數據丟失的相關工具實現原理及使用示例。
在盤點數據恢復方案之前,先簡單了解一下數據丟失的原因。
數據丟失通常是由 DDL 與 DML 兩種操作引起。
在 PostgreSQL 數據庫中,表以文件的形式,采用 OID 命名規則存儲于 PGDATA/base/DatabaseId/relfilenode
目錄中。當進行 DROP TABLE 操作時,會將文件整體刪除。
由于在操作系統中表文件已經不存在,所以只能采用恢復磁盤的方法進行數據恢復。但這種方式找回數據的概率非常小,尤其是云數據庫,恢復磁盤數據幾乎不可能。
DML 包含 UPDATE、DELETE 操作。根據 MVCC 的實現,DML 操作并不是在操作系統磁盤中將數據刪除,因此數據可以通過參數vacuum_defer_cleanup_age
來調整 Dead 元組在數據庫中的數量,以便恢復誤操作的數據。
pg_resetwal[1] 是 PostgreSQL 自帶的工具(9.6 及以前版本叫 pg_resetxlog)。可清除預寫式日志(WAL)并且可以重置 pg_control 文件中的一些信息。也可以修改當前事務 ID,從而使數據庫可以訪問到未被 Vacuum 掉的 Dead 元組。
pg_resetwal 通過設置事務號的方式來恢復數據,因此必須提前獲取待恢復數據的事務號。
1. 查看當前 lsn 位置
— 在線查詢— 離線查詢
./pg_controldata -D dj | grep ‘checkpoint location’
網友評論