時間:2024-02-07 12:09作者:下載吧人氣:19
PostgreSQL的Vacuum由于以下原因需要定期執行。
釋放,再利用因更新或者刪除更新而占用的磁盤空間。
更新PostgreSQL 查詢計劃用的統計數據。
避免事務ID的重置而引起非常老的數據丟失。
VACUUM 的標準SQL文的執行和其他的對數據庫的實際操作可以并行處理。
SELECT 、INSERT 、UPDATE 、DELETE 等命令和同通常一樣繼續能夠執行。
但是,VACUUM處理中的時候, ALTER TABLE ADD COLUMN等等的命令不能夠對表進行重新定義。
還有,由于執行VACUUM 的時候,有大量的I/O操作,其他的操作可能性能比較低,比如查詢的反應非常慢。為了較少對性能的影響,可以通過參數來調整。
數據庫服務器是否設置為自動vacuum。默認為 自動vacuum。 但是如果要讓vacuum能夠正常運轉,必須使 track_counts 有效。 track_counts這個參數在 postgresql.conf配置文件內,或者通過命令來設置。
即使設置不是自動vacuum。系統發現有防止事務ID的重置的必要的時候也會自動啟動
設置執行時間超過多長 的vacuum才輸出log。時間單位毫秒。
如果這個參數設置為0的話,所有vacuum相關 的log都輸出。
如果這個參數設置為-1的話,這個也是默認設置。log的輸出無效,也就是所有vacuum相關 的log都不輸出。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。
設置能夠同時執行的vacuum最大進程數。 默認是3個。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。
設置數據庫執行vacuum的最小延遲。時間單位是分。默認是1分鐘。這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。
設置任何一張表內觸發VACUUM 的 更新,刪除tuple的最小數。默認為50。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
設置任何一張表內觸發ANALYZE 的更新,刪除tuple的最小數。默認為50。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
是否觸發VACUUM的判斷的時候 、設置 autovacuum_vacuum_threshold 追加的表容量斷片。默認是0.2(即20%)。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
是否觸發 ANALYZE 的判斷的時候 、設置 autovacuum_vacuum_threshold 追加的表容量斷片。默認是0.1(即10%)。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
為了防止事務ID的重置,VACUUM強制操作前,設置表的 pg_class .relfrozenxid字段的最大值。默認是2億。
這個參數只能夠在啟動的時候設置。
設置自動vacuum操作中cost延遲。默認是20毫秒。設置的為-1的話,使用vacuum_cost_delay的值。
這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
設置自動vacuum操作中cost的最大界限值。默認是-1,這時候用vacuum_cost_limit的值。 這個參數的設置可以修改postgresql.conf配置文件,也可以通過命令來設置。這個設定通過 pg_autovacuum的項目可以覆蓋每張表。
補充:PostgreSQL數據庫管理:定期vacuum
為什么PostgreSQL數據庫管理工作中,定期vacuum是一個重要的工作.
釋放,再利用 更新/刪除的行所占據的磁盤空間.
更新PostgreSQL查詢計劃中使用的統計數據.
防止因事務ID的重置而使非常老的數據丟失.
第一點的原因是
PostgreSQL數據的插入,更新,刪除操作并不是真正放到數據庫空間.如果不定期釋放空間的話,由于數據太多,查詢速度會巨降.
第二點的原因是
PostgreSQL在做查詢處理的時候,為了是查詢速度提高,會根據統計數據來確定執行計劃.如果不及時更新的話,查詢的效果可能不如預期.
第三點的原因是
PostgreSQL中每一個事務都會產生一個事務ID,但這個數字是有上限的. 當事務ID達到最大值后,會重新從最小值開始循環.這樣如果不及時把以前的數據釋放掉的話,原來的老數據會因為事務ID的丟失而丟失掉.
話說回來vacuum操作可以手動和自動.如果有專門的數據庫維護人員的話,可以適時進行.但很多系統為了節省維護成本,這樣就需要依賴自動vacuum了.
雖說定期vacuum是PostgreSQL的一個弱點,不過在8.3版本以后,把這個任務交給自動vacuum就可以了.
要使自動vacuum有效,必須設置track_counts參數為true.具體的設置可以參照官方的文檔.
定期vacuum還是自己寫一個shell來自動執行比較好.
在shell中執行vacuumdb命令. 例: ./vacuumdb -d databaseName –analyze
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持。如有錯誤或未考慮完全的地方,望不吝賜教。
網友評論