PostgreSQL
 sql >> डेटाबेस >  >> RDS >> PostgreSQL

बर्मन क्लाउड - भाग 1:वाल आर्काइव

प्रस्तावना

कितने वर्तमान बर्मन उपयोगकर्ताओं ने क्लाउड में दूरस्थ गंतव्य में बैकअप सहेजने के बारे में सोचा है? कितने लोगों ने उस बैकअप को सीधे PostgreSQL सर्वर से लेने के बारे में सोचा है?

खैर, चूंकि बर्मन 2.10 यह अब संभव है!
कैसे?
आइए इसे निम्नलिखित लेखों में एक साथ देखें।

आवश्यकताएं

निम्नलिखित दो लेख नए barman-cloud-wal-archive के व्यावहारिक परिचय के लिए हैं और barman-cloud-backup barman-cli . में जोड़े गए टूल पैकेज.
पहले भाग में barman-cloud-wal-archive शामिल होगा कमांड जबकि दूसरा barman-cloud-backup को कवर करेगा कमांड।
पाठकों को PostgreSQL WAL संग्रह और बैकअप विधियों, और बर्मन के बुनियादी ज्ञान की आवश्यकता है। यह भी अनुशंसा की जाती है कि आप Amazon S3 जैसे संग्रहण समाधानों के लिए क्लाउड तकनीकों से अवगत हों।

वाल संग्रह

बर्मन ने कई वर्षों तक रिमोट वाल संग्रह के रूप में काम किया है, और बर्मन सीएलआई पैकेज को पोस्टग्रेएसक्यूएल पक्ष पर संग्रह विश्वसनीयता और मजबूती का विस्तार करने के लिए डिज़ाइन किया गया है। वास्तव में barman-cli barman-wal-restore . जैसी स्क्रिप्ट प्रदान करता है एक स्टैंडबाय नोड को restore_command के माध्यम से बर्मन संग्रह से WAL फ़ाइलों को स्मार्ट तरीके से और सुरक्षा को पुनर्स्थापित करने की अनुमति देना postgresql.auto.conf में पैरामीटर फ़ाइल (या recovery.conf PostgreSQL 12 तक फ़ाइल), और barman-wal-archive मास्टर नोड से WAL फ़ाइलों को archive_command . के माध्यम से बर्मन में संग्रहीत करने के लिए पैरामीटर postgresql.conf . में कॉन्फ़िगर किया गया है फ़ाइल।

क्लाउड वाल संग्रह

उपयोगकर्ताओं की प्रतिक्रिया के लिए धन्यवाद, बर्मन डेवलपर्स ने संस्करण में दो नए टूल पेश किए हैं 2.10 :

  • barman-cloud-wal-archive
  • barman-cloud-backup

संस्करण 2.11 में पुनर्प्राप्ति के लिए दो अतिरिक्त उपकरण शामिल होंगे, जिन्हें barman-cloud-wal-restore कहा जाता है। और barman-cloud-restore .
यह पोस्ट पूरी तरह से barman-cloud-wal-archive को समर्पित है , जो WAL फ़ाइलों को क्लाउड में संग्रहीत कर सकता है, बर्मन के साथ बहु-स्तरीय संग्रह को सक्षम कर सकता है, और बैकअप प्रतिधारण नीति का विस्तार कर सकता है।
वास्तव में, barman-cloud-wal-archive pre_archive_retry_script को कॉन्फ़िगर करने वाली एक हुक-स्क्रिप्ट के रूप में इस्तेमाल किया जा सकता है बर्मन में पैरामीटर, कॉन्फ़िगर किए गए क्लाउड स्टोरेज में WAL फ़ाइलों की प्रतिलिपि बनाने के लिए, संग्रह की अतिरेक को बढ़ाने के लिए, और बर्मन की तुलना में लंबी अवधारण नीति चुनना संभव बनाता है।

बस इतना ही नहीं!

barman-cloud-wal-archive barman-wal-archive को प्रतिस्थापित कर सकता है archive_command . में कमांड पैरामीटर, WAL फ़ाइलों को सीधे बर्मन सर्वर में कॉपी करने के बजाय, क्लाउड में संग्रहीत करने के लिए। इस तरह, यहां तक ​​कि एक PostgreSQL क्लस्टर जिसमें एक अलग समर्पित बैकअप सर्वर नहीं है, WAL फ़ाइलों को संग्रहीत करने के लिए दूरस्थ संग्रहण सेवा पर भरोसा कर सकता है।

यह कैसे काम करता है?

निम्नलिखित निर्देश केवल barman-cloud-wal-archive को स्थापित और कॉन्फ़िगर करने के लिए हैं archive_command . के रूप में PostgreSQL में।
सबसे पहले, तय करें कि WAL फ़ाइलों को कहाँ संग्रहित किया जाए। इस लेख में हम Amazon S3 का उपयोग करेंगे, जो इस समय एकमात्र समर्थित तकनीक है। हालांकि अन्य प्रौद्योगिकियां जो S3 जैसी API (Google क्लाउड, DigitalOcean, Microsoft Azure, आदि) का समर्थन करती हैं, boto3 लाइब्रेरी के साथ काम कर सकती हैं, उनका अभी तक परीक्षण नहीं किया गया है।

आवश्यकताएं

  1. बर्मन-क्ली 2.10 (या उच्चतर)
  2. अमेज़न एडब्ल्यूएस खाता
  3. awscli
  4. S3 बकेट
  5. एक PostgreSQL उदाहरण

इस लेख में हम बर्मन सीएलआई का परीक्षण करेंगे वर्चुअल मशीन में डेबियन बस्टर . के साथ और पोस्टग्रेएसक्यूएल 12 जो पहले से ही चल रहा है।

इंस्टॉलेशन

    1. दूसरा चतुर्थांश सार्वजनिक भंडार स्थापित करें
    2. बर्मन-क्ली पैकेज स्थापित करें
      [email protected]:~# apt update
      [email protected]:~# apt install barman-cli
    3. awscli इंस्टॉल करें
      [email protected]:~# apt install awscli

    कॉन्फ़िगरेशन और सेटअप

    आइए मैनुअल पढ़ें:

    [email protected]:~$ man barman-cloud-wal-archive
    [...]
    SYNOPSIS
        barman-cloud-wal-archive [OPTIONS] DESTINATION_URL SERVER_NAME WAL_PATH
    [...]
    POSITIONAL ARGUMENTS
    
        DESTINATION_URL
        URL  of the cloud destination, such as a bucket in AWS S3.
        For example: s3://BUCKET_NAME/path/to/folder (where BUCKET_NAME is the bucket you have created in AWS).
    
        SERVER_NAME
        the name of the server as configured in Barman.
    
        WAL_PATH
        the value of the `%p' keyword (according to `archive_command').
    [...]
    

    इसलिए, इसका ठीक से उपयोग करने के लिए हमें बस AWS क्रेडेंशियल्स को awscli . के साथ कॉन्फ़िगर करने की आवश्यकता है postgres . के रूप में टूल उपयोगकर्ता, AWS कंसोल में IAM अनुभाग में पहले बनाई गई एक्सेस कुंजी और गुप्त कुंजी की प्रतिलिपि बनाना:

    [email protected]:~$ aws configure --profile barman-cloud
    AWS Access Key ID [None]: AKI*****************
    AWS Secret Access Key [None]: ****************************************
    Default region name [None]: eu-west-1
    Default output format [None]: json
    

    सुनिश्चित करें कि AWS पर S3 बकेट उपलब्ध है। मैंने इसे barman-s3-test call कहना चुना इसे स्पष्ट करने के लिए।
    हमें अब barman-cloud-wal-archive का परीक्षण करने में सक्षम होना चाहिए आदेश:

    [email protected]:~$ barman-cloud-wal-archive -t -P barman-cloud s3://barman-s3-test/ pg12 /var/lib/postgresql/12/main/pg_wal/000000010000000000000001
    [email protected]:~$ echo $?
    0
    

    बाहर निकलने की स्थिति पुष्टि करती है कि आदेश सफल हुआ। अब हम PostgreSQL कॉन्फ़िगरेशन फ़ाइल के निचले भाग में निम्न पंक्ति जोड़ सकते हैं और इंस्टेंस को पुनरारंभ कर सकते हैं:
    archive_mode = on

    [email protected]:~# systemctl restart [email protected]
    

    चूंकि हमारे डेटा को रिमोट स्टोरेज में कॉपी किया जाएगा, हमारे नियंत्रण से बाहर, यह महत्वपूर्ण है कि हम उन्हें संपीड़ित स्टोर करें और एन्क्रिप्टेड . barman-cloud-wal-archive कमांड संपीड़न के लिए दो अलग-अलग तरीकों का समर्थन करता है:

    [email protected]:~$ barman-cloud-wal-archive --help
    [...]
        -z, --gzip            gzip-compress the WAL while uploading to the cloud
        -j, --bzip2           bzip2-compress the WAL while uploading to the cloud
        -e ENCRYPTION, --encryption ENCRYPTION
                              Enable server-side encryption for the transfer.
                              Allowed values: 'AES256', 'aws:kms'
    [...]
    

    एन्क्रिप्शन विकल्प केवल S3 बकेट को सूचित करेगा कि एन्क्रिप्टेड डेटा को स्टोर करने के लिए किस विधि का उपयोग करना है। एन्क्रिप्टेड डेटा किसी अन्य AWS उपयोगकर्ता द्वारा नहीं बल्कि बाल्टी के स्वामी द्वारा पढ़ा जा सकता है। S3 को भेजने से पहले बर्मन क्लाउड किसी ऑब्जेक्ट को एन्क्रिप्ट नहीं करता है, यह बस बाल्टी को उन्हें एन्क्रिप्टेड स्टोर करने के लिए कहता है यदि S3 को ठीक से कॉन्फ़िगर किया गया है। हालांकि, S3 से कोई भी कनेक्शन https . के माध्यम से सुरक्षित रूप से स्थापित हैं ।

    आइए postgresql.conf के नीचे निम्न पंक्ति जोड़ें फ़ाइल:

    archive_command = 'barman-cloud-wal-archive -P barman-cloud -e AES256 -j s3://barman-s3-test/ pg12 %p'

    इस बार, नए परिवर्तनों को लागू करने के लिए केवल कॉन्फ़िगरेशन का पुनः लोड करना पर्याप्त है:

    [email protected]:~$ psql -c “SELECT pg_reload_conf()”
    

    यह जांचने के लिए कि क्या नया आर्काइव_कमांड काम कर रहा है, पोस्टग्रेएसक्यूएल को आर्काइव करने के लिए WAL फाइल्स तैयार करनी चाहिए, इसलिए हमें pgbench की मदद से कुछ ट्रैफिक बनाना होगा। उपकरण:

    [email protected]:~$ createdb pg_bench_db
    [email protected]:~$ pgbench -i -s10 pg_bench_db
    
    [some irrelevant output here]
    
    [email protected]:~$ pgbench -c 10 -j 2 -T 30 pg_bench_db
    starting vacuum...end.
    transaction type: <builtin: TPC-B (sort of)>
    scaling factor: 10
    query mode: simple
    number of clients: 10
    number of threads: 2
    duration: 30 s
    number of transactions actually processed: 84501
    latency average = 3.552 ms
    tps = 2815.224687 (including connections establishing)
    tps = 2815.427535 (excluding connections establishing)
    

    इस बिंदु पर हमें S3 बकेट में संग्रहीत WAL फ़ाइलों को देखना चाहिए। आइए इसे जांचें, सर्वर नाम और वाल गंतव्य निर्देशिका के साथ लक्ष्य पथ का निर्माण:

    [email protected]:~$ aws s3 --profile barman-cloud ls s3://barman-s3-test/pg12/wals/
                            PRE 0000000100000000/
    

    आइए 0000000100000000 निर्देशिका के अंदर एक नज़र डालें:

    [email protected]:~$ aws s3 --profile barman-cloud ls s3://barman-s3-test/pg12/wals/0000000100000000/
    2020-01-08 08:20:54    1624168 000000010000000000000001.bz2
    2020-01-08 08:21:00     293422 000000010000000000000002.bz2
    2020-01-08 08:21:06     301934 000000010000000000000003.bz2
    2020-01-08 08:21:11     295648 000000010000000000000004.bz2
    2020-01-08 08:21:16     293675 000000010000000000000005.bz2
    2020-01-08 08:21:21     299348 000000010000000000000006.bz2
    2020-01-08 08:21:27     551249 000000010000000000000007.bz2
    2020-01-08 08:21:33     976523 000000010000000000000008.bz2
    2020-01-08 08:21:37    4542104 000000010000000000000009.bz2
    2020-01-08 08:21:46    5052693 00000001000000000000000A.bz2
    

    बढ़िया!

    S3 बकेट में अपलोड होने से पहले WAL फ़ाइलों को संपीड़ित किया जा रहा है और एन्क्रिप्टेड संग्रहीत किया जाता है, जिससे हमें स्थान (और धन) की बचत होती है और हमारे डेटा का सुरक्षा स्तर बढ़ जाता है।

    निष्कर्ष

    barman-cloud-wal-archive कमांड वह है जिसका उपयोगकर्ताओं ने लंबे समय से इंतजार किया है।

    अगर आप उन लोगों में से हैं जिन्होंने pre_archive_retry_script . का इस्तेमाल किया है WAL फ़ाइलों को S3 बकेट में अपलोड करने के लिए एक कस्टम स्क्रिप्ट को लागू करने के लिए, फिर इसे एक बेहतर प्रतिस्थापन के रूप में इस्तेमाल किया जा सकता है क्योंकि इसे बर्मन डेवलपर्स द्वारा विकसित और रखरखाव किया जाता है, और इसे 2ndQuadrant सतत वितरण प्रणाली द्वारा परीक्षण और वितरित किया जाता है।

    यदि आपने इसके बारे में अभी तक नहीं सोचा है, तो यह नई अवधारण नीतियों को खोलता है जो बर्मन स्थानीय लोगों की तुलना में क्लाउड स्टोरेज के लिए लंबी हो सकती हैं, क्लाउड में ऑब्जेक्ट्स की उम्र बढ़ सकती है, जबकि स्थानीय स्टोरेज पर जगह बचाते हुए, उचित सेटिंग करके S3 बकेट के कॉन्फ़िगरेशन में एक लंबी अवधारण नीति।

    अन्यथा, इसका उपयोग हम इस लेख में किया जा सकता है, सीधे PostgreSQL सर्वर से WAL फ़ाइलों को संग्रहीत करने के लिए। हालांकि यह एक मध्यवर्ती चरण को हटा देता है, RPO स्ट्रीमिंग विधि की तुलना में बढ़ जाती है, क्योंकि PostgreSQL WAL फ़ाइल को बंद करने के बाद ही संग्रहीत करेगा। इसलिए PostgreSQL नोड पर समस्याओं के मामले में, हम कुछ बदलाव खो सकते हैं। जब संभव हो, हम RPO=0 प्राप्त करने के लिए बर्मन सर्वर पर स्ट्रीमिंग के साथ इस पद्धति को लागू करने की अनुशंसा करते हैं (सिंक्रोनस स्ट्रीमिंग के साथ)।

    अब जबकि हमारे पास एक सतत संग्रह प्रणाली है, हम अपना पहला क्लाउड बैकअप . ले सकते हैं barman-cloud-backup का उपयोग करना उपकरण।

    मिलते हैं लेख के दूसरे भाग में।


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. कुप्पी-SQLAlchemy लोअर केस इंडेक्स - कार्यात्मक लंघन, SQLAlchemy प्रतिबिंब द्वारा समर्थित नहीं है

  2. मैं हेरोकू पर 5 एमबी पोस्टग्रेएसक्यूएल में कितने रिकॉर्ड स्टोर कर सकता हूं?

  3. psql में पेजर को अनुकूलित करें

  4. Postgresql में किसी क्वेरी को कैसे रोकें/मारें?

  5. मैं PostgreSQL तालिका में पंक्तियों की गिनती कैसे तेज करूं?