PostgreSQL
 sql >> डेटाबेस >  >> RDS >> PostgreSQL

बेंचमार्किंग प्रबंधित PostgreSQL क्लाउड समाधान - भाग चार:Microsoft Azure

यह श्रृंखला का चौथा और अंतिम भाग है बेंचमार्किंग प्रबंधित PostgreSQLCloud समाधान . इस लेखन के समय, Microsoft Azure PostgreSQL संस्करण 10.7 पर था, जो दो दावेदारों से नया था:संस्करण 10.6 पर Amazon Aurora PostgreSQL और संस्करण 9.6 पर PostgreSQL के लिए Google Cloud SQL।

Microsoft ने Azure PostgreSQLon Windows चलाने का निर्णय लिया:

postgres=> select version();
                        version
------------------------------------------------------------
PostgreSQL 10.7, compiled by Visual C++ build 1800, 64-bit
(1 row)

इस विशेष परीक्षण के लिए जो बहुत अच्छी तरह से काम नहीं करता था, और मुझे यह अनुमान लगाने में खतरा होगा कि Microsoft सीमाओं से अच्छी तरह वाकिफ है, यही कारण है कि PostgreSQL छतरी के तहत वे PostgreSQL के साइटस डेटा संस्करण का पूर्वावलोकन संस्करण भी पेश करते हैं। दृष्टिकोण AWS PostgreSQL फ्लेवर, RDS और क्रमशः Aurora के समान दिखता है।

एक साइड नोट के रूप में, अपना Azure खाता सेट करते समय, मैं 2FA/MFA (टू-फ़ैक्टर/मल्टी-फ़ैक्टर) प्रमाणीकरण की कमी से अचंभित था, जिसे मैंने Amazon के AWS वर्चुअल MFA और Google के 2-चरणीय सत्यापन के साथ प्रदान किया था। Microsoft केवल सक्रिय निर्देशिका या Office 365 की सदस्यता लेने वाले एंटरप्राइज़ ग्राहकों को MFA प्रदान करता है। चूंकि साइटस क्लाउड उत्पादन डेटाबेस के लिए 2FA को लागू करता है, शायद Microsoft इसे Azure में लागू करने से बहुत दूर नहीं है।

TL;DR

Azure के लिए कोई परिणाम नहीं है। 8-कोर डेटाबेस इंस्टेंस पर, एडब्ल्यूएस और जी क्लाउड पर उपयोग किए जाने वाले कोर की संख्या के समान, डेटाबेस त्रुटियों के कारण परीक्षण पूरा करने में विफल रहे। 16-कोर उदाहरण पर, pgbench ने पूरा किया, और sysbench को पहले 3 टेबल बनाने के लिए मिला, जिस बिंदु पर मैंने प्रक्रिया को बाधित किया। जबकि मैं परीक्षण करने और त्रुटियों और उनके कारणों का दस्तावेजीकरण करने के लिए उचित मात्रा में प्रयास, समय और पैसा खर्च करने को तैयार था, इस अभ्यास का लक्ष्य बेंचमार्क चल रहा था, इसलिए मैंने कभी भी किसी भी उन्नत समस्या निवारण का पीछा करने या संपर्क करने पर विचार नहीं किया। Azure समर्थन, न ही मैंने 16-कोर डेटाबेस पर sysbench परीक्षण पूरा किया।

क्लाउड इंस्टेंस

ग्राहक

एज़्योर क्लाइंट इंस्टेंस इस ब्लॉग श्रृंखला की शुरुआत में चुने गए एडब्ल्यूएस इंस्टेंस के निकटतम, निम्नलिखित विनिर्देशों के साथ एक E32s v3 इंस्टेंस था:

  • vCPU:32 (16 करोड़ x 2 थ्रेड/कोर)
  • रैम:256 जीबी
  • संग्रहण:Azure प्रीमियम SSD
  • नेटवर्क:30Gbps तक की त्वरित नेटवर्किंग

उदाहरण विवरण के साथ यहां एक पोर्टल स्क्रीनशॉट है:

क्लाइंट इंस्टेंस विवरण

किसी भी समर्थित वर्चुअल मशीन को चुनते समय त्वरित नेटवर्किंग डिफ़ॉल्ट रूप से सक्षम होती है:

त्वरित नेटवर्किंग चालू

जैसा कि क्लाउड में नियम है, सर्वोत्तम नेटवर्क प्रदर्शन प्राप्त करने के लिए, क्लाइंट और सर्वर को उसी उपलब्धता क्षेत्र में स्थित होना चाहिए, जो मैंने ईस्ट यूएस AZ में वातावरण स्थापित करके किया था।

इसी तरह Google क्लाउड के लिए, 10 से अधिक कोर वाले उदाहरणों के लिए कोटा वृद्धि का अनुरोध किया जाना चाहिए। Microsoft ने इसे वास्तव में आसान बना दिया। एक बार भुगतान किए गए खाते में स्विच करने के बाद मुझे टिकट में अपना जवाब समाप्त करने से पहले स्वीकृति की पुष्टि प्राप्त हुई, जिसमें बताया गया था कि मैं वृद्धि का अनुरोध क्यों कर रहा हूं।

डेटाबेस

उदाहरण के आकार का चयन करने में मैंने AWS और Google क्लाउड पर उपयोग किए गए उदाहरणों के विनिर्देशों के मिलान की कोशिश की:

  • vCPU:8
  • RAM:80 GiB (अधिकतम)
  • भंडारण:6000 आईओपीएस (2 टीआईबी आकार 3 आईओपीएस/जीबी)
  • नेटवर्क:2,000 एमबी/एस

कम स्मृति आकार स्मृति आवंटित करने के लिए उपयोग किए जाने वाले प्रति vCore सूत्र स्मृति से उत्पन्न होता है:

डेटाबेस इंस्टेंस कॉन्फ़िगरेशन

Google क्लाउड के समान, और AWS के विपरीत, जितना बड़ा स्टोरेज, उतना ही अधिक IOPS, 3:1 के अनुपात में वृद्धि के साथ, हालांकि, एक बार जब आकार 2TiB तक पहुंच जाता है, तो IOPS को 6000 IOPS पर सीमित कर दिया जाता है।

बेंचमार्क चलाना

सेटअप

सेटअप ने ब्लॉग श्रृंखला के पिछले भागों में वर्णित प्रक्रिया का पालन किया, जिसमें एडब्ल्यूएस पीजीबेंच टाइमिंग पैच 11.1 के लिए एज़्योर पोस्टग्रेएसक्यूएल संस्करण 10.7 के लिए सफाई से लागू किया गया था। पोस्टग्रेएसक्यूएल जीथब रिपॉजिटरी में एडब्ल्यूएस लैब्स के योगदान से पैच भी प्राप्त किए जा सकते हैं।

बेंचमार्क चलाने के दौरान मैंने निम्नलिखित स्क्रिप्ट का उपयोग किया जो सिर्फ अमेज़ॅन गाइड का अनुसरण करता है और इस मामले में Azure (10.7) में PostgreSQL संस्करण के लिए तैयार किया गया है। क्लाइंट मशीन CentOS 7.5 चलाती है:

#!/bin/bash

set -eE
trap "exit 1" ERR

yum -y install \
   wget ant git php gnuplot gcc make readline-devel zlib-devel \
   postgresql-jdbc bzr automake libtool patch libevent-devel \
   openssl-devel ncurses-devel

wget https://ftp.postgresql.org/pub/source/v10.7/postgresql-10.7.tar.gz
rm -rf postgresql-10.7
tar -xzf postgresql-10.7.tar.gz
cd postgresql-10.7
wget https://s3.amazonaws.com/aurora-pgbench-patches/pgbench-init-timing.patch
patch --verbose -p1 -b  < pgbench-init-timing.patch
./configure
make -j 4 all
make install
cd ..

rm -rf sysbench
git clone -b 0.5 https://github.com/akopytov/sysbench.git
cd sysbench
./autogen.sh
CFLAGS="-L/usr/local/pgsql/lib/ -I /usr/local/pgsql/include/" \
   | ./configure \
      --with-pgsql \
      --without-mysql \
      --with-pgsql-includes=/usr/local/pgsql/include/ \
      --with-pgsql-libs=/usr/local/pgsql/lib/
make
make install
cd sysbench/tests
make install

sed -i \
   '/^export PGHOST=/,/^export LD_LIBRARY_PATH.*pgsql/d' \
   ~/.bashrc
cat << "__eot__" >> ~/.bashrc
export PGHOST=CHANGEME
export PGUSER=postgres
export PGPASSWORD=postgres
export PGDATABASE=postgres
export PGPORT=5432
export PATH=/usr/local/pgsql/bin:/usr/local/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/pgsql/lib
__eot__

echo "All done."

एक बार स्क्रिप्ट पूरी हो जाने के बाद, PostgreSQL पर्यावरण चर सेट करने के लिए .bashrc संपादित करें। Azure सर्वव्यापी {उपयोगकर्ता नाम} के बजाय {username}@{host} प्रारूप की अपेक्षा करके PostgreSQL उपयोगकर्ता नाम के प्रारूप के बारे में विशिष्ट है:

[[email protected] scripts]# psql
psql: FATAL:  Invalid Username specified. Please check the Username and retry connection. The Username should be in <[email protected]> format.

परीक्षण शुरू करने से पहले, सत्यापित करें कि हम क्लाइंट टूल के सही संस्करण का उपयोग कर रहे हैं:

[[email protected] scripts]# psql --version
psql (PostgreSQL) 10.7
[[email protected] scripts]# pgbench  --version
pgbench (PostgreSQL) 10.7
[[email protected] scripts]# sysbench --version
sysbench 0.5

pgench

pgbench डेटाबेस को इनिशियलाइज़ करें।

[[email protected] ~]# pgbench -i --fillfactor=90 --scale=10000

...और कई मिनट बाद:

[[email protected] scripts]# pgbench -i --fillfactor=90 --scale=10000
NOTICE:  table "pgbench_history" does not exist, skipping
NOTICE:  table "pgbench_tellers" does not exist, skipping
NOTICE:  table "pgbench_accounts" does not exist, skipping
NOTICE:  table "pgbench_branches" does not exist, skipping
creating tables...
100000 of 1000000000 tuples (0%) done (elapsed 0.04 s, remaining 426.44 s)
200000 of 1000000000 tuples (0%) done (elapsed 0.09 s, remaining 427.22 s)
300000 of 1000000000 tuples (0%) done (elapsed 0.18 s, remaining 600.63 s)
400000 of 1000000000 tuples (0%) done (elapsed 0.21 s, remaining 530.99 s)
500000 of 1000000000 tuples (0%) done (elapsed 0.30 s, remaining 595.12 s)

...

584300000 of 1000000000 tuples (58%) done (elapsed 2421.82 s, remaining 1723.01 s)
584400000 of 1000000000 tuples (58%) done (elapsed 2421.86 s, remaining 1722.32 s)
584500000 of 1000000000 tuples (58%) done (elapsed 2422.81 s, remaining 1722.29 s)
584600000 of 1000000000 tuples (58%) done (elapsed 2422.84 s, remaining 1721.60 s)
584700000 of 1000000000 tuples (58%) done (elapsed 2422.88 s, remaining 1720.92 s)
584800000 of 1000000000 tuples (58%) done (elapsed 2425.06 s, remaining 1721.76 s)
584900000 of 1000000000 tuples (58%) done (elapsed 2425.09 s, remaining 1721.07 s)
585000000 of 1000000000 tuples (58%) done (elapsed 2425.28 s, remaining 1720.50 s)
...

999700000 of 1000000000 tuples (99%) done (elapsed 4142.69 s, remaining 1.24 s)
999800000 of 1000000000 tuples (99%) done (elapsed 4142.95 s, remaining 0.83 s)
999900000 of 1000000000 tuples (99%) done (elapsed 4142.98 s, remaining 0.41 s)
1000000000 of 1000000000 tuples (100%) done (elapsed 4143.92 s, remaining 0.00 s)
vacuum...
set primary keys...
total time: 14805.73 s (insert 4146.94 s, commit 0.02 s, vacuum 6581.15 s, index 4077.61 s)
done.

अब तक, बहुत अच्छा।

यह पुष्टि करने के लिए डेटाबेस पर एक त्वरित नज़र डालें कि यह जाने के लिए तैयार है:

[email protected]:5432 postgres> \l+
                                                                                                List of databases
      Name        |      Owner      | Encoding |          Collate           |           Ctype            |          Access privileges          |   Size    | Table space |                Description
-------------------+-----------------+----------+----------------------------+----------------------------+-------------------------------------+-----------+------------+--------------------------------------------
azure_maintenance | azure_superuser | UTF8     | English_United States.1252 | English_United States.1252 | azure_superuser=CTc/azure_superuser | No Access | pg_default  |
azure_sys         | azure_superuser | UTF8     | English_United States.1252 | English_United States.1252 |                                     | 12 MB     | pg_default  |
postgres          | azure_superuser | UTF8     | English_United States.1252 | English_United States.1252 |                                     | 160 GB    | pg_default  | default administrative connection database
template0         | azure_superuser | UTF8     | English_United States.1252 | English_United States.1252 | =c/azure_superuser                 +| 7865 kB   | pg_default  | unmodifiable empty database
                  |                 |          |                            |                            | azure_superuser=CTc/azure_superuser |           |             |
template1         | azure_superuser | UTF8     | English_United States.1252 | English_United States.1252 | =c/azure_superuser                 +| 7865 kB   | pg_default  | default template for new databases
                  |                 |          |                            |                            | azure_superuser=CTc/azure_superuser |           |             |
(5 rows)

चूंकि Azure max_connections को बदलने की अनुमति नहीं देता है और यह देखते हुए कि चयनित उदाहरण के लिए सीमा 960 पर सीमित है, हमें तदनुसार pgbench क्लाइंट की संख्या को समायोजित करना होगा:

[[email protected] scripts]# pgbench --protocol=prepared -P 60 --time=600 --client=950 --jobs=2048
starting vacuum...end.
connection to database "postgres" failed:
could not translate host name "postgresql-10-7.postgres.database.azure.com" to address: Name or service not known
connection to database "postgres" failed:
could not translate host name "postgresql-10-7.postgres.database.azure.com" to address: Name or service not known

और वहीं है, पहली हिचकी।

होस्ट DNS रिज़ॉल्यूशन की एक त्वरित जांच कोई समस्या नहीं दिखाती है:

[[email protected] scripts]# dig +short $PGHOST
cr1.eastus1-a.control.database.windows.net.
191.238.6.43
[[email protected] scripts]# cat /etc/resolv.conf
; generated by /usr/sbin/dhclient-script
search 11jv1qvdjs5utlhtlyb5vdyeth.bx.internal.cloudapp.net
nameserver 168.63.129.16

मेरे स्क्रीनलॉग की समीक्षा से पता चलता है कि लगभग आधे कनेक्शन समाप्त कर दिए गए थे:

~$ cat screenlog.1 | nl | grep 'could not translate host name "postgresql-10-7.*Name or service not known' | wc -l
469

pg_stat_activity एक अधिक विस्तृत कहानी बताती है — हम 950 कनेक्शन बढ़ाते हैं:

[email protected]:5432 postgres> select now(), count(*) from pg_stat_activity where usename = 'postgres' and application_name = 'pgbench';                                now              | count
-------------------------------+-------
2019-05-03 23:39:18.200291+00 |   950
(1 row)

...हालांकि, उपरोक्त क्वेरी की निगरानी केवल 10 सेकंड में कनेक्शन की संख्या में 950 से 628 तक अचानक गिरावट दिखाती है:

[email protected]:5432 postgres> \watch 10
Fri 03 May 2019 11:41:05 PM UTC (every 10s)

            now              | count
-------------------------------+-------
2019-05-03 23:41:05.044025+00 |   950
(1 row)

...

Fri 03 May 2019 11:43:10 PM UTC (every 10s)

            now              | count
-------------------------------+-------
2019-05-03 23:43:10.512766+00 |   950
(1 row)

Fri 03 May 2019 11:43:20 PM UTC (every 10s)

            now              | count
-------------------------------+-------
2019-05-03 23:43:17.419011+00 |   628
(1 row)

Fri 03 May 2019 11:43:30 PM UTC (every 10s)

            now              | count
-------------------------------+-------
2019-05-03 23:43:31.434638+00 |   613
(1 row)

DNS समस्या को हल करने के लिए, मैंने PGHOST को होस्ट IP पता सौंपा:

[[email protected] scripts]# set | grep PG
PGDATABASE=postgres
PGHOST=191.238.6.43
[email protected]
PGPORT=5432
[email protected]

उस समाधान के साथ मैंने परीक्षण फिर से शुरू किया:

[[email protected] scripts]# pgbench --protocol=prepared -P 60 --time=600 --client=950 --jobs=2048
starting vacuum...end.
progress: 61.1 s, 457.7 tps, lat 559.138 ms stddev 1755.888
progress: 120.1 s, 78.8 tps, lat 3883.772 ms stddev 10551.545
progress: 180.1 s, 17.6 tps, lat 50831.708 ms stddev 31214.512
progress: 240.1 s, 15.2 tps, lat 42474.763 ms stddev 32702.050
progress: 300.1 s, 16.1 tps, lat 43584.559 ms stddev 29818.142
progress: 360.1 s, 26.5 tps, lat 36914.096 ms stddev 37152.588
progress: 420.0 s, 33.4 tps, lat 27542.926 ms stddev 37075.457
progress: 480.0 s, 20.2 tps, lat 47149.060 ms stddev 47087.474
progress: 540.0 s, 13.5 tps, lat 55609.260 ms stddev 60394.287
progress: 600.0 s, 36.5 tps, lat 49566.853 ms stddev 99155.598

transaction type: <builtin: TPC-B (sort of)>
scaling factor: 10000
query mode: prepared
number of clients: 950
number of threads: 950
duration: 600 s
number of transactions actually processed: 44293
latency average = 12493.888 ms
latency stddev = 40490.231 ms
tps = 60.907130 (including connections establishing)
tps = 64.213520 (excluding connections establishing)

पहली नज़र में, ऐसा लगता है कि चीजें ठीक काम कर रही हैं, हालांकि, अत्यधिक उच्च विलंबता मान, पूर्व DNS मुद्दों और "त्वरित नेटवर्किंग" सक्षम क्लाइंट के साथ मिलकर सुझाव देते हैं कि नेटवर्क स्तर पर कुछ गड़बड़ है, और यह संभावना है कम टीपीएस परिणाम के कारण लेकिन सबसे बुरा अभी आना बाकी है।

आज श्वेतपत्र डाउनलोड करें क्लस्टरकंट्रोल के साथ पोस्टग्रेएसक्यूएल प्रबंधन और स्वचालन इस बारे में जानें कि पोस्टग्रेएसक्यूएल को तैनात करने, मॉनिटर करने, प्रबंधित करने और स्केल करने के लिए आपको क्या जानना चाहिए। श्वेतपत्र डाउनलोड करें

सिसबेंच

सबसे पहले, टेबल बनाएं:

sysbench --test=/usr/local/share/sysbench/oltp.lua \
--pgsql-host=${PGHOST} \
--pgsql-db=${PGDATABASE} \
--pgsql-user=${PGUSER} \
--pgsql-password=${PGPASSWORD} \
--pgsql-port=${PGPORT} \
--oltp-tables-count=250\
--oltp-table-size=450000 \
prepare
After a little while:
sysbench 0.5:  multi-threaded system evaluation benchmark

Creating table 'sbtest1'...
FATAL: PQexec() failed: 7 server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.

FATAL: failed query: CREATE TABLE sbtest1 (
id SERIAL NOT NULL,
k INTEGER DEFAULT '0' NOT NULL,
c CHAR(120) DEFAULT '' NOT NULL,
pad CHAR(60) DEFAULT '' NOT NULL,
PRIMARY KEY (id)
)
FATAL: failed to execute function `prepare': 3

यह बिल्कुल अच्छा नहीं लग रहा था इसलिए मैंने PostgreSQL लॉग की जाँच की:

2019-05-03 23:51:12 UTC-5ccbbe4f.88-WARNING:  worker took too long to start; canceled
2019-05-03 23:51:14 UTC-5ccbbe4f.84-PANIC:  could not write to log file 000000010000001F000000CD at offset 13664256, length 8192: Invalid argument
+++ NT HARD ERROR (0xd0000144) +++
    Parameter 0: 0xffffffffc0000005
    Parameter 1: 0x1b80f0f73b
    Parameter 2: 0x1
    Parameter 3: 0x0

हालांकि सेवा अपने आप ठीक हो जानी चाहिए, मैंने प्रक्रिया को तेज करने के लिए इंस्टेंस को फिर से शुरू करने का फैसला किया।

2019-05-04 00:43:23 UTC-5ccce02a.2c-HINT:  Is another postmaster already running on port 20108? If not, wait a few seconds and retry.
2019-05-04 00:43:23 UTC-5ccce02a.2c-LOG:  could not bind IPv6 address "::": A socket operation was attempted to an unreachable host.
2019-05-04 00:43:23 UTC-5ccce02a.2c-LOG:  listening on IPv4 address "0.0.0.0", port 20108
2019-05-04 00:43:24 UTC-5ccce02a.2c-LOG:  database system is ready to accept connections
...
2019-05-05 00:03:35 UTC-5cce2856.2c-HINT:  Is another postmaster already running on port 20326? If not, wait a few seconds and retry.
2019-05-05 00:03:35 UTC-5cce2856.2c-LOG:  could not bind IPv6 address "::": A socket operation was attempted to an unreachable host.
2019-05-05 00:03:35 UTC-5cce2856.2c-LOG:  listening on IPv4 address "0.0.0.0", port 20326
2019-05-05 00:03:38 UTC-5cce285a.3c-FATAL:  the database system is starting up
2019-05-05 00:03:38 UTC-5cce285a.3c-LOG:  connection received: host=127.0.0.1 port=47247 pid=60
2019-05-05 00:03:49 UTC-5cce2865.40-FATAL:  the database system is starting up
2019-05-05 00:03:49 UTC-5cce2865.40-LOG:  connection received: host=127.0.0.1 port=47284 pid=64
2019-05-05 00:03:59 UTC-5cce286f.44-FATAL:  the database system is starting up
2019-05-05 00:03:59 UTC-5cce286f.44-LOG:  connection received: host=127.0.0.1 port=47312 pid=68
2019-05-05 00:04:00 UTC-5cce2856.2c-LOG:  database system is ready to accept connections
2019-05-05 00:04:00 UTC-5cce2870.38-LOG:  database system was shut down at 2019-05-05 00:03:34 UTC

इस बिंदु पर मैंने क्वेरी प्रदर्शन अंतर्दृष्टि भी सक्षम की:

2019-05-05 00:04:13 UTC-5cce2856.2c-LOG:  parameter "pgms_wait_sampling.query_capture_mode" changed to "ALL"
2019-05-05 00:04:13 UTC-5cce2856.2c-LOG:  parameter "pg_qs.query_capture_mode" changed to "TOP"
2019-05-05 00:04:13 UTC-5cce2856.2c-LOG:  received SIGHUP, reloading configuration files
2019-05-05 00:04:13 UTC-5cce2856.2c-LOG:  received SIGHUP, reloading configuration files
2019-05-05 00:04:13 UTC-5cce287a.6c-ERROR:  database "azure_sys" already exists
2019-05-05 00:04:13 UTC-5cce287a.6c-STATEMENT:  CREATE DATABASE azure_sys TEMPLATE template0

Sysbench कार्य को पुनरारंभ करने से पहले, मैं यह सुनिश्चित करना चाहता था कि डेटाबेस स्वस्थ है, और इसलिए मैंने दूसरा pgbench परीक्षण शुरू किया:

[[email protected] scripts]# pgbench --protocol=prepared -P 60 --time=600 --client=950 --jobs=2048
starting vacuum...end.
connection to database "postgres" failed:
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.
connection to database "postgres" failed:
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.
connection to database "postgres" failed:
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.
connection to database "postgres" failed:
server closed the connection unexpectedly
        This probably means the server terminated abnormally
        before or while processing the request.

pg_stat_activity क्वेरी मॉनिटर के अनुसार, कनेक्शन की संख्या 710 तक पहुंचने पर सर्वर मर गया:

[email protected]:5432 postgres> \watch 1
Sun 05 May 2019 12:44:11 AM UTC (every 1s)

            now              | count
-------------------------------+-------
2019-05-05 00:44:11.010413+00 |   220
(1 row)

Sun 05 May 2019 12:44:12 AM UTC (every 1s)

            now              | count
-------------------------------+-------
2019-05-05 00:44:12.041667+00 |   231
(1 row)

...

            now              | count
------------------------------+-------
2019-05-05 00:47:33.16533+00 |   710
(1 row)

Sun 05 May 2019 12:47:40 AM UTC (every 1s)

            now              | count
-------------------------------+-------
2019-05-05 00:47:40.524662+00 |   710
(1 row)

और PostgreSQL लॉग से हम सीखते हैं कि कनेक्शन पाइप के साथ कुछ हुआ:

2019-05-05 00:44:11 UTC-5cce31da.c60-LOG:  connection received: host=40.114.85.62 port=50925 pid=3168
2019-05-05 00:44:11 UTC-5cce31db.c58-LOG:  connection received: host=40.114.85.62 port=55256 pid=3160
2019-05-05 00:44:11 UTC-5cce31db.c5c-LOG:  connection received: host=40.114.85.62 port=34526 pid=3164
2019-05-05 00:44:11 UTC-5cce31db.c64-LOG:  connection received: host=40.114.85.62 port=1178 pid=3172
...
2019-05-05 00:47:32 UTC-5cce329a.146c-LOG:  connection received: host=40.114.85.62 port=41769 pid=5228
2019-05-05 00:47:33 UTC-5cce3287.1404-LOG:  connection authorized: user=postgresdatabase=postgres SSL enabled (protocol=TLSv1.1, cipher=ECDHE-RSA-AES256-SHA, compression=off)
2019-05-05 00:47:33 UTC-5cce3288.1428-LOG:  connection authorized: user=postgresdatabase=postgres SSL enabled (protocol=TLSv1.1, cipher=ECDHE-RSA-AES256-SHA, compression=off)
2019-05-05 00:47:33 UTC-5cce3289.1434-LOG:  connection authorized: user=postgresdatabase=postgres SSL enabled (protocol=TLSv1.1, cipher=ECDHE-RSA-AES256-SHA, compression=off)
2019-05-05 00:47:33 UTC-5cce3291.1448-LOG:  connection authorized: user=postgresdatabase=postgres SSL enabled (protocol=TLSv1.1, cipher=ECDHE-RSA-AES256-SHA, compression=off)
2019-05-05 00:47:33 UTC-5cce32a3.1484-LOG:  connection received: host=40.114.85.62 port=50296 pid=5252
2019-05-05 00:47:33 UTC-5cce32a5.1488-LOG:  connection received: host=40.114.85.62 port=28304 pid=5256
2019-05-05 00:47:39 UTC-5cce31d2.a24-LOG:  could not send data to client: An existing connection was forcibly closed by the remote host.
2019-05-05 00:47:39 UTC-5cce31d5.ae8-LOG:  could not receive data from client: An existing connection was forcibly closed by the remote host.
2019-05-05 00:47:39 UTC-5cce31e3.ee4-LOG:  could not send data to client: An existing connection was forcibly closed by the remote host.
2019-05-05 00:47:39 UTC-5cce31e9.1054-LOG:  could not receive data from client: An existing connection was forcibly closed by the remote host.
2019-05-05 00:47:39 UTC-5cce3291.1444-LOG:  could not receive data from client: An existing connection was forcibly closed by the remote host.
2019-05-05 00:47:40 UTC-5cce31cd.8ec-LOG:  could not send data to client: An existing connection was forcibly closed by the remote host.

max_connections में सीमा और pgbench और sysbench परीक्षणों के दौरान आने वाली समस्याओं का सामना करते हुए, मैं इस बारे में उत्सुक होना शुरू कर दिया कि क्या 16-कोर डेटाबेस समान व्यवहार प्रदर्शित करेगा।

16-कोर डेटाबेस इंस्टेंस

16-कोर डेटाबेस इंस्टेंस पर 1000 क्लाइंट को समायोजित करने के लिए max_connections की सीमा पर्याप्त रूप से बड़ी है:

[email protected]:5432 postgres> show max_connections ;
 max_connections
-----------------
 1900
(1 row)

इसने मुझे वही बेंचमार्क कमांड चलाने की अनुमति दी जो मैंने पिछले क्लाउड प्रदाताओं पर उपयोग किया था।

बेंचमार्क सफलतापूर्वक पूरा हुआ और परिणाम नीचे दिखाए गए हैं:

पीजीबेंच

  • आरंभीकरण:
    [[email protected] scripts]# pgbench -i --fillfactor=90 --scale=10000
    NOTICE:  table "pgbench_history" does not exist, skipping
    NOTICE:  table "pgbench_tellers" does not exist, skipping
    NOTICE:  table "pgbench_accounts" does not exist, skipping
    NOTICE:  table "pgbench_branches" does not exist, skipping
    creating tables...
    100000 of 1000000000 tuples (0%) done (elapsed 0.08 s, remaining 807.39 s)
    200000 of 1000000000 tuples (0%) done (elapsed 0.13 s, remaining 628.37 s)
    300000 of 1000000000 tuples (0%) done (elapsed 0.16 s, remaining 527.89 s)
    ...
    600100000 of 1000000000 tuples (60%) done (elapsed 2499.90 s, remaining 1665.90 s)
    600200000 of 1000000000 tuples (60%) done (elapsed 2500.07 s, remaining 1665.33 s)
    ...
    999900000 of 1000000000 tuples (99%) done (elapsed 4170.91 s, remaining 0.42 s)
    1000000000 of 1000000000 tuples (100%) done (elapsed 4171.29 s, remaining 0.00 s)
    vacuum...
    set primary keys...
    total time: 13701.50 s (insert 4173.33 s, commit 0.05 s, vacuum 7098.74 s, index 2429.39 s)
    done.
  • चलाएं:
    [[email protected] scripts]# pgbench --protocol=prepared -P 60 --time=600 --client=1000 --jobs=2048
    starting vacuum...end.
    progress: 81.4 s, 5639.1 tps, lat 80.094 ms stddev 73.213
    progress: 120.0 s, 4091.0 tps, lat 224.161 ms stddev 608.523
    progress: 180.0 s, 6932.1 tps, lat 145.143 ms stddev 228.925
    progress: 240.0 s, 7287.9 tps, lat 136.521 ms stddev 156.643
    progress: 300.0 s, 7567.8 tps, lat 132.722 ms stddev 158.754
    progress: 360.0 s, 8077.9 tps, lat 123.801 ms stddev 139.033
    progress: 420.0 s, 6076.9 tps, lat 163.886 ms stddev 201.121
    progress: 480.0 s, 5376.2 tps, lat 186.678 ms stddev 191.270
    progress: 540.0 s, 4864.0 tps, lat 205.696 ms stddev 164.261
    progress: 600.0 s, 3759.3 tps, lat 266.073 ms stddev 542.717
    transaction type: <builtin: TPC-B (sort of)>
    scaling factor: 10000
    query mode: prepared
    number of clients: 1000
    number of threads: 1000
    duration: 600 s
    number of transactions actually processed: 3614386
    latency average = 152.935 ms
    latency stddev = 248.593 ms
    tps = 6002.082008 (including connections establishing)
    tps = 6513.306467 (excluding connections establishing)

हालांकि, यह काफी अच्छी तरह से चला गया, हालांकि, एडब्ल्यूएस और जी क्लाउड के परिणामों के साथ इन परिणामों की तुलना करने का कोई वैध तरीका नहीं है, क्योंकि हम एक समान प्लेटफॉर्म पर परीक्षण नहीं कर रहे हैं। लेकिन यह हमें अगले बिंदु पर ले जाने के लिए काफी अच्छा है।

सिसबेंच

जैसे ही pgbench परीक्षण सफलतापूर्वक पूरा हुआ, मैंने Azure $200 क्रेडिट का पूरा लाभ उठाने का फैसला किया, और पुष्टि की कि sysbench 8-कोर इंस्टेंस पर पिछले रन से आगे निकल गया:

sysbench \
   --test=/usr/local/share/sysbench/oltp.lua \
   --pgsql-host=191.238.6.43 \
   --pgsql-db=postgres \
   [email protected] \
   [email protected] \
   --pgsql-port=5432 \
   --oltp-tables-count=250 \
   --oltp-table-size=450000 prepare

sysbench 0.5:  multi-threaded system evaluation benchmark

Creating table 'sbtest1'...
Inserting 450000 records into 'sbtest1'
Creating secondary indexes on 'sbtest1'...
Creating table 'sbtest2'...
Inserting 450000 records into 'sbtest2'
Creating secondary indexes on 'sbtest2'...
Creating table 'sbtest3'...
Inserting 450000 records into 'sbtest3'
Creating secondary indexes on 'sbtest3'...
Creating table 'sbtest4'...

यह ठीक काम कर रहा था, और चूंकि मैं अपने बजट के करीब आ रहा था, इसलिए मैंने कार्य को रोकने का फैसला किया।

हाइपरस्केल (साइटस)

हालांकि उत्पादन के लिए तैयार नहीं है, यह विकल्प देखने लायक है, क्योंकि यह उन्नत सुविधाएँ प्रदान करता है जो AWS और G क्लाउड में उपलब्ध नहीं हैं।

साइटस डेटा प्राप्त करने के परिणामस्वरूप माइक्रोसॉफ्ट हाइपरस्केल (साइटस) के नाम से अपने प्रमुख पोस्टग्रेएसक्यूएल उत्पाद का पूर्वावलोकन संस्करण पेश करता है।

पोर्टल विज़ार्ड अन्यथा जटिल वातावरण का सेटअप बनाता है, एक हवा:

Azure हाइपरस्केल (साइटस) कॉन्फ़िगरेशन

मैंने नोट किया कि विंडोज़ पर चलने वाले एज़्योर पोस्टग्रेएसक्यूएल के विपरीत, हाइपरस्केल लिनक्स पर चलता है:

[email protected]:5432 citus> select version();
                                                    version
----------------------------------------------------------------------------------------------------------------
 PostgreSQL 11.2 on x86_64-pc-linux-gnu, compiled by gcc (Ubuntu 5.4.0-6ubuntu1~16.04.5) 5.4.0 20160609, 64-bit
(1 row)

दुर्भाग्य से, जबकि हाइपरस्केल एक रोमांचक यात्रा का वादा कर रहा था, इस समय मैं परीक्षण चलाने के साथ आगे नहीं बढ़ सका क्योंकि वर्तमान में max_connections को 300 तक सीमित कर दिया गया है, समायोजन के लिए कोई विकल्प नहीं है, हालांकि क्षमता देशी साइटस पॉसग्रेएसक्यूएल के लिए प्रलेखित है:

[email protected]:5432 citus> show max_connections ;
 max_connections
-----------------
 300
(1 row)
हाइपरस्केल (साइटस) कोऑर्डिनेटर कनेक्शन उपलब्ध पैरामीटर हाइपरस्केल (साइटस) कार्यकर्ता:max_connections उपलब्ध नहीं है

बेंचमार्क मेट्रिक्स

क्लाइंट और सर्वर के प्रदर्शन और व्यवहार को दर्शाने वाले कुछ मेट्रिक्स:

Azure पोर्टल डैशबोर्ड - क्लाइंट और सर्वर के लिए मेट्रिक्स

पोस्टग्रेएसक्यूएल मेट्रिक्स क्वेरी परफॉर्मेंस इनसाइट का उपयोग करके एकत्र हुए:

Azure PostgreSQL - क्वेरी प्रदर्शन अंतर्दृष्टि:शीर्ष 5 प्रश्न Azure PostgreSQL - क्वेरी प्रदर्शन अंतर्दृष्टि:शीर्ष 5 प्रतीक्षा

निष्कर्ष

संबंधित संसाधन बेंचमार्क प्रबंधित PostgreSQL क्लाउड समाधान - भाग एक:Amazon Aurora बेंचमार्क प्रबंधित PostgreSQL क्लाउड समाधान - भाग दो:Amazon RDS बेंचमार्क प्रबंधित PostgreSQL क्लाउड समाधान - भाग तीन:Google क्लाउड

सबसे पहले, यदि आपने इसे इतनी दूर कर दिया है, तो पढ़ने के लिए धन्यवाद, और यदि आपको ऐसी कोई गलती दिखाई देती है, जिसके कारण पर्यावरण ने दुर्व्यवहार किया हो, तो मैं प्रतिक्रिया की बहुत सराहना करूंगा। बशर्ते कि मुझसे कुछ स्पष्ट छूट गया हो, मैं परीक्षण दोहराने के लिए तैयार हूं।

"NT HARD ERROR" हेक्स डंप की ओर ले जाने वाला डेटाबेस इंजन क्रैश इंगित करता है कि उपयोगकर्ता नियंत्रण से बाहर कुछ हुआ है, और एक अच्छी प्रबंधित सेवा स्वचालन के माध्यम से या प्रभारी SRE को अलर्ट करके पुनर्प्राप्त होगी। अगर मैं और अधिक समय तक प्रतीक्षा करता, तो ऐसा हो सकता था, हालांकि यह सवाल उठाता है कि सेवा बहाल होने तक उपयोगकर्ताओं को कितने समय तक प्रतीक्षा करनी चाहिए।

मूल्य निर्धारण स्तर और vCores के आधार पर एक मूल्य के लिए max_connections को लॉक करना मुझे आश्चर्यचकित कर गया, विशेष रूप से तीन अन्य प्रबंधित सेवाओं का परीक्षण करने के बाद, Google क्लाउड ने उपयोगकर्ता द्वारा पैरामीटर को कॉन्फ़िगर करने की अनुमति दी, भले ही डिफ़ॉल्ट मान बहुत कम था (जी पर 600) Azure पर क्लाउड बनाम 960)।

डिफ़ॉल्ट मानों को बदलने से बचने के लिए 16-कोर रेंज में डेटाबेस इंस्टेंस के साथ एक परीक्षण की आवश्यकता हो सकती है, हालांकि उस समय मैं हैमरडीबी जैसे बेहतर टूल का उपयोग करके परीक्षण करना पसंद करूंगा (उपकरणों की चर्चा के लिए भाग 1 देखें) ।


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. Django में स्कीमा का उपयोग कैसे करें?

  2. उन पंक्तियों का चयन करें जो अन्य तालिका में मौजूद नहीं हैं

  3. धीमी क्वेरी के साथ PostgreSQL प्रदर्शन समस्याओं की पहचान कैसे करें

  4. PostgreSQL में माइग्रेट करने के लिए सर्वश्रेष्ठ ETL उपकरण

  5. SQLite3 LIKE या PostgreSQL ILIKE के लिए सामान्य रूबी समाधान?