Sqlserver
 sql >> डेटाबेस >  >> RDS >> Sqlserver

SQL सर्वर बल्क इंसर्ट - भाग 2

इस लेख के पिछले भाग में, हमने बल्क इन्सर्ट स्टेटमेंट की मदद से सीएसवी फाइलों को SQL सर्वर में आयात करने के तरीके पर चर्चा की। हमने बल्क इंसर्ट प्रक्रिया की मुख्य कार्यप्रणाली और परिदृश्यों में BATCHSIZE और MAXERRORS विकल्पों के विवरण पर भी चर्चा की। इस भाग में, हम विभिन्न परिदृश्यों में बल्क इंसर्ट प्रक्रिया के कुछ अन्य विकल्पों (FIRE_TRIGGERS, CHECK_CONSTRAINTS और TABLOCK) से गुजरेंगे।

परिदृश्य 1:क्या हम बल्क इंसर्ट ऑपरेशन के दौरान गंतव्य तालिका में ट्रिगर सक्षम कर सकते हैं?

डिफ़ॉल्ट रूप से, थोक सम्मिलन प्रक्रिया के दौरान, लक्ष्य तालिका में निर्दिष्ट सम्मिलित ट्रिगर सक्रिय नहीं होते हैं, हालांकि, कुछ स्थितियों में हम इन ट्रिगर को सक्षम करना चाह सकते हैं। इस समस्या का समाधान बल्क इंसर्ट स्टेटमेंट में FIRE_TRIGGERS विकल्प का उपयोग करना है। मैं एक नोटिस जोड़ना चाहता हूं कि यह विकल्प थोक सम्मिलन ऑपरेशन प्रदर्शन को प्रभावित और घटा सकता है क्योंकि ट्रिगर/ट्रिगर डेटाबेस में अलग-अलग संचालन कर सकते हैं। निम्नलिखित नमूने में, हम इसे प्रदर्शित करेंगे। सबसे पहले, हम FIRE_TRIGGERS पैरामीटर सेट नहीं करेंगे और बल्क इंसर्ट प्रक्रिया इंसर्ट ट्रिगर को सक्रिय नहीं करेगी। निम्नलिखित टी-एसक्यूएल स्क्रिप्ट में, हम बिक्री तालिका के लिए एक सम्मिलित ट्रिगर परिभाषित करेंगे।

DROP TABLE IF EXISTS Sales 

CREATE TABLE [dbo].[Sales](
	[Region] [varchar](50) ,
	[Country] [varchar](50) ,
	[ItemType] [varchar](50) NULL,
	[SalesChannel] [varchar](50) NULL,
	[OrderPriority] [varchar](50) NULL,
	[OrderDate]  datetime,
	[OrderID] bigint NULL,
	[ShipDate] datetime,
	[UnitsSold]  float,
	[UnitPrice] float,
	[UnitCost] float,
	[TotalRevenue] float,
	[TotalCost]  float,
	[TotalProfit] float
) 
DROP TABLE IF EXISTS SalesLog
CREATE TABLE SalesLog (OrderIDLog bigint)
GO
CREATE TRIGGER OrderLogIns ON Sales
FOR INSERT
AS
BEGIN 
SET NOCOUNT ON 
INSERT INTO SalesLog
SELECT OrderId from inserted
end

GO
BULK INSERT Sales
FROM 'C:\1500000 Sales Records.csv'
WITH (FIRSTROW = 2,
    FIELDTERMINATOR = ',',
	ROWTERMINATOR='\n'
	 );


	SELECT Count(*) FROM SalesLog

जैसा कि आप ऊपर देख सकते हैं, सम्मिलित ट्रिगर सक्रिय नहीं हुआ क्योंकि हमने FIRE_TRIGGERS विकल्प सेट नहीं किया था। अब, हम FIRE_TRIGGERS विकल्प को बल्क इंसर्ट स्टेटमेंट में जोड़ देंगे ताकि यह विकल्प फायर ट्रिगर डालने में सक्षम हो जाए।

BULK INSERT Sales
FROM 'C:\1500000 Sales Records.csv'
WITH (FIRSTROW = 2, 
FIELDTERMINATOR = ',', 
ROWTERMINATOR='\n',
FIRE_TRIGGERS);
GO
SELECT Count(*) as [NumberOfRowsinTriggerTable] FROM SalesLog 

परिदृश्य 2:बल्क इंसर्ट ऑपरेशन के दौरान चेक बाधा को कैसे सक्षम किया जा सकता है?

जाँच की कमी हमें SQL सर्वर तालिकाओं में डेटा अखंडता को लागू करने की अनुमति देती है। बाधा का उद्देश्य उनके सिंटैक्स विनियमन के अनुसार सम्मिलित, अद्यतन या हटाए गए मानों की जांच करना है। जैसे, NOT NULL बाधा यह प्रदान करती है कि एक निर्दिष्ट कॉलम को NULL मान द्वारा संशोधित नहीं किया जा सकता है। अब, हम बाधाओं और बल्क इंसर्ट इंटरैक्शन पर ध्यान केंद्रित करेंगे। डिफ़ॉल्ट रूप से, बल्क इंसर्ट प्रक्रिया के दौरान किसी भी चेक और विदेशी कुंजी बाधाओं को नजरअंदाज कर दिया जाता है, लेकिन इस विकल्प में कुछ अपवाद हैं। Microsoft दस्तावेज़ के अनुसार "अद्वितीय और प्राथमिक कुंजी बाधाएं हमेशा लागू की जाती हैं। किसी वर्ण स्तंभ में आयात करते समय  जिसके लिए NOT NULL बाधा परिभाषित की गई है, टेक्स्ट फ़ाइल में कोई मान न होने पर बल्क INSERT एक रिक्त स्ट्रिंग सम्मिलित करता है।" निम्नलिखित टी-एसक्यूएल स्क्रिप्ट में, हम ऑर्डरडेट कॉलम में एक चेक बाधा जोड़ेंगे जो 01.01.2016 से अधिक ऑर्डर तिथि को नियंत्रित करता है।

DROP TABLE IF EXISTS Sales 

CREATE TABLE [dbo].[Sales](
	[Region] [varchar](50) ,
	[Country] [varchar](50) ,
	[ItemType] [varchar](50) NULL,
	[SalesChannel] [varchar](50) NULL,
	[OrderPriority] [varchar](50) NULL,
	[OrderDate]  datetime,
	[OrderID] bigint NULL,
	[ShipDate] datetime,
	[UnitsSold]  float,
	[UnitPrice] float,
	[UnitCost] float,
	[TotalRevenue] float,
	[TotalCost]  float,
	[TotalProfit] float
) 
ALTER TABLE [Sales] ADD CONSTRAINT OrderDate_Check
CHECK(OrderDate >'20160101')

BULK INSERT Sales
FROM 'C:\1500000 Sales Records.csv'
WITH (FIRSTROW = 2,
    FIELDTERMINATOR = ',',
	ROWTERMINATOR='\n'
	 );
GO
SELECT COUNT(*) AS [UnChekedData] FROM 
Sales WHERE OrderDate <'20160101'

जैसा कि आप उपरोक्त नमूने में देख सकते हैं, बल्क इंसर्ट प्रक्रिया चेक बाधा नियंत्रण को छोड़ देती है। हालाँकि, SQL सर्वर चेक बाधा को अविश्वसनीय के रूप में इंगित करता है।

SELECT is_not_trusted ,* FROM sys.check_constraints where name='OrderDate_Check'

यह मान इंगित करता है कि किसी ने चेक बाधा को छोड़ कर इस कॉलम में कुछ डेटा डाला या अपडेट किया है, साथ ही इस कॉलम में उस बाधा के संदर्भ में असंगत डेटा हो सकता है। अब, हम CHECK_CONSTRAINTS विकल्प के साथ बल्क इंसर्ट स्टेटमेंट को निष्पादित करने का प्रयास करेंगे। परिणाम बहुत आसान है, जाँच बाधा अनुचित डेटा के कारण त्रुटि देता है।

BULK INSERT Sales
FROM 'C:\1500000 Sales Records.csv'
WITH (FIRSTROW = 2,
    FIELDTERMINATOR = ',',
	ROWTERMINATOR='\n'
	 );

परिदृश्य 3:एक गंतव्य तालिका में एकाधिक थोक प्रविष्टियों में प्रदर्शन कैसे बढ़ाएं?

SQL सर्वर में लॉकिंग मैकेनिज्म का मुख्य उद्देश्य डेटा की अखंडता की रक्षा करना और सुनिश्चित करना है। SQL सर्वर लॉकिंग आलेख की मुख्य अवधारणा में, आप लॉक तंत्र के बारे में विवरण प्राप्त कर सकते हैं। अब, हम बल्क इंसर्ट प्रोसेस लॉकिंग विवरण पर ध्यान केंद्रित करेंगे। यदि आप TABLELOCK विकल्प के बिना बल्क इंसर्ट स्टेटमेंट चलाते हैं, तो यह लॉक पदानुक्रम के अनुसार पंक्तियों या तालिका के लॉक को प्राप्त कर लेता है। हालाँकि, कुछ मामलों में, हम एक गंतव्य तालिका के विरुद्ध कई बल्क इंसर्ट प्रक्रियाओं को निष्पादित करना चाह सकते हैं, इसलिए हम बल्क इंसर्ट के संचालन समय को कम कर सकते हैं। सबसे पहले, हम दो बल्क इंसर्ट स्टेटमेंट को एक साथ निष्पादित करेंगे और लॉकिंग तंत्र के व्यवहार का विश्लेषण करेंगे। हम SQL सर्वर प्रबंधन स्टूडियो में दो क्वेरी विंडो खोलेंगे और एक साथ निम्नलिखित बल्क इंसर्ट स्टेटमेंट चलाएंगे।

BULK INSERT Sales
FROM 'C:\1500000 Sales Records.csv'
WITH (FIRSTROW = 2,
    FIELDTERMINATOR = ',',
	ROWTERMINATOR='\n'
	 );

जब हम निम्नलिखित dmv (डायनामिक मैनेजमेंट व्यू) क्वेरी को निष्पादित करते हैं, जो बल्क इंसर्ट प्रक्रिया की स्थिति की निगरानी करने में मदद करती है।

SELECT session_id,command ,status,last_wait_type,text FROM sys.dm_exec_requests cross apply 
sys.dm_exec_sql_text(sys.dm_exec_requests.sql_handle)
where text like '%BULK INSERT Sales%' and session_id <>@@SPID

जैसा कि आप उपरोक्त छवि, सत्र 61 में देख सकते हैं, लॉकिंग के कारण बल्क इंसर्ट प्रक्रिया की स्थिति निलंबित है। यदि हम समस्या को सत्यापित करते हैं, तो सत्र 59 बल्क इंसर्ट डेस्टिनेशन टेबल को लॉक कर देता है और सेशन 61 बल्क इंसर्ट प्रक्रिया को जारी रखने के लिए इस लॉक के जारी होने की प्रतीक्षा करता है। अब, हम बल्क इंसर्ट स्टेटमेंट में TABLOCK विकल्प जोड़ेंगे और प्रश्नों को निष्पादित करेंगे।

जब हम dmv मॉनिटरिंग क्वेरी को फिर से निष्पादित करते हैं, तो हम कोई निलंबित बल्क इंसर्ट प्रक्रिया नहीं देख सकते हैं क्योंकि SQL सर्वर एक विशेष लॉक प्रकार का उपयोग करता है जिसे बल्क अपडेट लॉक (BU) कहा जाता है। यह लॉक प्रकार एक ही टेबल पर एक साथ कई बल्क इंसर्ट ऑपरेशंस को प्रोसेस करने की अनुमति देता है और यह विकल्प बल्क इंसर्ट प्रोसेस के कुल समय को भी कम करता है।

जब हम बल्क इंसर्ट प्रक्रिया के दौरान निम्नलिखित क्वेरी को निष्पादित करते हैं, तो हम लॉकिंग विवरण और लॉक प्रकारों की निगरानी कर सकते हैं।

SELECT dm_tran_locks.request_session_id,
       dm_tran_locks.resource_database_id,
       DB_NAME(dm_tran_locks.resource_database_id) AS dbname,
       CASE
           WHEN resource_type = 'OBJECT'
               THEN OBJECT_NAME(dm_tran_locks.resource_associated_entity_id)
           ELSE OBJECT_NAME(partitions.OBJECT_ID)
       END AS ObjectName,
       partitions.index_id,
       indexes.name AS index_name,
       dm_tran_locks.resource_type,
       dm_tran_locks.resource_description,
       dm_tran_locks.resource_associated_entity_id,
       dm_tran_locks.request_mode,
       dm_tran_locks.request_status
FROM sys.dm_tran_locks
LEFT JOIN sys.partitions ON partitions.hobt_id = dm_tran_locks.resource_associated_entity_id
LEFT JOIN sys.indexes ON indexes.OBJECT_ID = partitions.OBJECT_ID AND indexes.index_id = partitions.index_id
WHERE resource_associated_entity_id > 0
  AND resource_database_id = DB_ID()

निष्कर्ष

इस लेख में, हमने SQL सर्वर में बल्क इंसर्ट ऑपरेशन के सभी विवरणों की खोज की। विशेष रूप से, हमने बल्क इंसर्ट कमांड और इसकी सेटिंग्स और विकल्पों का उल्लेख किया है, और हमने विभिन्न परिदृश्यों का भी विश्लेषण किया है जो वास्तविक जीवन की समस्याओं के करीब हैं।

 

संदर्भ

बल्क इंसर्ट (ट्रांजैक्ट-एसक्यूएल)

थोक आयात में न्यूनतम लॉगिंग के लिए पूर्वापेक्षाएँ

थोक आयात के लिए लॉकिंग व्यवहार को नियंत्रित करना

आगे पढ़ना

बीसीपी उपयोगिता के साथ फ्लैट फ़ाइल में डेटा निर्यात करना और बल्क इंसर्ट के साथ डेटा आयात करना

उपयोगी टूल:

dbForge डेटा पंप - SQL डेटाबेस को बाहरी स्रोत डेटा से भरने और सिस्टम के बीच डेटा माइग्रेट करने के लिए एक SSMS ऐड-इन।


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. SQL सर्वर 2014 CTP1 में विभाजन-स्तर ऑनलाइन अनुक्रमणिका संचालन की खोज करना

  2. SQL सर्वर (T-SQL उदाहरण) में एक CHECK बाधा को कैसे सक्षम करें

  3. शीर्ष 100 प्रतिशत चुनें का उपयोग क्यों करें?

  4. संपूर्ण तालिका पर परिवर्तन डेटा कैप्चर (सीडीसी) को कैसे सक्षम करें या SQL सर्वर में कॉलम की सूची के साथ तालिका में सीडीसी को सक्षम करें

  5. इनर जॉइन के अलावा तीन टेबल जॉइन के साथ जुड़ते हैं