Oracle
 sql >> डेटाबेस >  >> RDS >> Oracle

Oracle डेटा माइनिंग (ODM) - स्थापना और स्थापना

अवलोकन

Oracle डेटा माइनिंग (ODM) Oracle उन्नत विश्लेषिकी डेटाबेस विकल्प का एक घटक है। ODM में उन्नत डेटा माइनिंग एल्गोरिदम का एक सूट होता है जो डेटाबेस में एम्बेडेड होता है जो आपको अपने डेटा पर उन्नत विश्लेषण करने की अनुमति देता है।

Oracle डेटा माइनर Oracle SQL डेवलपर का एक विस्तार है, जो Oracle SQL के लिए एक ग्राफिकल विकास वातावरण है। Oracle डेटा माइनर डेटा माइनिंग ऑपरेशंस को एनकैप्सुलेट करने वाले वर्कफ़्लोज़ बनाने, निष्पादित करने और प्रबंधित करने के लिए Oracle डेटाबेस में एम्बेडेड डेटा माइनिंग तकनीक का उपयोग करता है। ODM की वास्तुकला को चित्र 1 में दिखाया गया है।

चित्र 1:बड़े डेटा के लिए Oracle डेटा माइनिंग आर्किटेक्चर

एल्गोरिदम को SQL फ़ंक्शन के रूप में लागू किया जाता है और Oracle डेटाबेस की ताकत का लाभ उठाता है। SQL डेटा माइनिंग फंक्शन ट्रांजेक्शनल डेटा, एग्रीगेशन, असंरचित डेटा यानी CLOB डेटा टाइप (Oracle टेक्स्ट का उपयोग करके) और स्थानिक डेटा को माइन कर सकते हैं।

प्रत्येक डेटा माइनिंग फ़ंक्शन उन समस्याओं के एक वर्ग को निर्दिष्ट करता है जिन्हें मॉडलिंग और हल किया जा सकता है। डेटा माइनिंग कार्य आम तौर पर दो श्रेणियों में आते हैं:पर्यवेक्षित और अनुपयोगी।

पर्यवेक्षित और अनुपयोगी शिक्षा की धारणा मशीन लर्निंग के विज्ञान से ली गई है, जिसे कृत्रिम बुद्धिमत्ता का उप-क्षेत्र कहा गया है।

पर्यवेक्षित शिक्षण को निर्देशित शिक्षण के रूप में भी जाना जाता है। सीखने की प्रक्रिया पहले से ज्ञात आश्रित विशेषता या लक्ष्य द्वारा निर्देशित होती है। निर्देशित डेटा माइनिंग लक्ष्य के व्यवहार को स्वतंत्र विशेषताओं या भविष्यवक्ताओं के एक सेट के एक फ़ंक्शन के रूप में समझाने का प्रयास करता है।

अनुपयोगी शिक्षण अनिर्देशित होता है। आश्रित और स्वतंत्र गुणों के बीच कोई अंतर नहीं है। मॉडल के निर्माण में एल्गोरिथ्म का मार्गदर्शन करने के लिए कोई पूर्व-ज्ञात परिणाम नहीं है। गैर पर्यवेक्षित शिक्षण का उपयोग वर्णनात्मक उद्देश्यों के लिए किया जा सकता है।

Oracle डेटा माइनिंग पर्यवेक्षित एल्गोरिदम

तकनीक प्रयोज्यता एल्गोरिदम (संक्षिप्त विवरण)
वर्गीकरण
एक विशिष्ट परिणाम की भविष्यवाणी करने के लिए सबसे अधिक इस्तेमाल की जाने वाली तकनीक उदाहरण के लिए कैंसर ट्यूमर कोशिकाओं की पहचान, भावना विश्लेषण, दवाओं का वर्गीकरण, स्पैम का पता लगाना। सामान्यीकृत लीनियर मॉडल लॉजिस्टिक रिग्रेशन - उच्च प्रदर्शन, स्केलेबल, पैरालाइज्ड कार्यान्वयन (सभी OAA ML एल्गोरिदम पर लागू) में Oracle डेटाबेस के अंदर उपलब्ध क्लासिक सांख्यिकीय तकनीक। टेक्स्ट और ट्रांजेक्शनल डेटा का समर्थन करता है (लगभग सभी OAA ML एल्गोरिदम पर लागू होता है)

Naive Bayes - तेज़, सरल, सामान्य रूप से लागू।

सपोर्ट वेक्टर मशीन - मशीन लर्निंग एल्गोरिथम, टेक्स्ट का समर्थन करता है और विस्तृत डेटा।

डिसीजन ट्री - व्याख्या के लिए लोकप्रिय एमएल एल्गोरिथम। मानव-पठनीय "नियम" प्रदान करता है।
Regression
खगोलीय डेटा विश्लेषण, उपभोक्ता व्यवहार, लाभप्रदता और अन्य व्यावसायिक कारकों पर अंतर्दृष्टि उत्पन्न करना, जैविक प्रणालियों में मापदंडों के बीच कारण संबंधों की गणना जैसे निरंतर संख्यात्मक परिणाम की भविष्यवाणी करने की तकनीक। सामान्यीकृत रैखिक मॉडल एकाधिक प्रतिगमन - क्लासिक सांख्यिकीय तकनीक लेकिन अब Oracle डेटाबेस के अंदर एक उच्च प्रदर्शन, स्केलेबल, पैरालाइज्ड कार्यान्वयन के रूप में उपलब्ध है। रिज रिग्रेशन, फीचर निर्माण और फीचर चयन का समर्थन करता है। टेक्स्ट और लेन-देन संबंधी डेटा का समर्थन करता है।

वेक्टर मशीन का समर्थन करें - मशीन लर्निंग एल्गोरिदम, टेक्स्ट और विस्तृत डेटा का समर्थन करता है।
विशेषता महत्व
लक्ष्य विशेषता के साथ संबंध की मजबूती के अनुसार रैंक विशेषताएँ। उपयोग के मामलों में उन कारकों का पता लगाना शामिल है जो किसी ऑफ़र का जवाब देने वाले ग्राहकों से सबसे अधिक जुड़े हुए हैं, ऐसे कारक जो सबसे स्वस्थ रोगियों से जुड़े हैं। न्यूनतम विवरण लंबाई - प्रत्येक विशेषता को लक्ष्य वर्ग के एक साधारण भविष्य कहनेवाला मॉडल के रूप में मानता है और सापेक्ष प्रभाव प्रदान करता है।

Oracle डेटा माइनिंग अनियंत्रित एल्गोरिदम

तकनीक प्रयोज्यता एल्गोरिदम
क्लस्टरिंग
क्लस्टरिंग का उपयोग डेटाबेस के रिकॉर्ड को सबसेट या क्लस्टर में विभाजित करने के लिए किया जाता है जहां क्लस्टर में तत्व सामान्य गुणों का एक सेट साझा करते हैं। उदाहरणों में शामिल हैं नए ग्राहक खंड ढूंढना, और मूवी अनुशंसाएं। K-Means - टेक्स्ट माइनिंग, पदानुक्रमित क्लस्टरिंग, दूरी आधारित समर्थन करता है।

ऑर्थोगोनल पार्टिशनिंग क्लस्टरिंग - पदानुक्रमिक क्लस्टरिंग, घनत्व आधारित।

एक्सपेक्टेशन मैक्सिमाइज़ेशन - क्लस्टरिंग तकनीक जो मिश्रित डेटा (घने और विरल) डेटा माइनिंग समस्याओं में अच्छा प्रदर्शन करती है।
विसंगति का पता लगाना
विसंगति का पता लगाना डेटा बिंदुओं, घटनाओं और/या अवलोकनों की पहचान करता है जो डेटासेट के सामान्य व्यवहार से विचलित होते हैं। सामान्य उदाहरणों में बैंक धोखाधड़ी, एक संरचनात्मक दोष, चिकित्सा समस्याएं या किसी पाठ में त्रुटियां शामिल हैं वन-क्लास सपोर्ट वेक्टर मशीन - बिना टैग किए गए डेटा को प्रशिक्षित करती है और यह निर्धारित करने की कोशिश करती है कि परीक्षण बिंदु प्रशिक्षण डेटा के वितरण से संबंधित है या नहीं।
सुविधा चयन और निष्कर्षण
मौजूदा विशेषताओं के रैखिक संयोजन के रूप में नई विशेषताओं का निर्माण करता है। पाठ डेटा, गुप्त अर्थ विश्लेषण (एलएसए), डेटा संपीड़न, डेटा अपघटन और प्रक्षेपण, और पैटर्न पहचान के लिए लागू। Non-negative Matrix Factorization - मूल डेटा को विशेषताओं के नए सेट में मैप करता है

प्रिंसिपल कंपोनेंट्स एनालिसिस (PCA) - नए कम मिश्रित एट्रिब्यूट बनाता है जो सभी का प्रतिनिधित्व करते हैं विशेषताएँ।

एकवचन वेक्टर अपघटन - स्थापित सुविधा निष्कर्षण विधि जिसमें अनुप्रयोगों की एक विस्तृत श्रृंखला है।
एसोसिएशन
बाजार टोकरी विश्लेषण, क्रॉस-सेल, मूल कारण विश्लेषण के लिए उपयोग किए जाने वाले अक्सर सह-होने वाली वस्तुओं से जुड़े नियमों को ढूंढता है। उत्पाद बंडलिंग और दोष विश्लेषण के लिए उपयोगी। Apriori - डेटाबेस में जानकारी एकत्र करने के लिए एक पेड़ को हैश किया

Oracle डेटा माइनिंग विकल्प को सक्षम करना

12c रिलीज़ 2 से Oracle उन्नत विश्लेषिकी विकल्प में डेटा माइनिंग और Oracle R कार्यक्षमता शामिल है।

Oracle डेटाबेस एंटरप्राइज़ संस्करण की स्थापना के दौरान Oracle उन्नत विश्लेषिकी विकल्प डिफ़ॉल्ट रूप से सक्षम होता है। यदि आप डेटाबेस विकल्प को सक्षम या अक्षम करना चाहते हैं, तो आप कमांड-लाइन उपयोगिता चॉप्ट . का उपयोग कर सकते हैं ।

chopt [ enable | disable ] oaa

Oracle उन्नत विश्लेषिकी विकल्प सक्षम करने के लिए:

टेबलस्पेस को ODM स्कीमा बनाना

सभी उपयोगकर्ताओं को एक स्थायी टेबलस्पेस और एक अस्थायी टेबलस्पेस की आवश्यकता होती है जिसमें अपना काम करने के लिए, आपके डेटाबेस में एक अलग क्षेत्र होना बहुत उपयोगी हो सकता है जहां आप अपने सभी डेटा माइनिंग ऑब्जेक्ट बना सकते हैं।

usr_dm_01 स्कीमा  में आपके सभी डेटा माइनिंग कार्य शामिल होंगे।

ODM भंडार बनाना

आपको एक Oracle डेटा माइनिंग रिपॉजिटरी बनाने की आवश्यकता है डेटाबेस में। SQL डेवलपर में डेटा माइनर नेविगेटर पर जाएँ।

दृश्य चुनें -> डेटा माइनर -> डेटा माइनर कनेक्शन:

आपके मौजूदा कनेक्शन टैब के पास एक नया टैब खुलता है:

जोड़ने के लिए usr_dm_01 इस सूची में स्कीमा, हरी प्लस विंडो पर क्लिक करें और ठीक

यदि रिपोजिटरी मौजूद नहीं है तो एक संदेश डिस्प्ले यह पूछेगा कि क्या आप रिपोजिटरी स्थापित करना चाहते हैं। हां . क्लिक करें इंस्टॉल के साथ आगे बढ़ने के लिए बटन।

आपको SYS पासवर्ड डालना होगा

रिपोजिटरी इंस्टालेशन सेटिंग

डेटा माइनर रिपोजिटरी प्रगति विंडो स्थापित करें

टास्क सफलतापूर्वक पूरा हुआ

लॉग फ़ाइल

Oracle डेटा माइनिंग घटक

वर्कफ़्लो आपको नोड की एक श्रृंखला बनाने की अनुमति देता है जो आपके डेटा पर सभी आवश्यक प्रसंस्करण करता है।

भविष्य कहनेवाला विश्लेषण के लिए विकसित वर्कफ़्लो का उदाहरण

ODM डेटा डिक्शनरी दृश्य

आप डेटा डिक्शनरी से खनन मॉडल के बारे में जानकारी प्राप्त कर सकते हैं।

डेटा माइनिंग डेटा डिक्शनरी दृश्यों को संक्षेप में प्रस्तुत किया गया है:

नोट:* ALL_, USER_, DBA_ और CDB_ द्वारा प्रतिस्थापित किया जा सकता है

*_MINING_MODELS :बनाए गए खनन मॉडल के बारे में जानकारी।

*_MINING_MODEL_ATTRIBUTES :ओरेकल डेटा माइनिंग मॉडल बनाने के लिए उपयोग की गई विशेषताओं का विवरण शामिल है।

*_MINING_MODEL_SETTINGS :माइनिंग मॉडल की सेटिंग के बारे में जानकारी लौटाता है, जिस तक आपकी पहुंच है।

संदर्भ

Oracle डाटा माइनिंग यूजर गाइड। यहां उपलब्ध है:https://docs.oracle.com/en/database/oracle/oracle-database/19/dmprg/lot.html

Oracle डेटा माइनिंग - स्केलेबल इन-डेटाबेस प्रेडिक्टिव एनालिटिक्स। यहां उपलब्ध है:https://www.oracle.com/database/technologies/advanced-analytics/odm.html

Oracle डेटा माइनर सिस्टम अवलोकन। यहां उपलब्ध है:https://docs.oracle.com/database/sql-developer-17.4/DMRIG/oracle-data-miner-overview.htm#DMRIG124


  1. Database
  2.   
  3. Mysql
  4.   
  5. Oracle
  6.   
  7. Sqlserver
  8.   
  9. PostgreSQL
  10.   
  11. Access
  12.   
  13. SQLite
  14.   
  15. MariaDB
  1. (+) =ऑरैकल एसक्यूएल में ऑपरेटर जहां क्लॉज

  2. सी # से ओरेकल संग्रहीत प्रक्रिया में पूर्णांक की एक सूची पास करें

  3. Oracle 11g . में पिवट

  4. Oracle में डेटाबेस सुरक्षा

  5. Oracle डेटाबेस 19c में आर्काइव लॉग मोड को कैसे इनेबल करें?