10 सामान्य डेटा खनन गलतियां (जो आप नहीं कर सकेंगे)

10 सामान्य डेटा खनन गलतियाँ (जो आप नहीं करेंगे) - डमीज

डेटा खनन परीक्षण और त्रुटि से किया जाता है, और इसलिए, डेटा खनिकों के लिए, गलती करना केवल प्राकृतिक है गलतियां दूसरे शब्दों में कम से कम कुछ शर्तों के तहत मूल्यवान हो सकती हैं। सभी गलतियों को समान रूप से नहीं बनाया जाता है, फिर भी कुछ तो बस बेहतर से बचा जाता है निम्न सूची दस ऐसी गलतियों को प्रस्तुत करती है यदि आप इन्हें सावधानी से पढ़ते हैं, और उन्हें स्मृति में बांटते हैं, तो आप सीखने की अवस्था पर कुछ समानताएं बच सकते हैं:

  • डेटा की गुणवत्ता जांच को छूना: अधिकांश डेटा खनिक सोचते हैं कि गुणवत्ता की समस्याओं के लिए डेटा की समीक्षा करने से भविष्य कहनेवाला मॉडल विकसित करना ज्यादा मजेदार है लेकिन अगर आप डेटा की गुणवत्ता की समस्या का पता लगाने और उसे सही करने में विफल रहते हैं, तो आप बेकार भविष्यवाणियों के साथ समाप्त हो सकते हैं।

  • बिंदु लापता: आपने कुछ आकर्षक खोज की है! यह अच्छा है, लेकिन अगर यह आपके द्वारा हल करने के लिए निर्धारित व्यावसायिक समस्या से भी प्रासंगिक नहीं है, तो यह बिल्कुल प्रासंगिक नहीं है। फ़िर से पटरी पर आना।

  • विश्वास है कि डेटा में एक पैटर्न एक कारण और प्रभाव संबंध साबित करता है: आप एक डाटासेट का पता लगाएं और नोटिस करें कि जब वैरिएबल ए बढ़ता है, वैरिएबल बी बढ़ता है, तो भी। ऐसा हो सकता है क्योंकि वेरिएबल ए प्रभाव चर बी, या क्योंकि वेरिएबल बी वैरिएबल ए पर प्रभाव डालता है। दूसरी ओर, यह हो सकता है कि दोनों किसी अन्य वैरिएबल से प्रभावित होते हैं जिसे आपने नहीं माना है। या यह एक बार संयोग हो सकता है कौन कह सकता है?

  • बहुत दूर के निष्कर्षों को खींचना: यह मत मानो कि आप जो रिश्तों को डेटा में देख रहे हैं वह अलग-अलग परिस्थितियों में पुनरावृत्त होगा। अगर आपके डेटा को एक शांत वातावरण में एकत्र किया गया था, तो मान लें कि चीजें एक गर्म फैक्ट्री सेटिंग में उसी तरह काम करेंगी।

  • नतीजे पर नज़र रखने वाले परिणामों पर शर्त: डाटा माइनिंग पद्धतियां अनौपचारिक हैं और आमतौर पर वैज्ञानिक पद्धति और सिद्धांत द्वारा समर्थित नहीं हैं, इसलिए आपके परिणामों में कम से कम व्यापारिक समझदारी होती है यदि आपके पास मौजूद परिणामों के लिए कोई सामान्य ज्ञान स्पष्टीकरण नहीं है, तो आपका कार्यकारी प्रबंधन शायद इसे गंभीरता से नहीं ले जाएगा, और उन्हें नहीं चाहिए

  • किसी विशेष मॉडलिंग विधि के साथ प्यार में पड़ने: कोई एक प्रकार का डेटा खनन मॉडल नहीं है जो प्रत्येक स्थिति को फिट करता है

  • पर्याप्त परीक्षण के बिना उत्पादन में एक मॉडल लगाया जा रहा है: अपने व्यवसाय को भविष्य कहनेवाला मॉडल पर शर्त न लगाएं, जब तक कि आप इसे पासपोर्ट डेटा और फ़ील्ड में छोटे पैमाने पर परीक्षण न करें।

  • ऐसे परिणामों को नज़रअंदाज़ करना जिन्हें आप नहीं पसंद करते हैं: यदि आप अब अपने डेटा की उपेक्षा करते हैं, तो यह एक दिन वापस आ जाएगा और कहते हैं, "मैंने आपको ऐसा कहा। "

  • प्रत्येक डेटा विश्लेषण की जरूरत को पूरा करने के लिए डेटा खनन का उपयोग करना: डेटा खनन का जबरदस्त मूल्य है, फिर भी कुछ एप्लिकेशन अभी भी कठोर डेटा संग्रहण विधियों, औपचारिक सांख्यिकीय विश्लेषण और वैज्ञानिक पद्धति के लिए कहते हैं।

  • यह मानते हुए कि पारंपरिक डेटा विश्लेषण तकनीकों को अब कोई फर्क नहीं पड़ता: पिछले बुलेट को देखें