मशीन सीखने के 3 प्रकार

मशीन सीखने के 3 प्रकार - डमीज
99 9> एल्गोरिदम और उसके उद्देश्यों के आधार पर मशीन सीखने के कई अलग-अलग स्वादों में आता है। आप मशीन सीखने एल्गोरिदम को अपने उद्देश्य के आधार पर तीन मुख्य समूहों में विभाजित कर सकते हैं:

पर्यवेक्षित सीखना

  • अन्वेषित सीखने
  • सुदृढीकरण सीखना
  • पर्यवेक्षित सीखना

पर्यवेक्षित सीखना

तब होता है जब एक एल्गोरिदम उदाहरण से सीखता है आंकड़ों और संबंधित लक्ष्य प्रतिक्रियाएं जिसमें न्यूमेरिक वैल्यू या स्ट्रिंग लेबल्स, जैसे कक्षाएं या टैग शामिल हो सकते हैं, ताकि बाद में सही प्रतिक्रिया की भविष्यवाणी कर सकें जब नए उदाहरणों के साथ प्रस्तुत किया गया हो। पर्यवेक्षित दृष्टिकोण वास्तव में एक शिक्षक की देखरेख में मानव सीखने के समान है। शिक्षक छात्र के लिए यादगार उदाहरण प्रदान करता है, और छात्र इन विशिष्ट उदाहरणों से सामान्य नियम प्राप्त करता है।

आप प्रतिगमन समस्याओं, जिसका लक्ष्य एक संख्यात्मक मूल्य और वर्गीकरण समस्याएं, जिसका लक्ष्य एक गुणात्मक चर है, जैसे वर्ग या टैग के बीच अंतर करने की आवश्यकता है एक प्रतिगमन कार्य बोस्टन क्षेत्र में घरों की औसत कीमतों को निर्धारित करता है, और एक वर्गीकरण कार्य उनके पेपैल और पत्ती उपायों के आधार पर परितारिका के फूलों के बीच अंतर करता है।

अनर्गर्वर्ड सीखना

अनर्गर्वेट किया गया अधिगम

तब होता है जब कोई एल्गोरिदम किसी भी संबंधित प्रतिक्रिया के बिना सादा उदाहरण से सीखता है, अपने स्वयं के डेटा पैटर्न को निर्धारित करने के लिए एल्गोरिथ्म को छोड़कर। एल्गोरिथ्म के इस प्रकार के डेटा को कुछ और में पुनर्गठन करना पड़ता है, जैसे कि नई विशेषताओं, जो एक वर्ग या गैर-संबद्ध मूल्यों की एक नई श्रृंखला का प्रतिनिधित्व कर सकते हैं। वे इंसानों को डेटा के अर्थ में अंतर्दृष्टि प्रदान करने और पर्यवेक्षण मशीन सीखने के एल्गोरिदम के लिए नई उपयोगी जानकारी प्रदान करने में काफी उपयोगी हैं।

सीखने की एक तरह के रूप में, यह मनुष्य के तरीकों के समान होता है जो कुछ वस्तुओं या घटनाओं को एक ही वर्ग के हैं, जैसे कि वस्तुओं के बीच समानता की डिग्री को देखते हुए। विपणन अनुक्रम के रूप में वेब पर आपको जो कुछ अनुशंसा प्रणाली मिलती है वह इस प्रकार के सीखने के आधार पर होती है।

विपणन स्वचालन एल्गोरिथ्म आपके सुझावों को आपने जो अतीत में खरीदा है उससे मिलता है यह सिफारिशें आपको उन ग्राहकों के समूह के अनुमान के आधार पर आधारित हैं जिन पर आप सबसे ज्यादा समान हैं और फिर उस समूह के आधार पर आपके संभावित प्राथमिकताओं का अनुमान लगाते हैं।

सुदृढीकरण सीखना

सुदृढीकरण सीखना

तब होता है जब आप ऐसे उदाहरणों के साथ एल्गोरिथ्म पेश करते हैं जो लेबल्स की कमी होती है, जैसा कि अनसुचित शिक्षा के रूप में हालांकि, आप एल्गोरिदम प्रस्ताव के समाधान के अनुसार सकारात्मक या नकारात्मक प्रतिक्रिया के साथ एक उदाहरण के साथ जा सकते हैं।सुदृढीकरण सीखना उन अनुप्रयोगों से जुड़ा हुआ है, जिसके लिए एल्गोरिथ्म को निर्णय करना चाहिए (इसलिए उत्पाद अनिवार्य शिक्षण के अनुसार, केवल वर्णनात्मक नहीं है), और निर्णय परिणाम भुगतना पड़ता है। मानव दुनिया में, यह सिर्फ परीक्षण और त्रुटि से सीखने की तरह है गलतियां आपको सीखने में मदद करती हैं क्योंकि उनके पास जुर्माना जुड़ा हुआ है (लागत, समय की हानि, अफसोस, दर्द और इसी तरह), आपको यह सिखाते हुए कि दूसरों की तुलना में सफल होने की संभावना कम है सुदृढीकरण सीखने का एक दिलचस्प उदाहरण तब होता है जब कंप्यूटर स्वयं वीडियो गेम खेलना सीखते हैं

इस मामले में, एक आवेदन विशिष्ट स्थितियों के उदाहरणों के साथ एल्गोरिथ्म प्रस्तुत करता है, जैसे कि एक शत्रु से परहेज करते समय गेमर भूलभुलैया में फंस गया था आवेदन एल्गोरिथ्म को इसके क्रियान्वयन के परिणामों के बारे में पता करने देता है, और खतरनाक होने का पता लगाने से बचने की कोशिश करते हुए और अस्तित्व का पीछा करने के लिए सीखने का अनुभव होता है। आप यह देख सकते हैं कि कैसे कंपनी Google दीपमाइंड ने एक सुदृढीकरण सीखने का कार्यक्रम बनाया है जो पुरानी अटारी के वीडियो गेम खेलते हैं वीडियो देखने पर, ध्यान दें कि कार्यक्रम शुरू में बेढ़ंगे और अकुशल है, लेकिन प्रशिक्षण के साथ लगातार सुधार होता है जब तक कि यह चैंपियन बनने तक नहीं हो।