खोज…


टिप्पणियों

मशीन लर्निंग प्रोग्रामिंग कंप्यूटरों का विज्ञान (और कला) है ताकि वे डेटा से सीख सकें।

एक अधिक औपचारिक परिभाषा:

यह अध्ययन का क्षेत्र है जो कंप्यूटर को स्पष्ट रूप से प्रोग्राम किए बिना सीखने की क्षमता देता है। आर्थर सैमुअल, 1959

एक अधिक इंजीनियरिंग उन्मुख परिभाषा:

कंप्यूटर प्रोग्राम को अनुभव E से कुछ कार्य T के संबंध में और कुछ प्रदर्शन माप P से सीखने के लिए कहा जाता है, यदि T से इसका प्रदर्शन, जैसा कि P द्वारा मापा जाता है, अनुभव के साथ सुधार करता है। ई। टॉम मिशेल, 1997

स्रोत: "हाथ-ऑन मशीन लर्निंग विद स्किकिट-लर्न एंड टेन्सरफ्लो एरेलेन गेरोन (ओ'रेली)। कॉपीराइट २०१ Copyright औरेलीन ग्रोन, 978-1-491-96229-9। "

मशीन लर्निंग (एमएल) कंप्यूटर विज्ञान का एक क्षेत्र है जो कृत्रिम बुद्धिमत्ता में अनुसंधान से बाहर निकलता है। एनालिटिक्स के अन्य रूपों पर मशीन सीखने की ताकत छिपी हुई अंतर्दृष्टि को उजागर करने और भविष्य के परिणामों की भविष्यवाणी करने की क्षमता है, अनदेखी इनपुट (सामान्यीकरण)। पुनरावृत्त एल्गोरिदम के विपरीत, जहां ऑपरेशन स्पष्ट रूप से घोषित किए जाते हैं, मशीन लर्निंग एल्गोरिदम संभावित मॉडल से चयन, मूल्यांकन और सुधार करने के लिए संभाव्यता सिद्धांत से अवधारणाओं को उधार लेते हैं।

पायथन का उपयोग करके स्थापना या सेटअप

1) scikit सीखें

scikit-learn, SciPy के शीर्ष पर निर्मित मशीन लर्निंग के लिए पायथन मॉड्यूल है और 3-क्लॉज़ BSD लाइसेंस के तहत वितरित किया जाता है। इसमें विभिन्न वर्गीकरण, प्रतिगमन और क्लस्टरिंग एल्गोरिदम शामिल हैं, जिनमें सपोर्ट वेक्टर मशीन, रैंडम फॉरेस्ट, ग्रेडिएंट बूस्टिंग, के-मीन्स और डीबीएससीएएन शामिल हैं, और इसे पायथन संख्यात्मक और वैज्ञानिक पुस्तकालयों न्यूमॉमी और साइपीपी के साथ मिलकर बनाया गया है।

Scikit-learn के वर्तमान स्थिर संस्करण की आवश्यकता है :

  • अजगर (> = 2.6 या> = 3.3),
  • NumPy (> = 1.6.1),
  • SciPy (> = 0.9)।

अधिकांश स्थापना के लिए pip अजगर पैकेज प्रबंधक अजगर और उसके सभी निर्भरता को स्थापित कर सकता है:

pip install scikit-learn

हालांकि लिनक्स सिस्टम के लिए संभव निर्माण प्रक्रियाओं से बचने के लिए conda पैकेज मैनेजर का उपयोग करने की सिफारिश की जाती है

conda install scikit-learn

यह जांचने के लिए कि आपके पास scikit-learn , शेल में निष्पादित करें:

python -c 'import sklearn; print(sklearn.__version__)'

Windows और Mac OSX स्थापना:

कैनोपी और एनाकोंडा दोनों ही विंडोज़, मैक ओएसएक्स (लिनक्स के लिए भी प्रासंगिक) के लिए वैज्ञानिक अजगर पुस्तकालय के एक बड़े सेट के अलावा, स्किटिट-लर्न के एक हालिया संस्करण को शिप करते हैं

आधिकारिक स्रोत कोड रेपो: https://github.com/scikit-learn/scikit-learn


2) इंटेलिजेंट कम्प्यूटिंग के लिए नुमेंटा प्लेटफार्म

इंटेलिजेंट कंप्यूटिंग के लिए नुमेंटा प्लेटफॉर्म (NuPIC) एक मशीन इंटेलिजेंस प्लेटफॉर्म है जो HTM लर्निंग एल्गोरिदम को लागू करता है। HTM नियोकोर्टेक्स का एक विस्तृत कम्प्यूटेशनल सिद्धांत है। HTM के मूल में समय-आधारित निरंतर सीखने वाले एल्गोरिदम हैं जो स्थानिक और लौकिक पैटर्न को संग्रहीत और याद करते हैं। NuPIC विभिन्न समस्याओं के अनुकूल है, विशेष रूप से विसंगति का पता लगाने और डेटा स्रोतों को स्ट्रीमिंग करने की भविष्यवाणी।

NuPIC बायनेरिज़ के लिए उपलब्ध हैं:

लिनक्स x86 64 बिट
OS X 10.9
OS X 10.10
विंडोज 64 बिट

सभी ऑपरेटिंग सिस्टम पर NuPIC स्थापित करने के लिए निम्न निर्भरताएँ आवश्यक हैं।

  • पायथन 2.7
  • पिप> = 8.1.2
  • setuptools> = 25.2.0
  • पहिया> = 0.29.0
  • numpy
  • C ++ 11 संकलक जैसे gcc (4.8+) या क्लैंग

अतिरिक्त ओएस एक्स आवश्यकताएँ:

  • Xcode कमांड लाइन टूल

NuPIC स्थापित करने के लिए निम्नलिखित चलाएँ:

pip install nupic

आधिकारिक स्रोत कोड रेपो: https://github.com/numenta/nupic


3) nilearn

न्यूर्अम न्यूरोइमेजिंग डेटा पर तेज और आसान सांख्यिकीय सीखने के लिए एक पायथन मॉड्यूल है। यह भविष्य कहनेवाला मॉडलिंग, वर्गीकरण, डिकोडिंग, या कनेक्टिविटी विश्लेषण जैसे अनुप्रयोगों के साथ मल्टीवेरेट आँकड़ों के लिए स्किटिट-लर्न पायथन टूलबॉक्स का लाभ उठाता है।

सॉफ्टवेयर का उपयोग करने के लिए आवश्यक निर्भरताएं हैं:

  • पायथन> = 2.6,
  • setuptools
  • नम्पी> = 1.6.1
  • SciPy> = 0.9
  • स्किकिट-सीख> = 0.14.1
  • निबेल> = 1.1.0

यदि आप nilearn प्लॉटिंग फ़ंक्शंस का उपयोग कर रहे हैं या उदाहरणों को चला रहे हैं, तो matplotlib> = 1.1.1 आवश्यक है।

यदि आप परीक्षण चलाना चाहते हैं, तो आपको नाक> = 1.2.1 और कवरेज> = 3.6 की आवश्यकता है।

पहले सुनिश्चित करें कि आपने ऊपर सूचीबद्ध सभी निर्भरताएं स्थापित की हैं। तब आप कमांड प्रॉम्प्ट में निम्न कमांड चलाकर nilearn स्थापित कर सकते हैं:

pip install -U --user nilearn

आधिकारिक स्रोत कोड रेपो: https://github.com/nilearn/nilearn/

4) एनाकोंडा का उपयोग करना

एनाकोंडा में कई वैज्ञानिक अजगर पुस्तकालय आसानी से उपलब्ध हैं। आप यहां से इंस्टालेशन फाइल प्राप्त कर सकते हैं । एक तरफ, एनाकोंडा का उपयोग करते हुए, आप कई पैकेजों को स्थापित और कॉन्फ़िगर नहीं करते हैं, यह बीएसडी लाइसेंस प्राप्त है, और तुच्छ स्थापना प्रक्रिया है, पायथन 3 और पायथन 2 के लिए उपलब्ध है, जबकि दूसरी ओर, यह आपको कम लचीलापन देता है। एक उदाहरण के रूप में, कला के कुछ राज्य गहरी सीखने के अजगर पैकेज सुन्न के एक अलग संस्करण का उपयोग कर सकते हैं तब एनाकोंडा स्थापित किया गया था। हालांकि, इस नकारात्मक पक्ष को अलग से एक और अजगर स्थापना का उपयोग करके निपटा जा सकता है (उदाहरण के लिए लिनक्स और मैक आपके डिफ़ॉल्ट एक)।

एनाकोंडा सेटअप आपको स्थान चयन की स्थापना के लिए प्रेरित करता है और आपको पैथ अतिरिक्त विकल्प के लिए भी संकेत देता है। यदि आप अपने पेटा में एनाकोंडा जोड़ते हैं, तो यह उम्मीद की जाती है कि आपका ओएस एनाकोंडा पायथन को डिफ़ॉल्ट रूप में पाएगा। इसलिए, संशोधन और भविष्य की स्थापना केवल इस पायथन संस्करण के लिए उपलब्ध होगी।

यह स्पष्ट करने के लिए, एनाकोंडा की स्थापना के बाद और आप इसे PATH में जोड़ते हैं, यदि आप टाइप करते हैं तो Ubuntu 14.04 टर्मिनल के माध्यम से

python

टर्मिनल के माध्यम से एनाकोंडा पायथन

वोइला, एनाकोंडा पायथन आपका डिफ़ॉल्ट पायथन है, आप तुरंत कई पुस्तकालयों का उपयोग करके आनंद लेना शुरू कर सकते हैं। हालांकि, यदि आप अपने पुराने पायथन का उपयोग करना चाहते हैं

/usr/bin/python

टर्मिनल के माध्यम से डिफ़ॉल्ट पायथन

लंबी कहानी संक्षेप में, एनाकोंडा पायथन के साथ मशीन सीखने और डेटा विश्लेषण शुरू करने का सबसे तेज़ तरीका है।

स्थापना या सेटअप आर भाषा का उपयोग कर

संकुल आर-कार्य, डेटा और संकलित कोड को एक अच्छी तरह से परिभाषित प्रारूप में संग्रहित करते हैं। सार्वजनिक और (निजी) रिपॉजिटरी का उपयोग आर पैकेजों के संग्रह की मेजबानी के लिए किया जाता है। R संकुल का सबसे बड़ा संग्रह CRAN से उपलब्ध है। सबसे लोकप्रिय आर मशीन लर्निंग पैकेजों में से कुछ निम्नलिखित हैं:

1) समकक्ष

विवरण: वर्गीकरण, प्रतिगमन और अस्तित्व के पेड़ों के लिए पुनरावर्ती विभाजन। ब्रेमेन, फ्रीडमैन, ओल्सन और स्टोन की 1984 की किताब की अधिकांश कार्यक्षमता का कार्यान्वयन।

यह निम्नलिखित कोड का उपयोग कर सीआरएएन से स्थापित किया जा सकता है:

install.packages("rpart")

पैकेज लोड करें:

library(rpart)

आधिकारिक स्रोत: https://cran.r-project.org/web/packages/rpart/index.html


२) ई १० )१

विवरण: अव्यक्त वर्ग विश्लेषण के लिए कार्य, कम समय फूरियर रूपांतरण, फजी क्लस्टरिंग, वेक्टर मशीनों का समर्थन, कम से कम पथ गणना, बैगेड क्लस्टरिंग, भोले बेयस क्लासिफायर आदि।

CRAN से स्थापना:

install.packages("e1071")

पैकेज लोड हो रहा है:

library(e1071)

आधिकारिक स्रोत: https://cran.r-project.org/web/packages/e1071/index.html


3) यादृच्छिक

विवरण: यादृच्छिक आदानों का उपयोग कर पेड़ों के जंगल पर आधारित वर्गीकरण और प्रतिगमन।

CRAN से स्थापना:

install.packages("randomForest")

पैकेज लोड हो रहा है:

library(randomForest)

आधिकारिक स्रोत: https://cran.r-project.org/web/packages/randomForest/index.html


4) देखभाल

विवरण: वर्गीकरण और प्रतिगमन मॉडल के प्रशिक्षण और साजिश रचने के लिए विविध कार्य।

CRAN से स्थापना:

install.packages("caret")

पैकेज लोड हो रहा है:

library(caret)

आधिकारिक स्रोत: https://cran.r-project.org/web/packages/caret/index.html



Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow