R Language
प्रतिक्रमण आर
खोज…
परिचय
With रिप्रोड्यूसबिलिटी ’से हमारा तात्पर्य यह है कि आपके द्वारा किए गए चरणों को कोई दूसरा व्यक्ति (शायद भविष्य में आप) दोहरा सकता है और वही परिणाम प्राप्त कर सकता है। रिप्रोड्यूसबल रिसर्च टास्क देखें ।
टिप्पणियों
प्रतिलिपि प्रस्तुत करने योग्य परिणाम बनाने के लिए, परिवर्तन के सभी स्रोतों को ठीक करने की आवश्यकता है। उदाहरण के लिए, यदि एक (छद्म) यादृच्छिक संख्या जनरेटर का उपयोग किया जाता है, तो बीज को ठीक करने की आवश्यकता होती है यदि आप उसी परिणाम को फिर से बनाना चाहते हैं। भिन्नता को कम करने का दूसरा तरीका यह है कि एक ही दस्तावेज़ में पाठ और अभिकलन को मिलाएं।
संदर्भ
पेंग, आरडी (2011)। कम्प्यूटेशनल में Reproducible अनुसंधान। विज्ञान, 334 (6060), 1226-1227। http://doi.org/10.1126/science.1213847
पेंग, रोजर डी। आर। लीनपब, 2015 में डेटा साइंस के लिए रिपोर्ट लेखन। https://leanpub.com/reportwriting ।
डेटा प्रतिलिपि प्रस्तुत करने योग्यता
dput()
और dget()
एक आसान (साझा करने योग्य छोटा) डेटा फ़्रेम साझा करने का सबसे आसान तरीका एक बुनियादी फ़ंक्शन dput()
। यह एक सादे पाठ के रूप में एक आर वस्तु निर्यात करेगा।
नोट: नीचे उदाहरण डेटा बनाने से पहले, सुनिश्चित करें कि आप एक खाली फ़ोल्डर में हैं जिसे आप लिख सकते हैं। यदि आपको फ़ोल्डर बदलने की आवश्यकता है, तो getwd()
पढ़ें और ?setwd
।
dput(mtcars, file = 'df.txt')
फिर, कोई भी dget()
फ़ंक्शन का उपयोग करके अपने GlobalEnvironment को सटीक R ऑब्जेक्ट लोड कर सकता है।
df <- dget('df.txt')
बड़े आर ऑब्जेक्ट्स के लिए, उन्हें प्रतिलिपि प्रस्तुत करने योग्य तरीके से सहेजने के कई तरीके हैं। इनपुट और आउटपुट देखें।
पैकेज प्रतिलिपि प्रस्तुत करने योग्यता
पैकेज प्रतिलिपि प्रस्तुत करने योग्यता कुछ आर कोड को पुन: पेश करने में एक बहुत ही सामान्य मुद्दा है। जब विभिन्न पैकेज अपडेट हो जाते हैं, तो उनके बीच कुछ अंतर्संबंध टूट सकते हैं। समस्या का आदर्श समाधान आपके कंप्यूटर पर आर कोड लेखक की मशीन की छवि को पुन: प्रस्तुत करना है जब कोड लिखा गया था। और यहाँ checkpoint
पैकेज आता checkpoint
।
2014-09-17 से शुरू होकर, पैकेज के लेखक पूरे सीआरएएन पैकेज रिपॉजिटरी की दैनिक प्रतियां अपने स्वयं के दर्पण रिपॉजिटरी - माइक्रोसॉफ्ट आर आर्काइव्ड नेटवर्क से बनाते हैं। इसलिए, एक प्रतिलिपि प्रस्तुत करने योग्य आर परियोजना बनाते समय पैकेज प्रतिलिपि प्रस्तुत करने योग्य मुद्दों से बचने के लिए, आपको निम्नलिखित की आवश्यकता है:
- सुनिश्चित करें कि आपके सभी पैकेज (और R संस्करण) अद्यतित हैं।
- अपने कोड में
checkpoint::checkpoint('YYYY-MM-DD')
लाइन शामिल करें।
checkpoint
आपकी R_home निर्देशिका ( "~/"
) में एक निर्देशिका .checkpoint
बनाएगा। इस तकनीकी निर्देशिका के लिए यह सभी पैकेजों को स्थापित करेगा, जो आपके प्रोजेक्ट में उपयोग किए जाते हैं। इसका मतलब है कि, checkpoint
आपके प्रोजेक्ट डायरेक्टरी की सभी .R
फ़ाइलों के माध्यम से सभी library()
या require()
कॉल्स उठाता है और सभी आवश्यक पैकेजों को उस फॉर्म में स्थापित करता है, जो वे निर्धारित तिथि पर CRAN में मौजूद थे।
प्रो आप पैकेज reproducibility मुद्दे से मुक्त कर रहे हैं।
संपर्क प्रत्येक निर्दिष्ट तिथि के लिए आपको एक निश्चित परियोजना में उपयोग किए जाने वाले सभी पैकेजों को डाउनलोड और इंस्टॉल करना होगा जिन्हें आप पुन: पेश करना चाहते हैं। जिसमें काफी समय लग सकता है।