खोज…


परिचय

With रिप्रोड्यूसबिलिटी ’से हमारा तात्पर्य यह है कि आपके द्वारा किए गए चरणों को कोई दूसरा व्यक्ति (शायद भविष्य में आप) दोहरा सकता है और वही परिणाम प्राप्त कर सकता है। रिप्रोड्यूसबल रिसर्च टास्क देखें

टिप्पणियों

प्रतिलिपि प्रस्तुत करने योग्य परिणाम बनाने के लिए, परिवर्तन के सभी स्रोतों को ठीक करने की आवश्यकता है। उदाहरण के लिए, यदि एक (छद्म) यादृच्छिक संख्या जनरेटर का उपयोग किया जाता है, तो बीज को ठीक करने की आवश्यकता होती है यदि आप उसी परिणाम को फिर से बनाना चाहते हैं। भिन्नता को कम करने का दूसरा तरीका यह है कि एक ही दस्तावेज़ में पाठ और अभिकलन को मिलाएं।

संदर्भ

  • पेंग, आरडी (2011)। कम्प्यूटेशनल में Reproducible अनुसंधान। विज्ञान, 334 (6060), 1226-1227। http://doi.org/10.1126/science.1213847

  • पेंग, रोजर डी। आर। लीनपब, 2015 में डेटा साइंस के लिए रिपोर्ट लेखन। https://leanpub.com/reportwriting

डेटा प्रतिलिपि प्रस्तुत करने योग्यता

dput() और dget()

एक आसान (साझा करने योग्य छोटा) डेटा फ़्रेम साझा करने का सबसे आसान तरीका एक बुनियादी फ़ंक्शन dput() । यह एक सादे पाठ के रूप में एक आर वस्तु निर्यात करेगा।

नोट: नीचे उदाहरण डेटा बनाने से पहले, सुनिश्चित करें कि आप एक खाली फ़ोल्डर में हैं जिसे आप लिख सकते हैं। यदि आपको फ़ोल्डर बदलने की आवश्यकता है, तो getwd() पढ़ें और ?setwd

dput(mtcars, file = 'df.txt')

फिर, कोई भी dget() फ़ंक्शन का उपयोग करके अपने GlobalEnvironment को सटीक R ऑब्जेक्ट लोड कर सकता है।

df <- dget('df.txt')

बड़े आर ऑब्जेक्ट्स के लिए, उन्हें प्रतिलिपि प्रस्तुत करने योग्य तरीके से सहेजने के कई तरीके हैं। इनपुट और आउटपुट देखें।

पैकेज प्रतिलिपि प्रस्तुत करने योग्यता

पैकेज प्रतिलिपि प्रस्तुत करने योग्यता कुछ आर कोड को पुन: पेश करने में एक बहुत ही सामान्य मुद्दा है। जब विभिन्न पैकेज अपडेट हो जाते हैं, तो उनके बीच कुछ अंतर्संबंध टूट सकते हैं। समस्या का आदर्श समाधान आपके कंप्यूटर पर आर कोड लेखक की मशीन की छवि को पुन: प्रस्तुत करना है जब कोड लिखा गया था। और यहाँ checkpoint पैकेज आता checkpoint

2014-09-17 से शुरू होकर, पैकेज के लेखक पूरे सीआरएएन पैकेज रिपॉजिटरी की दैनिक प्रतियां अपने स्वयं के दर्पण रिपॉजिटरी - माइक्रोसॉफ्ट आर आर्काइव्ड नेटवर्क से बनाते हैं। इसलिए, एक प्रतिलिपि प्रस्तुत करने योग्य आर परियोजना बनाते समय पैकेज प्रतिलिपि प्रस्तुत करने योग्य मुद्दों से बचने के लिए, आपको निम्नलिखित की आवश्यकता है:

  1. सुनिश्चित करें कि आपके सभी पैकेज (और R संस्करण) अद्यतित हैं।
  2. अपने कोड में checkpoint::checkpoint('YYYY-MM-DD') लाइन शामिल करें।

checkpoint आपकी R_home निर्देशिका ( "~/" ) में एक निर्देशिका .checkpoint बनाएगा। इस तकनीकी निर्देशिका के लिए यह सभी पैकेजों को स्थापित करेगा, जो आपके प्रोजेक्ट में उपयोग किए जाते हैं। इसका मतलब है कि, checkpoint आपके प्रोजेक्ट डायरेक्टरी की सभी .R फ़ाइलों के माध्यम से सभी library() या require() कॉल्स उठाता है और सभी आवश्यक पैकेजों को उस फॉर्म में स्थापित करता है, जो वे निर्धारित तिथि पर CRAN में मौजूद थे।

प्रो आप पैकेज reproducibility मुद्दे से मुक्त कर रहे हैं।
संपर्क प्रत्येक निर्दिष्ट तिथि के लिए आपको एक निश्चित परियोजना में उपयोग किए जाने वाले सभी पैकेजों को डाउनलोड और इंस्टॉल करना होगा जिन्हें आप पुन: पेश करना चाहते हैं। जिसमें काफी समय लग सकता है।



Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow