खोज…


Tbl_df का निर्माण

एक tbl_df (उच्चारित tibble diff ) एक डेटा फ्रेम का एक भिन्नरूप है जिसका उपयोग अक्सर tidyverse पैकेज में किया जाता है। यह टिबबल पैकेज में लागू किया गया है।

डेटा फ्रेम को tbl_df में बदलने के लिए as_data_frame फ़ंक्शन का उपयोग करें:

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

Data.frames और tbl_dfs के बीच सबसे उल्लेखनीय अंतरों में से एक यह है कि वे कैसे प्रिंट करते हैं:

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • मुद्रित आउटपुट में तालिका के आयामों का सारांश शामिल है ( 32 x 11 )
  • इसमें प्रत्येक कॉलम का प्रकार ( dbl ) शामिल है
  • यह सीमित पंक्तियों को प्रिंट करता है। (इस उपयोग options(tibble.print_max = [number]) को बदलने के लिए options(tibble.print_max = [number]) )।

Dplyr पैकेज में कई कार्य tbl_dfs के साथ स्वाभाविक रूप से काम करते हैं, जैसे group_by()

tidyverse: एक सिंहावलोकन

tidyverse क्या है?

tidyverse हैडली / Rstudio द्वारा पुन: डिज़ाइन किए गए बुनियादी R को एक उन्नत टूल में बदलने का सबसे तेज़ और सुरुचिपूर्ण तरीका है। tidyverse में शामिल सभी पैकेजों का विकास tidyverse टूल्स मेनिफेस्टो के सिद्धांत नियमों का पालन करता है। लेकिन पहले, लेखकों को उनकी उत्कृष्ट कृति का वर्णन करने दें:

Tidyverse संकुल का एक सेट है जो सामंजस्य में काम करता है क्योंकि वे सामान्य डेटा अभ्यावेदन और API डिज़ाइन साझा करते हैं। Tidyverse पैकेज को एक ही कमांड में tidyverse से कोर पैकेजों को स्थापित करने और लोड करने में आसान बनाने के लिए डिज़ाइन किया गया है।

Tidyverse के सभी पैकेजों के बारे में जानने के लिए सबसे अच्छी जगह और वे एक साथ कैसे फिट होते हैं, यह डेटा साइंस के लिए R है। आने वाले महीनों में tidyverse के बारे में अधिक सुनने की उम्मीद है क्योंकि मैं बेहतर पैकेज वेबसाइटों पर काम करता हूं, उद्धरण को आसान बनाता हूं, और tidyverse के साथ डेटा विश्लेषण के बारे में चर्चा के लिए एक आम घर प्रदान करता हूं।

( स्रोत ))

इसका इस्तेमाल कैसे करें?

बस साधारण R पैकेज के साथ, आपको पैकेज को स्थापित करने और लोड करने की आवश्यकता है।

install.package("tidyverse")
library("tidyverse")

अंतर यह है, एक ही आदेश पर दर्जनों पैकेजों के एक जोड़े को स्थापित / लोड किया जाता है। एक बोनस के रूप में, एक आश्वस्त हो सकता है कि सभी स्थापित / लोड पैकेज संगत संस्करणों के हैं।

वे पैकेज कौन से हैं?

आमतौर पर ज्ञात और व्यापक रूप से उपयोग किए जाने वाले पैकेज:

  • ggplot2 : उन्नत डेटा विज़ुअलाइज़ेशन SO_doc
  • dplyr : तेज ( Rcpp ) और डेटा हेरफेर SO_doc के सुसंगत दृष्टिकोण
  • tidyr : डेटा के लिए उपकरण SO_doc को tidying
  • readr : डेटा आयात के लिए।
  • purrr : जेएस संकुल underscore.js, लॉश और lazy.js. की शैली में अन्य भाषाओं की महत्वपूर्ण विशेषताओं के साथ R के कार्यात्मक प्रोग्रामिंग टूल्स को पूरा करके आपके शुद्ध कार्यों को सुरीला बना देता है।
  • टिबबल : डेटा फ़्रेमों की एक आधुनिक पुन: कल्पना।
  • magrittr : कोड को अधिक पठनीय SO_doc बनाने के लिए पाइपिंग

विशिष्ट डेटा स्वरूपों में हेरफेर करने के लिए पैकेज:

  • hms : आसानी से बार पढ़ते हैं
  • स्ट्रिंग : उपलब्ध के रूप में आसानी से तार के साथ काम करने के लिए डिज़ाइन किए गए कार्यों का एक सुसंगत सेट प्रदान करते हैं
  • lubridate : उन्नत दिनांक / बार जोड़तोड़ SO_doc
  • forcats : कारकों के साथ उन्नत कार्य।

डेटा आयात:

  • DBI : R और डेटाबेस प्रबंधन प्रणालियों (DBMS) के बीच एक सामान्य इंटरफ़ेस को परिभाषित करता है
  • हेवन : आसानी से एसपीएसएस , एसएएस और स्टाटा फाइल SO_doc आयात करते हैं
  • कैंटर : कैंटर का उद्देश्य कर्ल पैकेज के लिए एक आवरण प्रदान करना है, जिसे आधुनिक वेब एपीआई की मांगों के अनुरूप बनाया गया है
  • jsonlite : सांख्यिकीय डेटा और वेब के लिए अनुकूलित एक तेज JSON पार्सर और जनरेटर
  • readxl : read.xls और .xlsx फाइलें निर्भरता पैकेज SO_doc की आवश्यकता के बिना
  • rvest : rvest आपको वेब पेज SO_doc से जानकारी खंगालने में मदद करता है
  • xml2 : XML के लिए

और मॉडलिंग:

  • मॉडलर : ऐसे कार्य प्रदान करता है जो मॉडलिंग करते समय आपको सुरुचिपूर्ण पाइपलाइन बनाने में मदद करते हैं
  • झाड़ू : आसानी से मॉडल को साफ आंकड़ों में निकालते हैं

अंत में, tidyverse का उपयोग करने का सुझाव देते हैं:

  • knitr : लाइटवेट एपीआई के डिज़ाइन के साथ अद्भुत सामान्य-उद्देश्य साक्षर प्रोग्रामिंग इंजन, उपयोगकर्ताओं को भारी कोडिंग कार्य के बिना आउटपुट का पूर्ण नियंत्रण देने के लिए डिज़ाइन किया गया है। SO_docs: एक , दो
  • rmarkdown : प्रतिलिपि प्रस्तुत करने योग्य प्रोग्रामिंग के लिए Rstudio का पैकेज। SO_docs: एक , दो , तीन , चार


Modified text is an extract of the original Stack Overflow Documentation
के तहत लाइसेंस प्राप्त है CC BY-SA 3.0
से संबद्ध नहीं है Stack Overflow