R Language
tidyverse
खोज…
Tbl_df का निर्माण
एक tbl_df (उच्चारित tibble diff ) एक डेटा फ्रेम का एक भिन्नरूप है जिसका उपयोग अक्सर tidyverse पैकेज में किया जाता है। यह टिबबल पैकेज में लागू किया गया है।
डेटा फ्रेम को tbl_df में बदलने के लिए as_data_frame
फ़ंक्शन का उपयोग करें:
library(tibble)
mtcars_tbl <- as_data_frame(mtcars)
Data.frames और tbl_dfs के बीच सबसे उल्लेखनीय अंतरों में से एक यह है कि वे कैसे प्रिंट करते हैं:
# A tibble: 32 x 11
mpg cyl disp hp drat wt qsec vs am gear carb
* <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
2 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
3 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
4 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
5 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
6 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
7 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
8 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
9 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
10 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
# ... with 22 more rows
- मुद्रित आउटपुट में तालिका के आयामों का सारांश शामिल है (
32 x 11
) - इसमें प्रत्येक कॉलम का प्रकार (
dbl
) शामिल है - यह सीमित पंक्तियों को प्रिंट करता है। (इस उपयोग
options(tibble.print_max = [number])
को बदलने के लिएoptions(tibble.print_max = [number])
)।
Dplyr पैकेज में कई कार्य tbl_dfs के साथ स्वाभाविक रूप से काम करते हैं, जैसे group_by()
।
tidyverse: एक सिंहावलोकन
tidyverse
क्या है?
tidyverse
हैडली / Rstudio द्वारा पुन: डिज़ाइन किए गए बुनियादी R
को एक उन्नत टूल में बदलने का सबसे तेज़ और सुरुचिपूर्ण तरीका है। tidyverse
में शामिल सभी पैकेजों का विकास tidyverse
टूल्स मेनिफेस्टो के सिद्धांत नियमों का पालन करता है। लेकिन पहले, लेखकों को उनकी उत्कृष्ट कृति का वर्णन करने दें:
Tidyverse संकुल का एक सेट है जो सामंजस्य में काम करता है क्योंकि वे सामान्य डेटा अभ्यावेदन और API डिज़ाइन साझा करते हैं। Tidyverse पैकेज को एक ही कमांड में tidyverse से कोर पैकेजों को स्थापित करने और लोड करने में आसान बनाने के लिए डिज़ाइन किया गया है।
Tidyverse के सभी पैकेजों के बारे में जानने के लिए सबसे अच्छी जगह और वे एक साथ कैसे फिट होते हैं, यह डेटा साइंस के लिए R है। आने वाले महीनों में tidyverse के बारे में अधिक सुनने की उम्मीद है क्योंकि मैं बेहतर पैकेज वेबसाइटों पर काम करता हूं, उद्धरण को आसान बनाता हूं, और tidyverse के साथ डेटा विश्लेषण के बारे में चर्चा के लिए एक आम घर प्रदान करता हूं।
( स्रोत ))
इसका इस्तेमाल कैसे करें?
बस साधारण R
पैकेज के साथ, आपको पैकेज को स्थापित करने और लोड करने की आवश्यकता है।
install.package("tidyverse")
library("tidyverse")
अंतर यह है, एक ही आदेश पर दर्जनों पैकेजों के एक जोड़े को स्थापित / लोड किया जाता है। एक बोनस के रूप में, एक आश्वस्त हो सकता है कि सभी स्थापित / लोड पैकेज संगत संस्करणों के हैं।
वे पैकेज कौन से हैं?
आमतौर पर ज्ञात और व्यापक रूप से उपयोग किए जाने वाले पैकेज:
- ggplot2 : उन्नत डेटा विज़ुअलाइज़ेशन SO_doc
- dplyr : तेज ( Rcpp ) और डेटा हेरफेर SO_doc के सुसंगत दृष्टिकोण
- tidyr : डेटा के लिए उपकरण SO_doc को tidying
- readr : डेटा आयात के लिए।
- purrr : जेएस संकुल underscore.js, लॉश और lazy.js. की शैली में अन्य भाषाओं की महत्वपूर्ण विशेषताओं के साथ R के कार्यात्मक प्रोग्रामिंग टूल्स को पूरा करके आपके शुद्ध कार्यों को सुरीला बना देता है।
- टिबबल : डेटा फ़्रेमों की एक आधुनिक पुन: कल्पना।
- magrittr : कोड को अधिक पठनीय SO_doc बनाने के लिए पाइपिंग
विशिष्ट डेटा स्वरूपों में हेरफेर करने के लिए पैकेज:
- hms : आसानी से बार पढ़ते हैं
- स्ट्रिंग : उपलब्ध के रूप में आसानी से तार के साथ काम करने के लिए डिज़ाइन किए गए कार्यों का एक सुसंगत सेट प्रदान करते हैं
- lubridate : उन्नत दिनांक / बार जोड़तोड़ SO_doc
- forcats : कारकों के साथ उन्नत कार्य।
डेटा आयात:
- DBI : R और डेटाबेस प्रबंधन प्रणालियों (DBMS) के बीच एक सामान्य इंटरफ़ेस को परिभाषित करता है
- हेवन : आसानी से एसपीएसएस , एसएएस और स्टाटा फाइल SO_doc आयात करते हैं
- कैंटर : कैंटर का उद्देश्य कर्ल पैकेज के लिए एक आवरण प्रदान करना है, जिसे आधुनिक वेब एपीआई की मांगों के अनुरूप बनाया गया है
- jsonlite : सांख्यिकीय डेटा और वेब के लिए अनुकूलित एक तेज JSON पार्सर और जनरेटर
- readxl : read.xls और .xlsx फाइलें निर्भरता पैकेज SO_doc की आवश्यकता के बिना
- rvest : rvest आपको वेब पेज SO_doc से जानकारी खंगालने में मदद करता है
- xml2 : XML के लिए
और मॉडलिंग:
- मॉडलर : ऐसे कार्य प्रदान करता है जो मॉडलिंग करते समय आपको सुरुचिपूर्ण पाइपलाइन बनाने में मदद करते हैं
- झाड़ू : आसानी से मॉडल को साफ आंकड़ों में निकालते हैं
अंत में, tidyverse
का उपयोग करने का सुझाव देते हैं:
- knitr : लाइटवेट एपीआई के डिज़ाइन के साथ अद्भुत सामान्य-उद्देश्य साक्षर प्रोग्रामिंग इंजन, उपयोगकर्ताओं को भारी कोडिंग कार्य के बिना आउटपुट का पूर्ण नियंत्रण देने के लिए डिज़ाइन किया गया है। SO_docs: एक , दो
- rmarkdown : प्रतिलिपि प्रस्तुत करने योग्य प्रोग्रामिंग के लिए Rstudio का पैकेज। SO_docs: एक , दो , तीन , चार