data.table ट्यूटोरियल
Data.table से आरंभ करना
खोज…
टिप्पणियों
Data.table R सांख्यिकीय कंप्यूटिंग वातावरण के लिए एक पैकेज है। यह बेस आर से डेटा फ्रेम की कार्यक्षमता का विस्तार करता है, विशेष रूप से उनके प्रदर्शन और वाक्यविन्यास में सुधार। रोलिंग और नॉन-इक्वि जॉइन सहित कई संबंधित कार्यों को DT[where, select|update|do, by]
जैसे एक सुसंगत संक्षिप्त वाक्य-विन्यास में संभाला जाता है, DT[where, select|update|do, by]
। DT[where, select|update|do, by]
।
पैकेज में कई पूरक कार्य भी शामिल हैं:
- I / O:
fread
/fwrite
- Reshaping:
melt
/dcast
/rbindlist
/split
- मूल्यों की
rleid
:rleid
संस्करण
संस्करण | टिप्पणियाँ | CRAN पर रिलीज़ की तारीख |
---|---|---|
1.9.4 | 2014-10-02 | |
1.9.6 | 2015/09/19 | |
1.9.8 | 2016/11/24 | |
1.10.0 | "दृष्टिहीनता के साथ, अंतिम रिलीज़ v1.9.8 को v1.10.0 नाम दिया जाना चाहिए था" | 2016/12/03 |
1.10.1 | विकास में | 2016/12/03 |
स्थापना और सेटअप
CRAN से स्थिर रिलीज़ स्थापित करें:
install.packages("data.table")
या जीथब से विकास संस्करण:
install.packages("data.table", type = "source",
repos = "http://Rdatatable.github.io/data.table")
क्रावन से CRAN तक वापस जाने के लिए, वर्तमान संस्करण को पहले हटाया जाना चाहिए:
remove.packages("data.table")
install.packages("data.table")
पूर्ण इंस्टॉलेशन निर्देशों और नवीनतम संस्करण संख्याओं के लिए वेबसाइट पर जाएं ।
पैकेज का उपयोग करना
आमतौर पर आप पैकेज और उसके सभी कार्यों को एक लाइन के साथ लोड करना चाहेंगे
library(data.table)
यदि आपको केवल एक या दो फ़ंक्शन की आवश्यकता है, तो आप उन्हें data.table::fread
तरह संदर्भित कर सकते हैं। इसके बजाय data.table::fread
।
आरंभ करना और सहायता प्राप्त करना
पैकेज की आधिकारिक विकी में कुछ आवश्यक सामग्रियां हैं:
एक नए उपयोगकर्ता के रूप में, आप विगनेट्स, एफएक्यू और चीट शीट की जांच करना चाहेंगे।
एक सवाल पूछने से पहले - यहाँ StackOverflow पर या कहीं और - कृपया समर्थन पृष्ठ पढ़ें।
व्यक्तिगत कार्यों में मदद के लिए, वाक्यविन्यास help("fread")
या ?fread
। यदि पैकेज लोड नहीं किया गया है, तो पूरा नाम उपयोग करें ?data.table::fread
।
सिंटेक्स और विशेषताएं
मूल वाक्य रचना
DT[where, select|update|do, by]
सिंटैक्स का उपयोग डेटा के कॉलम के साथ काम करने के लिए किया जाता है।
- "जहां" भाग
i
तर्क है - "सेलेक्ट | अपडेट | डू" पार्ट
j
तर्क है
इन दो तर्कों को आमतौर पर नाम के बजाय स्थिति से पारित किया जाता है।
चरणों का एक क्रम DT[...][...]
तरह जंजीर किया जा सकता है DT[...][...]
।
DT[...]
अंदर शॉर्टकट, विशेष कार्य और विशेष प्रतीक DT[...]
कार्य या प्रतीक | टिप्पणियाँ |
---|---|
.() | कई तर्कों में, list() जगह list() |
J() | में i , की जगह list() |
:= | j , एक फ़ंक्शन जो कॉलम जोड़ने या संशोधित करने के लिए उपयोग किया जाता है |
.N | i , पंक्तियों की कुल संख्या j , समूह में पंक्तियों की संख्या |
.I | in j , तालिका में पंक्ति संख्याओं का वेक्टर ( i द्वारा फ़िल्टर्ड) |
.SD | j , डेटा का वर्तमान सबसेट .SDcols तर्क द्वारा चयनित |
.GRP | j , डेटा के सबसेट का वर्तमान सूचकांक |
.BY | j , डेटा के वर्तमान सबसेट के लिए मूल्यों की सूची |
V1, V2, ... | j में निर्मित अनाम स्तंभों के लिए डिफ़ॉल्ट नाम |
DT[...]
अंदर शामिल DT[...]
नोटेशन | टिप्पणियाँ |
---|---|
DT1[DT2, on, j] | दो तालिकाओं में शामिल हों |
i.* | शामिल होने के बाद DT2 के कॉलम पर विशेष उपसर्ग |
by=.EACHI | केवल एक विकल्प के साथ उपलब्ध विशेष विकल्प |
DT1[!DT2, on, j] | विरोधी दो तालिकाओं में शामिल हों |
DT1[DT2, on, roll, j] | on= में अंतिम कॉलम पर रोल करते हुए दो टेबल से जुड़ें |
रेज़ैपिंग, स्टैकिंग और विभाजन
नोटेशन | टिप्पणियाँ |
---|---|
melt(DT, id.vars, measure.vars) | लंबे प्रारूप में बदलना कई स्तंभों के लिए, measure.vars = patterns(...) उपयोग करें। measure.vars = patterns(...) |
dcast(DT, formula) | विस्तृत प्रारूप में बदलना |
rbind(DT1, DT2, ...) | स्टैक enumerated data.tables |
rbindlist(DT_list, idcol) | data.tables की एक सूची स्टैक करें |
split(DT, by) | एक सूची में एक data.table विभाजित करें |
Data.tables के लिए विशेष कुछ अन्य कार्य
समारोह (रों) | टिप्पणियाँ |
---|---|
foverlaps | ओवरलैप जुड़ता है |
merge | दो तालिकाओं के जुड़ने का दूसरा तरीका |
set | कॉलम जोड़ने या संशोधित करने का दूसरा तरीका |
fintersect , fsetdiff , funion , fsetequal , unique , duplicated , anyDuplicated | तत्वों के रूप में पंक्तियों के साथ सेट-थ्योरी संचालन |
CJ | वैक्टर के कार्टेशियन उत्पाद |
uniqueN | अलग-अलग पंक्तियों की संख्या |
rowidv(DT, cols) | कर्नलों द्वारा निर्धारित प्रत्येक समूह के भीतर पंक्ति ID (1 .N) |
rleidv(DT, cols) | कोल के रनों द्वारा निर्धारित प्रत्येक समूह के भीतर समूह आईडी (1 से .GRP) |
shift(DT, n) | हर कॉलम के लिए एक शिफ्ट ऑपरेटर लागू करें |
setorder , setcolorder , setnames , setkey , setindex , setattr | संदर्भ द्वारा विशेषताओं और आदेश को संशोधित करें |
पैकेज की अन्य विशेषताएं
विशेषताएं | टिप्पणियाँ |
---|---|
IDate और ITime | पूर्णांक दिनांक और समय |