Suche…


Tbl_df erstellen

A tbl_df (ausgesprochen Tibble diff) ist eine Variation eines Datenrahmens , der oft in tidyverse Paketen verwendet wird. Es ist im tibble- Paket implementiert.

Verwenden Sie die Funktion as_data_frame , um einen Datenrahmen in eine Tbl_df-Datei umzuwandeln:

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

Einer der bemerkenswertesten Unterschiede zwischen data.frames und tbl_dfs ist, wie sie gedruckt werden:

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • Die gedruckte Ausgabe enthält eine Zusammenfassung der Abmessungen der Tabelle ( 32 x 11 ).
  • Es beinhaltet den Typ jeder Spalte ( dbl )
  • Es gibt eine begrenzte Anzahl von Zeilen aus. (Um dies zu ändern, verwenden Sie options(tibble.print_max = [number]) ).

Viele Funktionen im dplyr-Paket funktionieren natürlich mit tbl_dfs, wie beispielsweise group_by() .

Tidyverse: eine Übersicht

Was ist tidyverse ?

tidyverse ist der schnelle und elegante Weg, um aus Basic R ein verbessertes Werkzeug zu machen, das von Hadley / Rstudio neu gestaltet wurde. Die Entwicklung aller in tidyverse enthaltenen tidyverse folgt den Grundregeln des Manifestes von The tidy tools . Aber lassen Sie die Autoren zuerst ihr Meisterwerk beschreiben:

Tidyverse besteht aus einer Reihe von Paketen, die in Harmonie arbeiten, da sie gemeinsame Datenrepräsentationen und API-Design verwenden. Das Paket tidyverse ist so konzipiert, dass es einfach ist, Core-Pakete mit einem einzigen Befehl von tidyverse zu installieren und zu laden.

Der beste Ort, um mehr über die Pakete in Ordnung zu erfahren, und wie sie zusammenpassen, ist R for Data Science. Erwarten Sie in den kommenden Monaten mehr über die Ordnung in Ordnung, während ich an verbesserten Paket-Websites arbeite, die Zitierweise vereinfachen und ein gemeinsames Zuhause für Diskussionen über die Datenanalyse mit der Ordnung bereitstellen.

( Quelle ))

Wie benutze ich es?

Nur bei den normalen R Paketen müssen Sie das Paket installieren und laden.

install.package("tidyverse")
library("tidyverse")

Der Unterschied besteht darin, dass mit einem einzigen Befehl mehrere Dutzend Pakete installiert / geladen werden. Als Bonus kann man sich darauf verlassen, dass alle installierten / geladenen Pakete kompatible Versionen haben.

Was sind das für Pakete?

Die allgemein bekannten und weit verbreiteten Pakete:

  • ggplot2 : erweiterte Datenvisualisierung SO_doc
  • dplyr : schneller ( Rcpp ) und kohärenter Ansatz zur Datenmanipulation SO_doc
  • tidyr : Werkzeuge zur Datenaufbereitung von SO_doc
  • readr : für den Datenimport.
  • purrr : lässt Ihre reinen Funktionen schnurren, indem Sie die funktionalen Programmierwerkzeuge von R mit wichtigen Funktionen aus anderen Sprachen im Stil der JS-Pakete underscore.js, lodash und lazy.js.
  • tibble : eine moderne umgestaltung von datenrahmen .
  • magrittr : piping , um Code lesbarer zu machen SO_doc

Pakete zur Bearbeitung bestimmter Datenformate:

  • hms : einfach mal ablesen
  • stringr : Bietet einen zusammenhängenden Satz von Funktionen, der das Arbeiten mit Strings so einfach wie möglich macht
  • lubridate : erweiterte Datums- / Zeitmanipulationen SO_doc
  • forcats : Fortgeschrittene Arbeit mit Faktoren .

Datenimport:

  • DBI : Definiert eine gemeinsame Schnittstelle zwischen R und Datenbankverwaltungssystemen (DBMS).
  • Port : SPSS- , SAS- und Stata-Dateien SO_doc können problemlos importiert werden
  • httr : Das Ziel von httr ist es, einen Wrapper für das curl-Paket bereitzustellen, der an die Anforderungen moderner Web-APIs angepasst ist
  • jsonlite : ein schneller JSON-Parser und Generator, der für statistische Daten und das Web optimiert ist
  • readxl : read.xls- und .xlsx-Dateien, ohne dass die Abhängigkeitspakete SO_doc erforderlich sind
  • rvest : rvest hilft Ihnen, Informationen von den Webseiten SO_doc abzurufen
  • xml2 : für XML

Und modellieren:

  • modelr : bietet Funktionen, mit denen Sie beim Modellieren elegante Pipelines erstellen können
  • Besen : Einfach die Modelle in ordentliche Daten extrahieren

Schließlich tidyverse die Verwendung von:

  • knitr : Die erstaunliche universelle Programmier-Engine für allgemeine Kenntnisse mit leichtgewichtigen APIs, die Benutzern die volle Kontrolle über die Ausgabe ohne umfangreiche Codierungsarbeit ermöglichen. SO_docs: eins , zwei
  • rmarkdown : Rstudio-Paket für reproduzierbare Programmierung. SO_docs: eins , zwei , drei , vier


Modified text is an extract of the original Stack Overflow Documentation
Lizenziert unter CC BY-SA 3.0
Nicht angeschlossen an Stack Overflow