Szukaj…


Tworzenie pliku tbl_df

Tbl_df (wymawiane tibble diff ) to odmiana ramki danych, która jest często używana w pakietach Tidyverse. Jest zaimplementowany w pakiecie tibble .

Użyj funkcji as_data_frame aby przekształcić ramkę danych w plik tbl_df:

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

Jedną z najbardziej zauważalnych różnic między data.frames i tbl_dfs jest sposób ich drukowania:

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • Wydruk zawiera podsumowanie wymiarów stołu ( 32 x 11 )
  • Zawiera typ każdej kolumny ( dbl )
  • Drukuje ograniczoną liczbę wierszy. (Aby zmienić tę options(tibble.print_max = [number]) użyj options(tibble.print_max = [number]) ).

Wiele funkcji w pakiecie dplyr działa naturalnie z tbl_dfs, takich jak group_by() .

tidyverse: przegląd

Co to jest tidyverse ?

tidyverse to szybki i elegancki sposób na przekształcenie podstawowego R w ulepszone narzędzie, przeprojektowane przez Hadley / Rstudio. Opracowanie wszystkich pakietów zawartych w tidyverse zgodne z podstawowymi zasadami manifestu „Narzędzia tidyverse . Ale najpierw pozwól autorom opisać swoje arcydzieło:

Tidyverse to zestaw pakietów, które działają w harmonii, ponieważ mają wspólne reprezentacje danych i projekt interfejsu API. Pakiet tidyverse został zaprojektowany tak, aby ułatwić instalację i ładowanie podstawowych pakietów z tidyverse za pomocą jednego polecenia.

Najlepszym miejscem do zapoznania się ze wszystkimi pakietami w tidyverse i ich wzajemnym dopasowaniem jest R for Data Science. Spodziewam się usłyszeć więcej o tidyverse w nadchodzących miesiącach, gdy pracuję nad ulepszonymi stronami pakietów, ułatwiając cytowanie i zapewniając wspólny dom do dyskusji o analizie danych z tidyverse.

( źródło ))

Jak tego użyć?

Tylko ze zwykłymi pakietami R musisz zainstalować i załadować pakiet.

install.package("tidyverse")
library("tidyverse")

Różnica polega na tym, że na jedno polecenie instaluje się / ładuje kilkadziesiąt pakietów. Jako bonus można mieć pewność, że wszystkie zainstalowane / załadowane pakiety są zgodnych wersji.

Co to za paczki?

Powszechnie znane i szeroko stosowane pakiety:

  • ggplot2 : zaawansowana wizualizacja danych SO_doc
  • dplyr : szybkie ( Rcpp ) i spójne podejście do manipulacji danymi SO_doc
  • tidyr : narzędzia do porządkowania danych SO_doc
  • readr : do importu danych.
  • purrr : zamienia twoje czyste funkcje w mruczące, wypełniając funkcjonalne narzędzia programistyczne R z ważnymi funkcjami z innych języków, w stylu pakietów JS underscore.js, lodash i lazy.js.
  • tibble : nowoczesne ponowne wyobrażanie sobie ramek danych.
  • magrittr : piping, aby kod był bardziej czytelny SO_doc

Pakiety do manipulowania określonymi formatami danych:

  • hms : łatwo odczytać czasy
  • stringr : zapewnia spójny zestaw funkcji zaprojektowanych tak, aby praca z łańcuchami była jak najłatwiejsza
  • lubridate : zaawansowane manipulacje datą / czasem SO_doc
  • forcats : zaawansowana praca z czynnikami .

Import danych:

  • DBI : definiuje wspólny interfejs między R a systemami zarządzania bazami danych (DBMS)
  • raj : łatwo importuj pliki SPSS, SAS i Stata SO_doc
  • httr : celem httr jest zapewnienie opakowania na pakiet curl, dostosowanego do wymagań współczesnych internetowych interfejsów API
  • jsonlite : szybki parser i generator JSON zoptymalizowany pod kątem danych statystycznych i Internetu
  • readxl : pliki read.xls i .xlsx bez potrzeby pakietów zależności SO_doc
  • rvest : rvest pomaga zeskrobywać informacje ze stron internetowych SO_doc
  • xml2 : dla XML

I modelowanie:

  • modelr : udostępnia funkcje, które pomagają tworzyć eleganckie potoki podczas modelowania
  • miotła : łatwo wyodrębnij modele w uporządkowane dane

Wreszcie tidyverse sugeruje użycie:

  • knitr : niesamowity uniwersalny silnik programistyczny z lekkimi interfejsami API zaprojektowanymi tak, aby zapewnić użytkownikom pełną kontrolę nad wyjściem bez ciężkiego kodowania. SO_docs: jeden , dwa
  • rmarkdown : pakiet Rstudio do powtarzalnego programowania. SO_docs: jeden , dwa , trzy , cztery


Modified text is an extract of the original Stack Overflow Documentation
Licencjonowany na podstawie CC BY-SA 3.0
Nie związany z Stack Overflow