Поиск…


Создание tbl_df's

Tbl_df (произносится как tibble diff ) - это вариация кадра данных, который часто используется в tidyverse-пакетах. Он реализован в пакете тиблей .

Используйте функцию as_data_frame для преобразования фрейма данных в tbl_df:

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

Одним из наиболее заметных различий между data.frames и tbl_dfs является то, как они печатаются:

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • Печатный результат включает сводку размеров таблицы ( 32 x 11 )
  • Он включает в себя тип каждого столбца ( dbl )
  • Он печатает ограниченное количество строк. (Чтобы изменить options(tibble.print_max = [number]) использования options(tibble.print_max = [number]) ).

Многие функции в пакете dplyr работают с tbl_dfs, например group_by() .

tidyverse: обзор

Что такое tidyverse ?

tidyverse - быстрый и элегантный способ превратить базовый R в усовершенствованный инструмент, переработанный Hadley / Rstudio. Разработка всех пакетов, включенных в tidyverse соответствует основным правилам манифеста « tidyverse инструмент» . Но сначала пусть авторы описывают свой шедевр:

Tidyverse - это набор пакетов, которые работают в гармонии, потому что они имеют общие представления данных и дизайн API. Пакет tidyverse спроектирован так, чтобы упростить установку и загрузку пакетов ядра с tidyverse в одной команде.

Лучшее место, чтобы узнать обо всех пакетах в tidyverse и о том, как они подходят друг другу, - это R для Data Science. Ожидайте услышать больше о tidyverse в ближайшие месяцы, когда я работаю над улучшенными веб-сайтами пакетов, упрощая цитирование и предоставляя общий дом для обсуждения анализа данных с помощью tidyverse.

( источник ))

Как это использовать?

Просто с обычными пакетами R вам нужно установить и загрузить пакет.

install.package("tidyverse")
library("tidyverse")

Разница заключается в том, что по одной команде устанавливаются / загружаются несколько десятков пакетов. В качестве бонуса можно быть уверенным, что все установленные / загруженные пакеты совместимы.

Что это за пакеты?

Общеизвестные и широко используемые пакеты:

  • ggplot2 : расширенная визуализация данных SO_doc
  • dplyr : быстрый ( Rcpp ) и когерентный подход к манипулированию данными SO_doc
  • tidyr : инструменты для сбора данных SO_doc
  • readr : для импорта данных.
  • purrr : делает ваши чистые функции мурлыканными, завершая функциональные инструменты программирования R с важными функциями от других языков, в стиле JS-пакетов underscore.js, lodash и lazy.js.
  • tibble : современное переосмысление кадров данных.
  • magrittr : трубопровод, чтобы сделать код более читаемым. SO_doc

Пакеты для управления конкретными форматами данных:

  • hms : легко читается раз
  • stringr : обеспечить сплоченный набор функций, предназначенных для работы со строками так же просто, как возможно
  • lubridate : расширенные манипуляции с датами / времени SO_doc
  • forcats : передовая работа с факторами .

Импорт данных:

  • DBI : определяет общий интерфейс между R и системами управления базами данных (СУБД)
  • haven : легко импортировать файлы SPSS, SAS и Stata SO_doc
  • httr : целью httr является предоставление обертки для пакета curl, адаптированного к требованиям современных веб-API
  • jsonlite : быстрый анализатор JSON и генератор, оптимизированный для статистических данных и сети
  • readxl : файлы read.xls и .xlsx без пакетов зависимостей SO_doc
  • rvest : rvest поможет вам очистить информацию с веб-страниц SO_doc
  • xml2 : для XML

И моделирование:

  • modelr : предоставляет функции, которые помогут вам создавать элегантные конвейеры при моделировании
  • метла : легко извлекайте модели в аккуратные данные

Наконец, tidyverse предлагает использовать:

  • knitr : удивительный универсальный программный движок, с легким API, разработанным, чтобы дать пользователям полный контроль над выходом без тяжелой работы по кодированию. SO_docs: один , два
  • rmarkdown : пакет Rstudio для воспроизводимого программирования. SO_docs: один , два , три , четыре


Modified text is an extract of the original Stack Overflow Documentation
Лицензировано согласно CC BY-SA 3.0
Не связан с Stack Overflow