수색…


tbl_df 만들기

tbl_df ( tibble diff라고도 함 )는 깔끔한 패키지에서 자주 사용되는 데이터 프레임 의 변형입니다. 그것은 tibble 패키지로 구현됩니다.

as_data_frame 함수를 사용하여 데이터 프레임을 tbl_df로 바꿉니다.

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

data.frames와 tbl_dfs의 가장 두드러진 차이점 중 하나는 다음과 같습니다.

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • 인쇄 된 출력에는 표의 크기 요약 ( 32 x 11 )
  • 여기에는 각 열의 유형 ( dbl )
  • 제한된 수의 행을 인쇄합니다. (이 사용 options(tibble.print_max = [number]) 을 변경하려면 options(tibble.print_max = [number]) ).

dplyr 패키지의 많은 함수는 group_by() 와 같은 tbl_dfs로 자연스럽게 작동합니다.

정리 : 개요

tidyverse 란 무엇입니까?

tidyverse 는 기본 R 을 Hadley / Rstudio가 재 설계 한 향상된 도구로 바꾸는 빠르고 우아한 방법입니다. tidyverse 포함 된 모든 패키지의 개발은 깔끔한 도구 선언문 의 원칙적 규칙을 따릅니다. 그러나 먼저 저자들이 그들의 걸작을 묘사하게하십시오.

tidyverse는 일반적인 데이터 표현과 API 디자인을 공유하기 때문에 조화롭게 작동하는 패키지 세트입니다. tidyverse 패키지는 하나의 명령으로 띠 반달로부터 코어 패키지를 쉽게 설치하고로드 할 수 있도록 설계되었습니다.

tidyverse의 모든 패키지에 대해 배우고 그것들이 어떻게 맞는지 가장 좋은 곳은 R for Data Science입니다. 개선 된 패키지 웹 사이트를 작성하고 인용문을 더 쉽게 작성하고 tidyverse를 사용하여 데이터 분석에 대한 토론을위한 공통의 고향을 제공하면서 향후 수개월 간 tidyverse에 대해 더 많은 것을 듣게 될 것으로 기대합니다.

( 출처 ))

이것을 어떻게 사용 하는가?

일반 R 패키지 만 있으면 패키지를 설치하고로드해야합니다.

install.package("tidyverse")
library("tidyverse")

차이점은 단일 명령에서 수십 개의 패키지가 설치 /로드된다는 것입니다. 보너스로 모든 설치 /로드 된 패키지가 호환 가능한 버전임을 확신 할 수 있습니다.

그 패키지들은 무엇입니까?

일반적으로 널리 사용되는 패키지 :

  • ggplot2 : 고급 데이터 시각화 SO_doc
  • dplyr : 데이터 조작에 대한 빠른 ( Rcpp ) 및 일관된 접근법 SO_doc
  • tidyr : 데이터 정리 도구 SO_doc
  • readr : 데이터 가져 오기.
  • purrr : JS 패키지 underscore.js, lodash 및 lazy.js 스타일로 다른 언어의 중요한 기능을 갖춘 R의 함수 프로그래밍 도구를 완성하여 순수한 함수를 완성시킵니다.
  • tibble : 현대의 데이터 프레임 재구성.
  • magrittr : 코드를보다 읽기 쉽게하기위한 파이핑 SO_doc

특정 데이터 형식을 조작하기위한 패키지 :

  • hms : 쉽게 읽을 시간
  • stringr : 가능한 한 쉽게 문자열로 작업 할 수 있도록 설계된 응집력있는 함수 세트를 제공합니다.
  • lubridate : 고급 날짜 / 시간 조작 SO_doc
  • forcats : 요인을 가진 진보 된 일.

데이터 가져 오기 :

  • DBI : R과 데이터베이스 관리 시스템 (DBMS) 간의 공통 인터페이스를 정의합니다.
  • 피난처 : SPSS, SAS 및 Stata 파일을 쉽게 가져올 수 있습니다. SO_doc
  • httr : httr 의 목표는 최신 웹 API의 요구에 맞게 맞춤화 된 컬 패키지에 대한 래퍼를 제공하는 것입니다.
  • jsonlite : 통계 데이터 및 웹용으로 최적화 된 빠른 JSON 파서 및 생성기
  • 종속성 패키지가 필요없는 readxl : read.xls 및 .xlsx 파일 SO_doc
  • rvest : rvest는 웹 페이지 SO_doc 에서 정보를 긁어내는 데 도움을줍니다.
  • xml2 : XML 용

그리고 모델링 :

  • modelr : 모델링 할 때 우아한 파이프 라인을 만드는 데 도움이되는 함수를 제공합니다.
  • 빗자루 : 모델을 깔끔한 데이터로 쉽게 추출합니다.

마지막으로 tidyverse 는 다음을 사용하도록 제안합니다.

  • knitr : 무거운 코딩 작업없이 사용자가 출력을 완벽하게 제어 할 수 있도록 설계된 경량급 API를 사용하여 놀라운 범용 문법 프로그래밍 엔진입니다. SO_docs : 1 , 2
  • rmarkdown : 재현성있는 프로그래밍을위한 Rstudio 패키지. SO_docs : 1 , 2 , 3 , 4


Modified text is an extract of the original Stack Overflow Documentation
아래 라이선스 CC BY-SA 3.0
와 제휴하지 않음 Stack Overflow