R Language
깔끔한
수색…
tbl_df 만들기
tbl_df ( tibble diff라고도 함 )는 깔끔한 패키지에서 자주 사용되는 데이터 프레임 의 변형입니다. 그것은 tibble 패키지로 구현됩니다.
as_data_frame
함수를 사용하여 데이터 프레임을 tbl_df로 바꿉니다.
library(tibble)
mtcars_tbl <- as_data_frame(mtcars)
data.frames와 tbl_dfs의 가장 두드러진 차이점 중 하나는 다음과 같습니다.
# A tibble: 32 x 11
mpg cyl disp hp drat wt qsec vs am gear carb
* <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
2 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
3 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
4 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
5 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
6 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
7 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
8 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
9 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
10 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
# ... with 22 more rows
- 인쇄 된 출력에는 표의 크기 요약 (
32 x 11
) - 여기에는 각 열의 유형 (
dbl
) - 제한된 수의 행을 인쇄합니다. (이 사용
options(tibble.print_max = [number])
을 변경하려면options(tibble.print_max = [number])
).
dplyr 패키지의 많은 함수는 group_by()
와 같은 tbl_dfs로 자연스럽게 작동합니다.
정리 : 개요
tidyverse
란 무엇입니까?
tidyverse
는 기본 R
을 Hadley / Rstudio가 재 설계 한 향상된 도구로 바꾸는 빠르고 우아한 방법입니다. tidyverse
포함 된 모든 패키지의 개발은 깔끔한 도구 선언문 의 원칙적 규칙을 따릅니다. 그러나 먼저 저자들이 그들의 걸작을 묘사하게하십시오.
tidyverse는 일반적인 데이터 표현과 API 디자인을 공유하기 때문에 조화롭게 작동하는 패키지 세트입니다. tidyverse 패키지는 하나의 명령으로 띠 반달로부터 코어 패키지를 쉽게 설치하고로드 할 수 있도록 설계되었습니다.
tidyverse의 모든 패키지에 대해 배우고 그것들이 어떻게 맞는지 가장 좋은 곳은 R for Data Science입니다. 개선 된 패키지 웹 사이트를 작성하고 인용문을 더 쉽게 작성하고 tidyverse를 사용하여 데이터 분석에 대한 토론을위한 공통의 고향을 제공하면서 향후 수개월 간 tidyverse에 대해 더 많은 것을 듣게 될 것으로 기대합니다.
( 출처 ))
이것을 어떻게 사용 하는가?
일반 R
패키지 만 있으면 패키지를 설치하고로드해야합니다.
install.package("tidyverse")
library("tidyverse")
차이점은 단일 명령에서 수십 개의 패키지가 설치 /로드된다는 것입니다. 보너스로 모든 설치 /로드 된 패키지가 호환 가능한 버전임을 확신 할 수 있습니다.
그 패키지들은 무엇입니까?
일반적으로 널리 사용되는 패키지 :
- ggplot2 : 고급 데이터 시각화 SO_doc
- dplyr : 데이터 조작에 대한 빠른 ( Rcpp ) 및 일관된 접근법 SO_doc
- tidyr : 데이터 정리 도구 SO_doc
- readr : 데이터 가져 오기.
- purrr : JS 패키지 underscore.js, lodash 및 lazy.js 스타일로 다른 언어의 중요한 기능을 갖춘 R의 함수 프로그래밍 도구를 완성하여 순수한 함수를 완성시킵니다.
- tibble : 현대의 데이터 프레임 재구성.
- magrittr : 코드를보다 읽기 쉽게하기위한 파이핑 SO_doc
특정 데이터 형식을 조작하기위한 패키지 :
- hms : 쉽게 읽을 시간
- stringr : 가능한 한 쉽게 문자열로 작업 할 수 있도록 설계된 응집력있는 함수 세트를 제공합니다.
- lubridate : 고급 날짜 / 시간 조작 SO_doc
- forcats : 요인을 가진 진보 된 일.
데이터 가져 오기 :
- DBI : R과 데이터베이스 관리 시스템 (DBMS) 간의 공통 인터페이스를 정의합니다.
- 피난처 : SPSS, SAS 및 Stata 파일을 쉽게 가져올 수 있습니다. SO_doc
- httr : httr 의 목표는 최신 웹 API의 요구에 맞게 맞춤화 된 컬 패키지에 대한 래퍼를 제공하는 것입니다.
- jsonlite : 통계 데이터 및 웹용으로 최적화 된 빠른 JSON 파서 및 생성기
- 종속성 패키지가 필요없는 readxl : read.xls 및 .xlsx 파일 SO_doc
- rvest : rvest는 웹 페이지 SO_doc 에서 정보를 긁어내는 데 도움을줍니다.
- xml2 : XML 용
그리고 모델링 :
마지막으로 tidyverse
는 다음을 사용하도록 제안합니다.
- knitr : 무거운 코딩 작업없이 사용자가 출력을 완벽하게 제어 할 수 있도록 설계된 경량급 API를 사용하여 놀라운 범용 문법 프로그래밍 엔진입니다. SO_docs : 1 , 2
- rmarkdown : 재현성있는 프로그래밍을위한 Rstudio 패키지. SO_docs : 1 , 2 , 3 , 4