サーチ…
tbl_dfの作成
tbl_df( tibble diffと発音する)は、定期的なパッケージでよく使用されるデータフレームのバリエーションです。それはチブルパッケージに実装されています。
as_data_frame
関数を使用して、データフレームをtbl_dfに変換します。
library(tibble)
mtcars_tbl <- as_data_frame(mtcars)
data.framesとtbl_dfsの最も顕著な違いの1つは、printというものです。
# A tibble: 32 x 11
mpg cyl disp hp drat wt qsec vs am gear carb
* <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
2 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
3 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
4 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
5 18.7 8 360.0 175 3.15 3.440 17.02 0 0 3 2
6 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
7 14.3 8 360.0 245 3.21 3.570 15.84 0 0 3 4
8 24.4 4 146.7 62 3.69 3.190 20.00 1 0 4 2
9 22.8 4 140.8 95 3.92 3.150 22.90 1 0 4 2
10 19.2 6 167.6 123 3.92 3.440 18.30 1 0 4 4
# ... with 22 more rows
- 印刷された出力には、表の寸法の要約(
32 x 11
) - これには、各列のタイプ(
dbl
) - これは、限られた数の行を印刷します。 (この使用
options(tibble.print_max = [number])
を変更するにはoptions(tibble.print_max = [number])
)。
dplyrパッケージの多くの関数は、 group_by()
などのtbl_dfsで自然に動作します。
tidyverse:概要
tidyverse
とはtidyverse
ですか?
tidyverse
は、基本的なR
をHadley / Rstudioによって再設計された強化されたツールに変える、速くエレガントな方法です。 tidyverse
に含まれるすべてのパッケージの開発は、 tidyverse
ツール宣言の原則に従います。しかし、まず、作家に彼らの傑作を説明させてください:
tidyverseは、共通のデータ表現とAPI設計を共有しているため、調和して動作する一連のパッケージです。 tidyverseパッケージは、1つのコマンドで簡単にコアパッケージをインストールしてロードできるように設計されています。
ぴったりの中のすべてのパッケージについて学び、それらがどのようにフィットするかについての最良の場所は、R for Data Scienceです。改善されたパッケージのウェブサイトを作成し、引用を簡単にし、定期的にデータ分析に関する議論のための共通の家を提供するように、今後数ヶ月の間に定期的なことについてもっと聞くことを期待してください。
( ソース ))
どうやって使うのですか?
通常のR
パッケージだけで、パッケージをインストールして読み込む必要があります。
install.package("tidyverse")
library("tidyverse")
違いは、1つのコマンドで数十のパッケージがインストール/ロードされていることです。ボーナスとして、インストールされた/ロードされたすべてのパッケージが互換性のあるバージョンであることを安心することができます。
これらのパッケージは何ですか?
よく知られて広く使われているパッケージ:
- ggplot2 :高度なデータの可視化SO_doc
- dplyr :速い( Rcppデータ操作)と一貫したアプローチSO_doc
- tidyr :データ片付けのためのツールSO_doc
- readr :データのインポート。
- purrr :JSパッケージunderscore.js、lodash、lazy.jsのスタイルで、他の言語の重要な機能を備えたRの関数型プログラミングツールを完成させることで、純粋な関数を完成させます。
- tibble :データフレームの現代的な再想像。
- magrittr :コードを読みやすくするための配管SO_doc
特定のデータ形式を操作するためのパッケージ:
- hms :簡単に読む時間
- stringr :文字列を簡単に操作できるように設計された一貫した関数群を提供する
- lubridate :高度な日付/時刻操作SO_doc
- forcats : 要因による高度な作業。
データのインポート:
- DBI :Rとデータベース管理システム(DBMS)間の共通インタフェースを定義します。
- 避難所 :簡単にSPSS、SASとStataのファイルのインポートSO_docを
- httr : httrの目的は、現代のWeb APIの要求に合わせてカスタマイズされたカールパッケージのラッパーを提供することです
- jsonlite :統計データとWeb用に最適化された高速JSONパーサとジェネレータ
- 依存パッケージSO_docを必要とせずにreadxl :read.xlsおよび.xlsxファイル
- rvest :rvestはウェブページSO_docから情報を取り出すのに役立ちます
- xml2 :XML用
モデリング:
最後に、 tidyverse
は以下を使用することを提案します:
- knitr :驚くべき汎用リテラルプログラミングエンジンです。軽量なAPIを使用することで、コード生成作業をせずに出力を完全に制御できます。 SO_docs: 1つ 、 2つ
- rmarkdown :再現性のあるプログラミングのためのRstudioのパッケージ。 SO_docs: 1つ 、 2つ 、 3つ 、 4つ