サーチ…


tbl_dfの作成

tbl_df( tibble diffと発音する)は、定期的なパッケージでよく使用されるデータフレームのバリエーションです。それはチブルパッケージに実装されてます。

as_data_frame関数を使用して、データフレームをtbl_dfに変換します。

library(tibble)
mtcars_tbl <- as_data_frame(mtcars)

data.framesとtbl_dfsの最も顕著な違いの1つは、printというものです。

# A tibble: 32 x 11
     mpg   cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
*  <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1   21.0     6 160.0   110  3.90 2.620 16.46     0     1     4     4
2   21.0     6 160.0   110  3.90 2.875 17.02     0     1     4     4
3   22.8     4 108.0    93  3.85 2.320 18.61     1     1     4     1
4   21.4     6 258.0   110  3.08 3.215 19.44     1     0     3     1
5   18.7     8 360.0   175  3.15 3.440 17.02     0     0     3     2
6   18.1     6 225.0   105  2.76 3.460 20.22     1     0     3     1
7   14.3     8 360.0   245  3.21 3.570 15.84     0     0     3     4
8   24.4     4 146.7    62  3.69 3.190 20.00     1     0     4     2
9   22.8     4 140.8    95  3.92 3.150 22.90     1     0     4     2
10  19.2     6 167.6   123  3.92 3.440 18.30     1     0     4     4
# ... with 22 more rows
  • 印刷された出力には、表の寸法の要約( 32 x 11
  • これには、各列のタイプ( dbl
  • これは、限られた数の行を印刷します。 (この使用options(tibble.print_max = [number])を変更するにはoptions(tibble.print_max = [number]) )。

dplyrパッケージの多くの関数は、 group_by()などのtbl_dfsで自然に動作します。

tidyverse:概要

tidyverseとはtidyverseですか?

tidyverseは、基本的なRをHadley / Rstudioによって再設計された強化されたツールに変える、速くエレガントな方法です。 tidyverseに含まれるすべてのパッケージの開発は、 tidyverse ツール宣言の原則に従います。しかし、まず、作家に彼らの傑作を説明させてください:

tidyverseは、共通のデータ表現とAPI設計を共有しているため、調和して動作する一連のパッケージです。 tidyverseパッケージは、1つのコマンドで簡単にコアパッケージをインストールしてロードできるように設計されています。

ぴったりの中のすべてのパッケージについて学び、それらがどのようにフィットするかについての最良の場所は、R for Data Scienceです。改善されたパッケージのウェブサイトを作成し、引用を簡単にし、定期的にデータ分析に関する議論のための共通の家を提供するように、今後数ヶ月の間に定期的なことについてもっと聞くことを期待してください。

ソース ))

どうやって使うのですか?

通常のRパッケージだけで、パッケージをインストールして読み込む必要があります。

install.package("tidyverse")
library("tidyverse")

違いは、1つのコマンドで数十のパッケージがインストール/ロードされていることです。ボーナスとして、インストールされた/ロードされたすべてのパッケージが互換性のあるバージョンであることを安心することができます。

これらのパッケージは何ですか?

よく知られて広く使われているパッケージ:

  • ggplot2 :高度なデータの可視化SO_doc
  • dplyr :速い( Rcppデータ操作)と一貫したアプローチSO_doc
  • tidyr :データ片付けのためのツールSO_doc
  • readr :データのインポート。
  • purrr :JSパッケージunderscore.js、lodash、lazy.jsのスタイルで、他の言語の重要な機能を備えたRの関数型プログラミングツールを完成させることで、純粋な関数を完成させます。
  • tibble :データフレームの現代的な再想像。
  • magrittr :コードを読みやすくするための配管SO_doc

特定のデータ形式を操作するためのパッケージ:

データのインポート:

  • DBI :Rとデータベース管理システム(DBMS)間の共通インタフェースを定義します。
  • 避難所 :簡単にSPSS、SASとStataのファイルのインポートSO_docを
  • httrhttrの目的は、現代のWeb APIの要求に合わせてカスタマイズされたカールパッケージのラッパーを提供することです
  • jsonlite :統計データとWeb用に最適化された高速JSONパーサとジェネレータ
  • 依存パッケージSO_docを必要とせずにreadxl :read.xlsおよび.xlsxファイル
  • rvest :rvestはウェブページSO_docから情報を取り出すのに役立ちます
  • xml2 :XML用

モデリング:

  • modelr :モデリング時にエレガントなパイプラインを作成するのに役立つ関数を提供します
  • ほうき :モデルを簡単なデータに簡単に抽出

最後に、 tidyverseは以下を使用することを提案します:

  • knitr :驚くべき汎用リテラルプログラミングエンジンです。軽量なAPIを使用することで、コード生成作業をせずに出力を完全に制御できます。 SO_docs: 1つ2つ
  • rmarkdown :再現性のあるプログラミングのためのRstudioのパッケージ。 SO_docs: 1つ2つ3つ4つ


Modified text is an extract of the original Stack Overflow Documentation
ライセンスを受けた CC BY-SA 3.0
所属していない Stack Overflow