一般情報 (General)
- R バージョン3.0以降は64ビット整数をサポート
- R は大文字と小文字を区別する言語です
- R のインデックスは1から始まります
ヘルプの使い方 (Help)
help(functionName)
または?functionName
: 関数のヘルプを表示help.start()
: ヘルプのホームページを開くhelp('?')
: 特殊文字のヘルプapropos('text')
: パターンマッチによる関数検索example(topic)
: 例を表示
現在の環境でのオブジェクト (Objects in Current Environment)
objects()
またはls()
: オブジェクト名の表示rm(object1, object2, ...)
: オブジェクトの削除
注意:
- ピリオドで始まる名前のオブジェクトは
ls()
では表示されません - メモリ解放を保証するには
gc()
を使用します
文字列操作 (Manipulating Strings)
文字列の結合
# デフォルトの区切り文字はスペース
paste(c('1', '2'), collapse = '/')
# 文字列を '1/2' のように結合
strsplit(string = v1, pattern = '-')
部分文字列の取得
substring(string = v1, first = 1, last = 2)
パターンマッチング
# John が見つかった場合、True/False を返す
if(isJohnFound, c('cool', 'no'))
データ構造 (Data Structures)
ベクトル (Vector)
- 同じ型の要素のグループ
- R はベクトル化された言語で、操作は自動的に各要素に適用
- 特別なベクトル: 文字(letters と LETTERS)は小文字と大文字を含む
ベクトルの作成:
v1 <- c(1, 2, 3)
length(v1) # 長さの取得
all(v1) # すべての要素がTRUEかチェック
データテーブル (Data Table)
- データフレームの機能を拡張し強化
- 主な違い:
- デフォルトで文字データを因子に変換しない
- データ表示時にインテリジェントに最初と最後の行を表示
- インデックスがデータベースのように機能するため高速
ファクター (Factor)
as.factor(v1)
: レベル数を取得- 適切に使用しないと変数のサイズに影響する可能性あり
リスト (List)
- 任意の型のアイテムを格納可能
list1 <- list(name = 'a', ...)
list1[[1]] または list1[['name']] # 要素の取得
データ型 (Data Types)
4つの基本データ型:
- 数値 (Numeric)
- float/double などを含む
is.numeric(variable)
- 文字列 (Character)
nchar(variable) # 文字数を取得
- 日付/POSIXct
- Date: 日付のみ
- POSIXct: 日付と時刻
- 論理値 (Logical)
- TRUE = 1, FALSE = 0
- 等値比較には
==
を使用
as.numeric(TRUE) => 1
行列 (Matrix)
- データフレームに似ているが、すべての要素が同じ型である必要がある
- 主に数値計算に使用
matrix1 <- matrix(1:9, nrow = 3) # 3x3行列の作成
matrix1 %*% t(matrix2) # 行列の乗算
配列 (Array)
- 同じ型の多次元ベクトル
array1 <- array(1:12, dim = c(3, 2, 2))
- 配列の使用は推奨されない
- 行列は2次元に制限されるが、配列は任意の次元を持つことが可能
注意:
- コードの最適化とパフォーマンスを考慮する場合は、ベクトル化された操作を優先してください
- データ操作時は適切なデータ構造の選択が重要です
- 一般情報 – Rの基本的な特徴
- ヘルプの使い方 – ドキュメントへのアクセス方法
- オブジェクト管理 – 環境内のオブジェクトの操作
- 文字列操作 – 文字列の処理方法
- データ構造 – ベクトル、データテーブル、ファクター、リスト
- データ型 – 基本的なデータ型の説明と使用方法
- 行列と配列 – 多次元データの扱い方
このチートシートは日本語で作成し、コード例も含めて実践的な使用方法を示しています。必要に応じて特定のセクションの詳細な説明を加えたり、さらなる例を追加したりすることができます。