R

【R】複数ファイルのファイル名を列追加し、結合する

Rで複数ファイルのファイル名を列追加し、結合する方法を紹介。サイズが大きいファイルを高速に入出力したいときは、data.tableパッケージのfread()とfwrite()がおすすめ。基本統計量の集計は、dplyrパッケージのsummarise()を使えば楽ちんです。
R

Rで繰り返し処理するなら、forではなくsapply

R言語で繰り返し処理を実装する場合は、for()ではなくsapply()を使いましょう!なぜなら、for()では複数行のコーディングが必要なケースでも、sapply()ならたった1行で代替できることがあるからです。
統計学

【備忘録】状態空間モデルの基礎~入門したけりゃ、馬場さんの本を読むべし~

本記事は状態空間モデルに主眼を置き、「状態空間モデルとは何か」を単純なローカルレベルモデルを使って解説しています。
R

MTシステムにおけるマハラノビス距離をわかりすく解説

マハラノビス距離とは、複数の変数間に相関がある場合に相関関係を考慮した上で注目しているデータが中心点からどのくらい離れているかを表す距離です。本記事では、MTシステムにおけるマハラノビス距離について、入門者でも理解しやすいように...
データ分析

「原因と結果」の経済学を読んだら、因果推論に入門できた

因果推論の入門書を探していたら、Twitterで "「原因と結果」の経済学 "という本を発見!この本は、因果推論を実例に沿って丁寧に解説されているため、大変読みやすかったです。また、数式はほとんど出てこないので...
R

PDPとICEを利用したEDA(探索的データ解析)|R

この記事では、PDPとICEを利用したEDA(探索的データ解析) について解説します。PDPとICEは特徴量の値の変化による予測値の変動幅、寄与方向の参考になります。ICEは、pdpパッケージの関数partialとplotPartialを利用することで簡単に描けます。
R

ランダムフォレストによるEDAをRで実践

ランダムフォレストによるEDA(探索的データ解析)の実例を紹介します。ランダムフォレストモデルが高い予測力を持っていて、特徴量と予測値の関係を可視化できれば、モデル構築の特徴量選択に利用できます。
EDA

RによるEDA(探索的データ解析)

EDA(Exploratory Data Analysis, 探索的データ解析)とは、データの特徴を捉えるための手法の総称です。単純なデータに対して、Rを使用したEDAの実例を紹介します。統計モデリング過程において、EDAはモデリングの補助的に用いるものです。
統計学

二項分布とポアソン分布の関係|ポアソン分布で在庫数を考える

ポアソン分布とは、ある期間に平均λ回発生する事象がk回起こる確率を表す分布です。 np=λが一定で、試行回数nが非常に大きく、生起確率pが非常に小さいとき、二項分布B(n,p)は平均λのポアソン分布に近似できます。ポアソン分布の素晴らしいところは、試行回数nが分からなくても、ある期間内の平均回数λさえ決まれば、確率を求めることができる点です。
スポンサーリンク
タイトルとURLをコピーしました