データ分析

R

【R】複数ファイルのファイル名を列追加し、結合する

Rで複数ファイルのファイル名を列追加し、結合する方法を紹介。サイズが大きいファイルを高速に入出力したいときは、data.tableパッケージのfread()とfwrite()がおすすめ。基本統計量の集計は、dplyrパッケージのsummarise()を使えば楽ちんです。
R

Rで繰り返し処理するなら、forではなくsapply

R言語で繰り返し処理を実装する場合は、for()ではなくsapply()を使いましょう!なぜなら、for()では複数行のコーディングが必要なケースでも、sapply()ならたった1行で代替できることがあるからです。
R

MTシステムにおけるマハラノビス距離をわかりすく解説

マハラノビス距離とは、複数の変数間に相関がある場合に相関関係を考慮した上で注目しているデータが中心点からどのくらい離れているかを表す距離です。本記事では、MTシステムにおけるマハラノビス距離について、入門者でも理解しやすいように...
データ分析

「原因と結果」の経済学を読んだら、因果推論に入門できた

因果推論の入門書を探していたら、Twitterで "「原因と結果」の経済学 "という本を発見!この本は、因果推論を実例に沿って丁寧に解説されているため、大変読みやすかったです。また、数式はほとんど出てこないので...
EDA

PDPとICEを利用したEDA(探索的データ解析)|R

この記事では、PDPとICEを利用したEDA(探索的データ解析) について解説します。PDPとICEは特徴量の値の変化による予測値の変動幅、寄与方向の参考になります。ICEは、pdpパッケージの関数partialとplotPartialを利用することで簡単に描けます。
EDA

ランダムフォレストによるEDAをRで実践

ランダムフォレストによるEDA(探索的データ解析)の実例を紹介します。ランダムフォレストモデルが高い予測力を持っていて、特徴量と予測値の関係を可視化できれば、モデル構築の特徴量選択に利用できます。
EDA

RによるEDA(探索的データ解析)

EDA(Exploratory Data Analysis, 探索的データ解析)とは、データの特徴を捉えるための手法の総称です。単純なデータに対して、Rを使用したEDAの実例を紹介します。統計モデリング過程において、EDAはモデリングの補助的に用いるものです。
データ分析

【もっと早く行っときゃよかった…】Sports Analyst Meetup#5~スポーツ好きに悪い人はいない~

Sports Analyst Meetupに初めて参加してみたら、現役スポーツアナリストの生々しいおもしろ話が聴けて最高でした。スポーツ業界に限らず、自身の業界にも通じる、データ分析における大切な視点が学べました。
R

決定木の分類ルールセットを編集して予測する方法|R

この記事では、決定木モデルの分類ルールセットを編集する方法をご紹介します。決定木でテストデータの予測を行う前に、訓練データから派生した分類ルールセットを編集したい場合に役立ちます。
スポンサーリンク
タイトルとURLをコピーしました