クロス集計表とナイーブベイズの対応についてのメモ

統計ベイズ

はじめにある日クロス集計表とナイーブベイズを眺めていて、そもそもこれらはどういう関係性だっけ？と思ったのでその思考メモです。試行以下のような所属クラス×性別×利き手の３軸のクロス集計表があるとし、これを用いて性別と利き手がわかっている人…

2019-12-06

推論時の入力に未知の欠損値がある場合のlightgbmの挙動の確認

python 機械学習

はじめに以前にlightgbmは入力に欠損値があってもうまく学習してくれるという記事を書いたのですが、これは学習時に欠損が存在している場合の話でした。現実の問題を考えると、学習時とそのモデルを使った推論時では時系列の違いや環境変化の影響により…

2019-11-10

テニスにおける疲労度の影響の定量化(spoana5の内容+α)

python 統計機械学習

はじめに「プロテニスにおいて疲れが勝敗に与える影響を定量化してみる」という題目で下記イベントでLTしてきました。 spoana.connpass.com 使用した資料は以下になります。プロテニスにおいて疲れが勝敗に与える影響を定量化してみる - Speaker Deck 内…

2019-09-23

VAE(Variational Auto Encoder)で猫が復元できなかった話

Keras python Deep Learning

はじめに couseraでBayesian Methods for Machine Learningを受けているんですが、その中で出てきたVAE(Variational Auto Encoder)で少し試してみたいことがあったのでその実験記録になります。参考文献 VAEの理論や位置付けについては下記資料が参考にな…

2019-07-21

変数間の関係性が見たい(偏相関とGraphical Lasso)

python 統計

はじめにデータの変数間の関係性を明らかにしたいというケースは多いと思います。その場合相関や散布図をみるのが一般的ですが、交絡やノイズが多いケースなどそれだけでは不十分な場合もあるため、その場合にも対応できそうな手法を試してみます。試す…

2019-06-30

機械学習における欠損値補完について考える

python 機械学習統計

※この記事で使用している多重代入法のパッケージは正式な多重代入法の枠組みとは異なりますのでご注意願います。はじめに最近多重代入法という欠損値補完の手法があることを知りました。統計学の界隈では欠損値補完は多重代入法を使用するのがベターのよ…

2019-06-10

ランチ最適化問題(バンディットアルゴリズム編)

python 数理最適化

はじめに日々の生活を営む上で、ランチをどこで食べるかということは非常に重要な問題です(2回目)。前回はこの問題を最適停止問題と捉えて探索と活用の最適点探索を行いましたが、最適停止問題では一度見逃した店はもう選択できないという制約がありました…

2019-05-21

ランチ最適化問題(秘書問題編)

python 数理最適化

はじめに日々の生活を営む上で、ランチをどこで食べるかということは非常に重要な問題です。ランチの選択肢としては、新しい店に入る（探索）と、今まで行ったことのある店で良かった店に入る（活用）のどちらかを行う必要があります。経験的に良かった店…

2019-05-09

CausalImpactの理解と実装

python 因果推論時系列解析

はじめに今回はCausalImpactについて書いていきたいと思います。 CausalImpactはgoogle製の効果測定用パッケージで、主に広告やキャンペーンの効果を測定するのに用いられます。なぜ広告やキャンペーンの効果を測定するのにこういうものが必要なのかという…

2019-05-01

差分の差分法(difference in difference)を試す

python 因果推論

はじめに最初は最近話題(？)のCausalImpactについて書こうと思っていたのですが、その基礎となる差分の差分法（difference in difference）についての知識が不足していたため、この記事では差分の差分法について試したことを記述していきます。差分の差分…

2019-04-18

NCAAコンペ反省文(2019)

Stan kaggle python

はじめに下記のNCAAコンペに参加した反省文です。 https://www.kaggle.com/c/womens-machine-learning-competition-2019 https://www.kaggle.com/c/mens-machine-learning-competition-2019 このコンペのタスクは全米大学体育協会（NCAA）が毎年春に主催す…