SIRモデルとネットワークモデルを用いて身近にコロナ感染経験者が存在する確率をシミュレーションする

python 趣味分析

はじめに最近は街を見ると人通りがコロナ前に戻っていたりしますが、感染者数自体はそれほど減っていないのでこのような状況となっているのは、身近にコロナの感染経験者がいないことも原因の一つであるのではないかという仮説があります。人は身近に起こっ…

2021-03-02

書籍レビューを用いた潜在表現の獲得とクラスタリングの実施

python クラスタリング機械学習

はじめに書籍に関連する情報を用いてその潜在表現をうまく獲得することで、以下のようなことができないかなーと考えています。自身の読書済みの本と照らし合わせてカテゴリごとの網羅率の算出本を読んだ時に得られる情報量の算出該当の本の完読可能性…

2021-01-21

物体検出を用いてジャグリング(3ボールカスケード)の回数をカウントする

画像解析趣味分析 python

はじめに WFHの気分転換でたまにジャグリングをしていて、これ最近の物体検出技術を使えば回数をカウントする仕組みが割と簡単に作れるのでは？と思ったので試しに動画から３ボールカスケードの回数をカウントする仕組みを作成しました。実施手順以下の手…

2020-11-14

Q-learningで倒立振子を振り回す

強化学習 python

はじめに最近kaggleでも強化学習系のお題が増えてきたように思うので(実際に解法に強化学習が使用されているかは別として)、手をつけていなかった強化学習について、本を読みながら試してみたことを書きます。参考資料 pythonで学ぶ強化学習 https://gith…

2020-09-26

DTW(Dynamic Time Warping)で台風軌道をクラスタリングする

python クラスタリング可視化時系列解析

はじめに多次元時系列データのクラスタリングがしたいと思って探していたところ、ちょうどこちらのブログの題材が台風軌道のクラスタリングという、多次元時系列かつ系列長の異なるデータをクラスタリングするというものだったので、理解を兼ねて同じ内容…

2020-08-16

Dashで更新可能な地図を表示する

python 可視化

はじめに選択した項目に対して、インタラクティブに地図を更新するwebアプリを作成したいと思いました。最初はstreamlitのpydeckで試していたのですが、地図を複数回レンダリングすると発生するバグが解消できなかったため、今回はDashで実装しました。実…

2020-08-07

Whooshで検索機能の向上を図る

python 検索

はじめに前に類似本検索システムを作成したのですが、その中で数万ある本の候補の中から探したい本の検索する部分があります。そのときは入力された単語に対し検索を全書籍に対して行う、という最も単純な手法を実装したのですが、もう少しいいやり方がな…

2020-07-20

スペクトラルクラスタリングを用いてグラフ構造のデータをクラスタリングする

python クラスタリング

はじめにグラフ構造のデータをクラスタリングする方法について調べていて、スペクトラルクラスタリングという手法が使えそうだったので、その実験結果を記述します。参考資料 https://arxiv.org/pdf/0711.0189.pdf[1] https://towardsdatascience.com/spe…

2020-07-14

類似本検索システムを作りたい

python 機械学習

ということで、本を検索すると類似している本のリストを出力するサイトを試作してみました。 https://bookrecommendst.herokuapp.com/ (herokuを他の用途で使うまではアクセス可能な予定です。) youtu.be こんな感じで、ある検索した本に対して類似度の高い…

2020-06-13

GCPでデータ収集環境をつくる

python GCP

はじめにデータ分析をするにはデータが必要ですが、常に欲しいデータが存在するとは限らず、時には自分で取得・保存する必要が出てくると思います。ここではGCPを用いてデータ収集環境を構築してみた備忘録を記述します。実施概要 apiを使って日次でvtub…

2020-04-19

pca+kmeansについての雑実験

python

はじめに列数が多いデータセットに対してクラスタリングを行う場合にPCAで列数を次元削減してからクラスタリングをするという手法があるらしいです。確かにPCA等で列の次元削減を行うことでノイズ成分を落とせるので、うまくいけば重要となる特徴だけを用…

2020-02-24

あてはまりのよい確率分布を探したい

python 統計

はじめにデータを眺めていると、ある分布に対してそれが正規分布に従うのか、対数正規分布か、それともガンマ分布の方が近いのか？、というようにどの分布の当てはまりがよいかが気になることがあると思います。これを確認する方法を探してみたところ、sci…

2019-12-06

推論時の入力に未知の欠損値がある場合のlightgbmの挙動の確認

python 機械学習

はじめに以前にlightgbmは入力に欠損値があってもうまく学習してくれるという記事を書いたのですが、これは学習時に欠損が存在している場合の話でした。現実の問題を考えると、学習時とそのモデルを使った推論時では時系列の違いや環境変化の影響により…

2019-11-10

テニスにおける疲労度の影響の定量化(spoana5の内容+α)

python 統計機械学習

はじめに「プロテニスにおいて疲れが勝敗に与える影響を定量化してみる」という題目で下記イベントでLTしてきました。 spoana.connpass.com 使用した資料は以下になります。プロテニスにおいて疲れが勝敗に与える影響を定量化してみる - Speaker Deck 内…

2019-09-23

VAE(Variational Auto Encoder)で猫が復元できなかった話

Keras python Deep Learning

はじめに couseraでBayesian Methods for Machine Learningを受けているんですが、その中で出てきたVAE(Variational Auto Encoder)で少し試してみたいことがあったのでその実験記録になります。参考文献 VAEの理論や位置付けについては下記資料が参考にな…

2019-07-21

変数間の関係性が見たい(偏相関とGraphical Lasso)

python 統計

はじめにデータの変数間の関係性を明らかにしたいというケースは多いと思います。その場合相関や散布図をみるのが一般的ですが、交絡やノイズが多いケースなどそれだけでは不十分な場合もあるため、その場合にも対応できそうな手法を試してみます。試す…

2019-06-30

機械学習における欠損値補完について考える

python 機械学習統計

※この記事で使用している多重代入法のパッケージは正式な多重代入法の枠組みとは異なりますのでご注意願います。はじめに最近多重代入法という欠損値補完の手法があることを知りました。統計学の界隈では欠損値補完は多重代入法を使用するのがベターのよ…

2019-06-10

ランチ最適化問題(バンディットアルゴリズム編)

python 数理最適化

はじめに日々の生活を営む上で、ランチをどこで食べるかということは非常に重要な問題です(2回目)。前回はこの問題を最適停止問題と捉えて探索と活用の最適点探索を行いましたが、最適停止問題では一度見逃した店はもう選択できないという制約がありました…

2019-05-21

ランチ最適化問題(秘書問題編)

python 数理最適化

はじめに日々の生活を営む上で、ランチをどこで食べるかということは非常に重要な問題です。ランチの選択肢としては、新しい店に入る（探索）と、今まで行ったことのある店で良かった店に入る（活用）のどちらかを行う必要があります。経験的に良かった店…

2019-05-09

CausalImpactの理解と実装

python 因果推論時系列解析

はじめに今回はCausalImpactについて書いていきたいと思います。 CausalImpactはgoogle製の効果測定用パッケージで、主に広告やキャンペーンの効果を測定するのに用いられます。なぜ広告やキャンペーンの効果を測定するのにこういうものが必要なのかという…

2019-05-01

差分の差分法(difference in difference)を試す

python 因果推論

はじめに最初は最近話題(？)のCausalImpactについて書こうと思っていたのですが、その基礎となる差分の差分法（difference in difference）についての知識が不足していたため、この記事では差分の差分法について試したことを記述していきます。差分の差分…

2019-04-18

NCAAコンペ反省文(2019)

Stan kaggle python

はじめに下記のNCAAコンペに参加した反省文です。 https://www.kaggle.com/c/womens-machine-learning-competition-2019 https://www.kaggle.com/c/mens-machine-learning-competition-2019 このコンペのタスクは全米大学体育協会（NCAA）が毎年春に主催す…