Kaggle Note

【scikit-learn】 2値分類の際のpredictで任意の閾値を設定する

2021-03-12
はじめに scikit-learnにおける2値分類でpredictをするとデフォルトの閾値0.5で分類されますよね。今回はこの閾値を任意で設定

コーエンのdをpythonで求める。

2021-02-10
はじめに 今回は効果量で用いられるコーエンのd(Cohen’s d)をpythonで求めていきます。 コーエンのdとは? コーエンのdとは2つのグル

pythonでハミング距離を計算する

2021-02-09
はじめに ここではハミング距離とはなにかの説明と、pythonでの計算方法を紹介します。 ハミング距離(Hamming Distance) ハミング

pythonによるコサイン類似度の計算

2021-02-07
はじめに ここではnumpyを利用してコサイン類似度の計算を行います。 コサイン類似度(Cosine Similarity)とは コサイン類似度とは

【python】ユークリッド距離, マンハッタン距離, チェビシェフ距離, ミンコフスキー距離

2021-02-03
はじめに 距離というと2点間の距離を真っ先に思いつきますが、世の中にはさまざまな距離の定義が存在します。 ここではユークリッド距離、マンハッタン

jupyter-notebookでwarningsを非表示にする

2020-12-21
概要 jupyternote-bookを使ってるときに出てくるwarningsがうざったいので、非表示にする。 方法 import warnings warnings.filterwarnings('ignore') 以上。

pandasで他のカラムを条件に、新しいカラムを追加する

2020-12-09
概要 pandasでデータの前処理をしている時、現在あるカラムを条件に使って新しいカラムを作成したい時ってありますよね。今回はその方法を紹介し

EfficientNetを用いた画像分類モデルを学習させるまで。

2020-12-05
概要 EfficientNetを用いた画像分類を行っていきます。この記事で実際に紹介するものは以下の通りです。 EfficientNetのインス

numpyで最頻値を求める

2020-12-04
概要 numpyで最頻値を求める方法です。 方法 np.unique()を使います。 import numpy as np arr = np.array([0, 1, 2, 3, 4, 1, 2, 2, 2, 2, 2, 3, 4]) unique, freq = np.unique(arr, return_counts=True) #return

PandasのNaNをif文で判定する

2020-11-05
概要 Pandasを使うときに出てくるNaNをif文で判定する方法を紹介します。 準備 以下のcsvファイルがあると想定します。ここではtest.