Kaggle Note

【One-Hotエンコーディング】 scikit-learn vs pandas

2020-08-19
one-hotエンコーディングとは? one-hotエンコーディングとはカテゴリデータに対する処理の一つです。 カテゴリデータは数値データではな

スタッキングライブラリvecstackの使い方

2020-08-17
この記事ではスタッキングについてvecstackの使い方をrisを例として説明します。 スタッキングとは スタッキングは異なる予測器を1層2層&

逆翻訳を使ったテキストデータ水増し

2020-08-15
テキスト分類を行う際、教師データを増やすために水増しをすることは非常に重要です。 テキストデータ水増しの手法として、Data Augmentation in NLPという記

numpyで学習結果の多数決

2020-08-13
複数の学習結果を多数決したい時、以下のような操作が必要になります。 これを実現するには転置してmapで各行に対して最頻値を求めればOKです。 results

【入門】pythonを用いた自然言語処理

2020-08-11
概要 今回紹介するnotebookはNatural Language Processing (NLP) 🧾 for Beginnersです。 この記事は自然言語処理初学者向けであり、自然言語処理に関す

TF-IDFを使ったテキストベクトル化

2020-08-09
テキスト分類問題等で使うことが多いテキストベクトル化について説明します。 1. テキストベクトル化 テキストベクトル化とは主に自然言語処理で使われる

このサイトについて

2020-08-07
このサイトでは機械学習に取り組んでいる中で自分たちが勉強した内容をまとめた記事を公開しています。 書いてる人 asmsuechanとyokopo

【入門】Keras LSTMを用いたテキスト分類

2020-08-07
概要 今回紹介するnotebookは[For Beginners] Tackling Toxic Using Kerasです。このnotebookではKerasのLSTMを用いたテキスト分類について書