レコメンデーションまとめ書き

Lastmod: 2025-05-01

概要

レコメンデーションとはECサイトなどでおすすめしてくる「あれ」である。レコメンデーションの手法について調べたのでここにざっとまとめる。

要するに人気ランキング。特に触れない。

一番シンプルなレコメンデーションの手法です。レコメンドする側があらかじめ「この属性の人には、これをおすすめする」というルールを決めておき、そのルールに基づき配信することです。

メリット

デメリット

ルールで決めたものしか配信できない。いわゆるパーソナライズはされていない。その分目に止まるアイテムの数が少なくなってしまい、嗜好性の幅を狭めてしまう可能性がある。
ルールの管理がめんどくさい。嗜好性の幅を狭めてしまわないように逐次データと見比べながら設定をする必要がある。またルールが増えてくるとルール自体の管理も煩雑になる。

コンテンツベースフィルタリングでは、その名の通りコンテンツの類似度をベースとしたレコメンデーションです。例えばユーザが過去選んだ商品と類似度の高い商品を選択したり、ユーザが選択したカテゴリをもとに類似度の高い商品を選択したりといったことです。

メリット

デメリット

多様性を持たせることができない。あくまでも一人のユーザが選んだ商品をベースにしているので、どうしても過去選んだ商品に類似してしまう。
ドメイン知識が必要になる。コンテンツの類似度の計算の際に、コンテンツをベクトル変換する必要がある。つまりそのコンテンツに対して適切なベクトルにするドメイン知識が必要になる。

協調フィルタリングはコンテンツベースとは違い、ユーザの評価（ユーザが買ったか、満足度等）のデータを用いてレコメンドを行います。つまりレコメンドする側が明示的にコンテンツをベクトル表記する必要がなくなるということです。

また協調フィリタリングはさらに2つの手法に分解することが可能です。

その名の通り、メモリにデータセットをそのまま落とし込んで推論するイメージです。近傍ベースでもさらに2つの手法に分割することができます。

メリット

デメリット

モデルベースでは、データセットからあらかじめ何らかの情報を抽出しておいて、その情報に基づきレコメンドを行います。メモリベースではデータセットそのまま使っていたのに対して、モデルベースではデータセットからモデリングするというワンクッションが挟まります。いくつかのモデルを例示しておきます。

メリット

デメリット

ハイブリッド型とは、要するに複数のレコメンド手法のいいとこ取りをすることであり、協調フィリタリングとコンテンツベースのハイブリッドだったり、メモリベースとモデルベースのハイブリッドだったりする。

レコメンデーションシステムに関してざっとまとめた。細かい部分に関してはまた実務等で必要になったら深めていきたい。