抄録/ポイント:
抄録/ポイント
文献の概要を数百字程度の日本語でまとめたものです。
部分表示の続きは、JDreamⅢ(有料)でご覧頂けます。
J-GLOBALでは書誌(タイトル、著者名等)登載から半年以上経過後に表示されますが、医療系文献の場合はMyJ-GLOBALでのログインが必要です。
推薦における公平性の問題は,レコメンダーシステムタッチとしてますます不可欠になっており,日常生活においてますます多くの人々に影響する。公平性意識推薦において,既存のアルゴリズムアプローチの殆どは,主要な推薦目的,例えばCTRを最適化しながら,公平性のレベルに関する制約を課すことによって,制約付き最適化問題を主に解決することを目指している。これは,不公平な推薦の影響を軽減するが,アプローチの期待したリターンは,公平性とユーティリティの間の固有のトレードオフのために推薦精度を著しく妥協するかもしれない。これは,これらの相反する目的に対処して,推薦におけるそれらの間の最適なトレードオフを探究する。1つの目立つ手法は,ユーティリティと公平性の間の最適妥協を保証するためのPareto効率的解を求めることである。さらに,実世界e-コマースプラットフォームのニーズを考慮して,意思決定者が現在のビジネスニーズに基づいてもう1つの目的の選好を特定できるように,全体のパレートフロンティアを一般化できるならば,より望ましいであろう。従って,本研究では,MoFIRと呼ばれる多目的強化学習を用いた公平性意識推薦フレームワークを提案し,これは全ての可能な選好の空間における最適推薦ポリシーに対する単一パラメトリック表現を学習できる。特に,条件付きネットワークを導入することによって従来のDDPGを修正し,ネットワークを直接これらの選好と出力Q値ベクトルに条件づける。いくつかの実世界推薦データセットに関する実験は,すべての他のベースラインと比較したとき,公平性計量と推薦測度の両方に関する著者らのフレームワークの優位性を証明した。また,MoFIRにより生成された実世界データセット上で近似パレートフロンティアを抽出し,最先端の公平性法と比較した。【JST・京大機械翻訳】