1. [ホーム]
  2. [研究業績]
  3. [研究業績詳細]

研究業績詳細

タイトル 統計的決定理論に基づく複数のクラスに属する文書の分類方法に関する一考察
著者 前田康成 、吉田秀樹 、藤原祥隆 、松嶋敏泰
年度 2005
形式 国内学会
分野 知識情報処理
掲載雑誌名 電子情報通信学会技術研究報告
掲載号・ページ vol.105, no.665, IT2005-89, pp.147-152
掲載年 2006
掲載月 3
アブスト
(日本語)
学会名:電子情報通信学会技術研究報告
日程:2006年3月16日
場所:


【不明点】



近年,人工知能の自然言語処理の分野において,複数クラスに属する文書の分類問題に関する研究が数多く行われている.文書の生成に確率モデルを採用した従来研究では確率モデルの未知パラメータの推定と文書分類という二つの問題に分けて検討しており,一つの統計的決定問題として定式化していない.また,文書内におけるクラスの変化も十分に表現できないモデルである.そこで,本研究ではクラスの変化が表現可能なモデルを採用し,統計的決定理論に基づき一つの統計的決定問題として定式化し直すことによって,誤り率をベイズ基準のもとで最小にする分類方法を導出するとともに,計算量を削減した近似アルゴリズムも提案する.
アブスト
(英語)
In this paper we treat multi-topic document classification problem. In previous researches some theoretical optimality is guaranteed when the number of data for learning is infinite. We propose new multi-topic document classification methods that minimize error rate with reference to the Bayes criterion when the number of data for learning is finite. And we also propose approximate algorithms in order to reduce computational complexity.
備考
(日本語)
1
備考
(英語)
1
論文原稿
発表資料