タイトル | 統計的決定理論に基づく複数のクラスに属する文書の分類方法に関する一考察 |
---|---|
著者 | 前田康成 、吉田秀樹 、藤原祥隆 、松嶋敏泰 |
年度 | 2005 |
形式 | 国内学会 |
分野 | 知識情報処理 |
掲載雑誌名 | 電子情報通信学会技術研究報告 |
掲載号・ページ | vol.105, no.665, IT2005-89, pp.147-152 |
掲載年 | 2006 |
掲載月 | 3 |
アブスト (日本語) |
学会名:電子情報通信学会技術研究報告 日程:2006年3月16日 場所: 【不明点】 近年,人工知能の自然言語処理の分野において,複数クラスに属する文書の分類問題に関する研究が数多く行われている.文書の生成に確率モデルを採用した従来研究では確率モデルの未知パラメータの推定と文書分類という二つの問題に分けて検討しており,一つの統計的決定問題として定式化していない.また,文書内におけるクラスの変化も十分に表現できないモデルである.そこで,本研究ではクラスの変化が表現可能なモデルを採用し,統計的決定理論に基づき一つの統計的決定問題として定式化し直すことによって,誤り率をベイズ基準のもとで最小にする分類方法を導出するとともに,計算量を削減した近似アルゴリズムも提案する. |
アブスト (英語) |
In this paper we treat multi-topic document classification problem. In previous researches some theoretical optimality is guaranteed when the number of data for learning is infinite. We propose new multi-topic document classification methods that minimize error rate with reference to the Bayes criterion when the number of data for learning is finite. And we also propose approximate algorithms in order to reduce computational complexity. |
備考 (日本語) |
1 |
備考 (英語) |
1 |
論文原稿 | |
発表資料 |
関連論文
- 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム
- 区間で一定なパラメータを持つ非定常情報源の漸近的な性質について
- Asymptotic Property of Universal Lossless Coding for Independent Piecewise Identically Distributed Sources
- 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム
- A Note on Spelling Correction Methods based upon Statistical Decision Theory
- A Note on Morphological Analysis Methods based on Statistical Decision Theory
- 未知パラメータを伴う隠れマルコフモデルの状態推定に関する一考察
- スペルミスを伴う形態素解析に関する一考察
- ブロック誤り率が未知の場合の選択再送ARQに関する一考察