タイトル | 学習データが少量しかない場合の文書分類に関する一考察 |
---|---|
著者 | 前田康成 、吉田秀樹 、鈴木正清 、松嶋敏泰 |
年度 | 2011 |
形式 | 論文誌 |
分野 | 知識情報処理 |
掲載雑誌名 | 電気学会論文誌 |
掲載号・ページ | vol.131, no.8, pp.1459-1466 |
掲載年 | 2011 |
掲載月 | 8 |
アブスト (日本語) |
査読:有 DOI:10.1541/ieejeiss.131.1459 |
アブスト (英語) |
Document classification is one of important topics in the field of NLP(Natural Language Processing). In the previous research a document classification method has been proposed which minimizes an error rate with reference to a Bayes criterion. But when the number of documents in training data is small, the accuracy of the previous method is low. So in this research we propose a new document classification method using estimating data in order to estimate prior distributions, which is based on the previous method. When the training data is small the accuracy of the proposed method is higher than the accuracy of the previous method. But when the training data is big the accuracy of the proposed method is lower than the accuracy of the previous method. So in this research we also propose another document classification method whose accuracy is higher than the accuracy of the previous method when the training data is small, and is almost the same as the accuracy of the previous method when the training data is big. |
備考 (日本語) |
3 |
備考 (英語) |
3 |
論文原稿 | |
発表資料 |
関連論文
- 拡張直交配列を用いた混合水準の実験計画法に関する一考察
- 半教師付き学習における一致性を満たすゆう度方程式の解に基づく予測の漸近評価
- A CLASS OF NOISELESS CODES DESIGNED BY DECISION THEORY
- 相互情報量最大に基準を置くユーザインタフェースの効率化
- パターンごと・ステージごとに事後確率のしきい値をおくストッピングルール
- MDLの帰納推論への応用
- 信頼性を考慮した推論について
- 推論の信頼性を考慮した不確実な知識の表現法と推論法について
- 特集にあたって
- ベイズ決定理論に基づく統計的モデル選択について
- Berlekamp-Masseyアルゴリズムを用いたBCH限界を超える復号法の計算量について
- BCH限界を超える復号法とその軟判定復号法への応用
- BCH限界を超える復号アルゴリズムを用いた2元BCH符号の軟判定復号法
- 事前分布が異なる場合のMDL原理に基づく符号とベイズ符号の符号長に関する解析
- 木符号におけるリスト復号法を用いた判定帰還方式について
- 損失関数を考慮した拡張事後密度の漸近正規性
- ゆう度比検定を用いた木符号の復号法について
- ビタビアルゴリズムを用いた可変サイズのリスト復号における誤り指数について
- ブロックターボ符号のインタリーバ構成法と最小距離
- あいまいな命題を含む推論モデルに関する一考察