---------------------------------------------------------------------

next up previous contents
Next: クラスタリング Up: 従来の研究 Previous: 従来の研究

---------------------------------------------------------------------

データマイニング

文書の分類に関する研究は、広い意味でデータマイニング[2] と呼ばれる分野に属するテーマである。 データマイニングとは、与えられた集合から何らかの手法を用いてそこに隠され ている規則を抽出することである。 文書の分類に限定して考えると、与えられた文書集合から、文書間の相似性を見 出したり、文書を分類するための規則を抽出する研究と言える。

文書の分類に関する研究は、

  • 分類されていない文書集合を、適当な基準に基づいて分類する
  • 分類されている文書集合から、その分類規則を抽出する
の2つの方向性がある。 前者はクラスタリングと呼ばれる研究分野で、いくつかの手法が一般に広く知ら れている。

---------------------------------------------------------------------

吉田 誠一のホームページ に戻る。
Copyright(C) Seiichi Yoshida (comet@aerith.net). All rights reserved.
Sat Mar 8 05:59:11 JST 1997