---------------------------------------------------------------------

next up previous contents
Next: 謝辞 Up: 結論 Previous: まとめ

---------------------------------------------------------------------

今後の課題

本論文では、空白や改行で区切られる文字列や、一連の英字、同種日本語文字を アトムとして実験を行なった。 この場合、英語の文書に対しては、自然言語的手法による単語抽出とほぼ同じ解 析結果となっているが、日本語の文書に対してはそうではない。 そこで、茶筌 [12]のような日本語構文解析器を解析子の1つとして実 験を行なうことを考えている。

本研究の大きな枠組は、分類の観点の多様性をアトム、引いては解析子の自由度 で吸収するというものである。 本論文では5種類の解析子のみを用いて実験を行なったが、より多くの種類の解 析子を用いて、さらに対象文書を多様にした場合についても実験を行いたい。 最終的には、その枠組を理論的な体系として構築できれば良いと考えている。

---------------------------------------------------------------------

吉田 誠一のホームページ に戻る。
Copyright(C) Seiichi Yoshida (comet@aerith.net). All rights reserved.
Sat Mar 8 05:59:11 JST 1997