全文検索
あらかじめキーワードを付与するのではなく,文書の全体からキーワードを取り出して検索する方法。WWWロボットで集めた情報はHTML(Hyper Text Markup Language)言語で書かれた文書情報がほとんど。HTMLはタグと呼ばれる構造を持ち,他の文書とURL(Uniform Resource Locator)と呼ばれるリンクによってネットワーク状につながっている。この情報を効率良く検索するために,全文検索という手法が一般的にとられる。NTTヒューマンインタフェース研究所(当時)で開発された全文検索システムであるInfoBeeでは,文書内の単語をあらかじめ自動抽出した単語インデックスを用いて,フリーワード検索を行う。
◆ 《フリーワード検索》
あらかじめ決められた単語だけではなく,文書内のすべての単語が検索対象となる検索方式。