goo(グー)
NTTが「InfoBee日本語処理技術」を使い,米国Inktomi社と共同で開発したWWW対応日本語フルテキスト検索エンジン。gooとは「Global networkが無限大(∞)に拡大し続ける」というインターネットの世界をシンボライズしたもの。ロボット型検索エンジンで,ロボット方式ではロボットまたはスパイダーと呼ばれるソフトウェアが自動的にWWW上のホームページにアクセスしてHTMLテキストデータを収集する。
またgooのロボットは国内の.jpドメインだけでなく,日本語判別の結果に従って,全世界の日本語ホームページへもアクセスしデータ収集を行う。対象となる日本語ホームページは全世界で500万ページ以上存在する。gooのロボットは,それらのホームページのテキストデータを1日で200万~1,000万日本語ホームページ以上収集するという非常に高速な性能を持っている(図)。
現在のWWWのデータベース量は,全体で1億2,000万URL,そのうち国内は1,700万URL。1日当りのアクセス数は800万ページビュー。
◆ 《ロボット型》
自動でWWWホームページを取得してくるプログラムを利用。このためロボットと呼ばれている。WWW上を自由にはい回ることからスパイダー,クローラとも呼ばれている。
◆ 《ADバナー》
WWWホームページ上の広告用グラフィクス。広告主のホームページへリンクしている。