株式会社アトラス WEBアプリケーション開発株式会社アトラス
アトラスホームページ
  ┣ 会社概要
  ┗ 営業案内
 携帯サイト構築、
モバイルサービス


TOP > ホームページ内の全文検索

ホームページ内の全文検索

 ホームページ内のページ数が増えてくると、訪問者の利便性を考えてホームページ内検索(サイト内検索)を設置したいというご要望が出てきます。

 検索エンジン Google などが行っているサイト内検索機能サービスを利用すると簡単に無料で実現することが可能ですが、企業サイトに設置するには次のような理由から少々抵抗を持たれる場合があるようです。

検索結果ページが Google サイトになるため一旦自社のサイトを離れることになる。
検索結果ページに Google 側の広告が表示される場合がある。更にどのような広告が表示されるか分からない。
検索結果ページのデザイン変更ができない。
サイト内のページを更新しても Google 側のデータにいつ反映されるか分からない。

 そこで少々コストがかかっても自前でホームページ内検索を実現させたいというご要望が増えています。

 下記に事例をご紹介します。

 (事例1) Namazu(ナマズ)を使って低コストで実現
CGIの利用可UNIX系サーバでの利用可Windows系サーバでの利用可
コストを抑えるため無償で提供されているフリーウェアの日本語全文検索システム Namazu を設置します。
また同時にフリーウェアの KAKASI という辞書も使用します。

◆特徴
1. Namazu はフリーウェアでありながら実績のある高機能で高速な優れた全文検索システムで、多くの学校・企業サイトで利用されています。
2. 形態素解析(単語に分割すること)の機能が含まれるため検索結果の精度が非常に高まります。
3. サイト全体ではなく各部署ごとに検索機能を付けたいというご要望にも対応が可能です。
4. 検索結果ページをカスタマイズすることが可能です。
5. html 等テキストファイル以外にも Excel、Word、PowerPoint、PDF などのファイルを検索対象に含めることが可能です。

◆注意すべき点
1. サーバに Namazu をインストールする必要があるため一般的なホスティングサービスの共有レンタルサーバでは利用できない場合が多いようです。
2. インデクシング(予め検索対象ページを検索しやすいデータにする見出し作成)という作業が必要になります。これを実行しないとホームページを更新しても検索結果には反映されません。

◆便利な機能追加のお勧め
1. インデクシングは対象ページが多いと実行にかなりの時間を要します。これをサーバのタイマー機能を利用して深夜など負荷の少ない時間帯に自動的に実行するよう設定が可能です。
2. ホームページを更新してもインデクシングを行わなければ検索結果には反映されません。そこで管理画面からボタン一つでインデクシングを実行するメニューがあると便利です。更新ページが少数ならばインデクシング時間も短くサーバの負荷も気になりません。前述 1. のタイマー機能と併用が可能です。
3. ホームページ内検索のメリットは単に利用者の利便性だけではありません。訪問者がどのようなキーワードで検索を試みたのかという情報を知ることができれば、営業戦略あるいは商品開発などに大きなヒントを与えてくれます。弊社では検索キーワード記録機能の追加をお勧めします。


 (事例2) 自前のプログラムで小規模な検索を実現
CGIの利用可UNIX系サーバでの利用可Windows系サーバでの利用可共有サーバでの利用可
(事例1)の Namazu は優れた全文検索システムで、これと同等あるいはそれ以上のシステムを開発するには大変なコストがかかります。しかし企業方針から「フリーウェアは避けたい」、「だがコストは抑えたい」、あるいは「レンタルサーバで実現したい」というご要望もあり、小規模なサイトという条件のもとでそれらを実現します。

◆特徴
1. 共有レンタルサーバでもCGIが使用できるサーバなら利用可能です。
2. 予め検索対象ページを管理画面で登録し、検索しやすいデータにインデクシングします。但し Namazu のような形態素解析(単語に分割すること)は行いません。
3. 検索対象はページ単位で登録できますので、検索結果に含めたくないページを排除することができます。
4. 検索結果ページは自由にデザイン可能で、サイト全体のデザインイメージに合わせることができます。
5. 検索キーワードを記録します。そのデータは管理画面からいつでも閲覧・ダウンロード可能です。

◆注意すべき点
1. 小規模サイトが条件で、検索対象ページは数100ページが限界と考えます。1000ページを超えるようなサイトには向きません。そのようなサイトにはコストがかかりますがデータベースの利用も要検討です。
2. 形態素解析を行いませんので、予期しない検索結果が表れる場合があります。
3. 検索対象は html などのテキストファイルに限定します。



お問い合わせ、ご用命はこちらまで
株式会社アトラス ITソリューション事業部
〒103-0014
東京都中央区日本橋蛎殻町1-39-5 水天宮北辰ビル2F
TEL 03-5642-9365
FAX 03-5642-9367
E-Mail:sales@atlas.jp

フォームからのお問い合わせにはこちらをご利用ください。
各種お問い合わせ