クローラを作成すると、コンテンツが外部コンテンツ レポジトリからポータルにインポートされます。定期的に外部レポジトリのコンテンツおよびコンテンツのインポート内容を検索するには、クローラに関連付けられているジョブを実行する必要があります。ジョブについては、ジョブについてを参照してください。
注意: クローラは、データソースに依存しています。コンテンツ ソースについては、コンテンツ ソースについてを参照してください。
このトピックでは、次の項目について説明します。
クローラなどの管理オブジェクトの作成または編集については、こちらを参照してください。
ウェブ クローラを使用すると、ユーザーはウェブからポータルへコンテンツをインポートできます。
ウェブ クローラのエディタについては、次のエディタに関するページへのリンクを参照してください。
リモート クローラを使用すると、ユーザーは外部のコンテンツ レポジトリからポータルへコンテンツをインポートできます。
クローラ プロバイダには、ポータルとともにインストールされるためにポータル ユーザーがすぐに使用できるものと、その他のクローラ プロバイダについては、ユーザーが手動でインストールとセットアップを行う必要があるものがあります。たとえば、BEA では、次のクローラ プロバイダが提供されています。
注意: クロールのプロバイダの入手については、ALUIsupport@bea.comカスタマ サポートにお問い合わせください。 クロールのプロバイダのインストールについては、『Installation Guide for AquaLogic Interaction (edocs.bea.com)』またはクロールのプロバイダに付属のマニュアルを参照するか、ポータル管理者にお問い合わせください。
リモート クローラを作成するには:
リモート クローラのエディタについては、次のエディタに関するページへのリンクを参照してください。
次のクロール プロバイダがインストールされている場合、少なくとも 1 ページがリモート クローラ エディタに追加されます。
Windows NT ファイル (ポータル ソフトウェアに付属)
コンテンツ クローラ ウェブ サービスを使用すると、リモート コンテンツ レポジトリの一般設定を指定できます。ターゲットおよびセキュリティの各設定については、関連するリモート コンテンツ ソースおよびリモート クローラで設定します。これにより、すべての設定を何度も指定することなく、同じコンテンツ レポジトリ内で複数の場所をクロールできます。
注意: リモート コンテンツ ソースの基になるコンテンツ クローラ ウェブ サービスを作成します。コンテンツ ソースについては、コンテンツ ソースについてを参照してください。
コンテンツ クローラ ウェブ サービスのエディタについては、次のエディタに関するページへのリンクを参照してください。
ユーザーには、一部のリモート クローラによってインポートされたコンテンツにアクセスするための権限が自動的に付与されます。グローバル ACL 同期マップによって、これらのクローラがソース ドキュメントのセキュリティのインポートする方法が示されます。
セキュリティをインポートする方法の例については、セキュリティのインポート例を参照してください。
クローラによって適切なコンテンツがインポートされない場合は、次の点を確認します。
コンテンツにフォルダのフィルタが正しく適用されていることを確認します。フィルタのテストについては、メイン設定 (フィルタ) ページのフィルタのテストに関するセクションを参照してください。
クローラによってターゲット フォルダに不要なコンテンツが格納されていないことを確認します。フィルタによってドキュメントがどのサブフォルダにも格納されなかった場合、クローラによってそのドキュメントがターゲット フォルダに格納されることがあります。この動作は、フォルダのエディタの[メイン設定] ページの設定内容によって行われます。
クローラがコンテンツを未分類ドキュメントのフォルダに格納していないことを確認します。ドキュメントをターゲット フォルダまたはサブフォルダに格納できない場合、クローラによってドキュメントが未分類ドキュメント フォルダに格納されることがあります。この動作は、クローラのエディタの [詳細設定] ページの設定内容によって行われます。適切な権限を与えられたユーザーは、ナレッジ ディレクトリを編集するか、[管理] | [ユーティリティの選択] | [未分類ドキュメントへのアクセス] をクリックして、未分類ドキュメント フォルダを表示することができます。
少なくとも、ターゲット フォルダに対する編集権限があるかどうかを確認してください。
ウェブ クローラの場合は、ロボット排除プロトコルやその他の除外や挿入が行われていることが原因で、クローラによるコンテンツのインポートが妨げられていないことを確認します。この動作は、クローラのエディタのウェブ ページの除外の設定内容によって行われます。
関連するコンテンツ ソースで指定した認証に関する情報を確認して、ポータルからコンテンツにアクセスできることを確認します。
追加情報については、ジョブ履歴を参照してください。