詳細設定 (クローラ)

コンテンツの言語、拒否されたドキュメントの処理方法、およびクローラ タグを指定します。

  1. [コンテンツの言語] のドロップダウンリストから、インポートするコンテンツで頻繁に使用されている言語を選択します。

  2. [拒否されたドキュメント] で、フォルダに分類されなかったドキュメントの処理方法を指定します。

  3. 既存のクローラを編集している場合は、[ドキュメントのインポート] セクションが表示されます。[ドキュメントのインポート] で、新規ドキュメントのみがインポートされるようにするかどうかを指定します。デフォルトでは、クローラによって (このクローラ、あるいは同じコンテンツ ソースにアクセスする他のクローラによってこれまでにインポートされたことがない) 新規のドキュメントのみがインポートされます。各ドキュメントが複数のコピーをインポートするようにクローラの設定を変更することができるため、クローラのテスト時に役立ちます。

    1. 新規ドキュメントのみをインポートするには、[新規リンクだけをインポートする] チェック ボックスをオンにして、新規オプションを表示します。このようなインポートを行わない場合は、手順 4 に進みます。

    2. 新規リンクの定義を指定するには、次の操作を実行します。

    3. 注意: ここで選択したオプションは、手順 3f および手順 4 の操作に影響します。

    4. これまでにインポートされたドキュメントを [ドキュメント設定] ページの設定内容で更新するには、[これらのドキュメントを更新する] オプションをオンにします。通常、ドキュメントの更新はドキュメント更新エージェントによって処理されるジョブであるため、ドキュメントを更新すると、クローラの処理速度が遅くなります。ただし、このクローラのドキュメント設定を変更したり、関連するコンテンツ タイプ内のプロパティマップを変更した場合は、ドキュメントを更新すると、これまでにインポートされたドキュメント設定も更新されます。

    5. 追加フォルダを作成したり、別のフィルタを宛先フォルダに適用した場合は、[これらのドキュメントを追加のフォルダでソートする] チェック ボックスをオンにして、これまでにインポートされたドキュメントを新規のナレッジ ディレクトリ フォルダに分類します。

      別のクローラによって同じデータソースからドキュメントがインポートされ、このクローラに指定された宛先フォルダ以外のフォルダに保存されることがあります。ドキュメントを再ソートして、このクローラに指定された宛先フォルダに格納する必要があるかどうかを確認してください。

    6. (手動による操作、期限切れ、またはソース ドキュメントの喪失などの理由により) これまでに削除されたドキュメントを再インポートするには、[削除されたリンクを再生成する] オプションをオンにします。これにより、ポータルで不要と見なされたドキュメントを再インポートできるようになることがあります。

    7. どうしても必要な場合は、ポータルからすでに削除されたドキュメントに関するレコードを削除できます。[履歴] は、手順 3b で新規ドキュメントとして指定したときの内容で定義されます。

    8. ポータルから削除されたドキュメントに関するレコードを削除するには、[削除履歴のクリア] をクリックします。

  4. 既存のクローラを編集している場合は、[拒否されたドキュメント] で追加のオプションが表示されます。[拒否されたドキュメント] で、このクローラが以前に拒否されたドキュメントを検出した場合、どのように処理するかを指定します。この場合、以前に拒否されたドキュメントの定義は、手順 3b で選択したオプションによって異なります。

    1. 以前に拒否されたドキュメントを同じクローラによってインポートするには、[再インポート] チェック ボックスをオンにします。

    2. 拒否に関する履歴を削除するには、[拒否履歴のクリア] をクリックします。手順 3b で [このコンテンツ ソース] を選択した場合、このコンテンツ ソースからドキュメントをインポートするすべてのクローラの拒否履歴が削除されるため、注意が必要です。

    注意: ドキュメントがどのフォルダにも分類されず、未分類ドキュメントフォルダに格納された場合、そのドキュメントは拒否されたものとして見なされません。拒否されたドキュメントとは、どのフォルダにも格納されないドキュメントを指します。

  5. インポート済みのドキュメントにクローラ タグのマークを付けるには、[インポートされたドキュメントを次のクローラ タグでマーク] ボックスにタグを入力します。このタグは、このクローラによってインポートされたドキュメントと別のクローラによってインポートされたドキュメントを区別するために使用されます。

  6. [ランタイムの設定] で、次の設定を実行します。

これらのフィールドに入力できる範囲は、portalconfig.xml ファイルで設定できます。ここで設定される値は、このクローラ ジョブで使用される utomation Service 最大スレッド数によっても制限されます。


  1. [管理] をクリックします
  2. クローラのエディタを開きます。
  3. 左側にある [オブジェクト設定の編集] で、[詳細設定] をクリックします。