Erstellen Sie einen Crawler, um Inhalt aus externen Inhalts-Repositories in Ihr Portal zu importieren. Sie müssen einen dem Crawler zugeordneten Auftrag ausführen, um im externen Repository regelmäßig nach Inhalt zu suchen und diesen Inhalt zu importieren. Weitere Informationen zu Aufträgen finden Sie unter Infos zu Aufträgen.
Hinweis: Crawler sind von Datenquellen abhängig. Weitere Informationen zu Inhaltsquellen finden Sie unter Infos zu Inhaltsquellen.
In diesem Thema werden die folgenden Bereiche behandelt:
Weitere Informationen zum Erstellen oder Bearbeiten von Administrationsobjekten (einschließlich Crawlern) finden Sie hier.
Web-Crawler ermöglichen Benutzern das Importieren von Inhalt aus dem Internet in das Portal.
Weitere Informationen zum Editor für den Web-Crawler finden Sie auf den folgenden Editor-Seiten:
Mit einem Remote-Crawler lässt sich Inhalt aus einem externen Inhalts-Repository in das Portal importieren.
Einige Crawl-Provider werden direkt mit dem Portal installiert und stehen Portalbenutzern sofort zur Verfügung, andere müssen erst manuell installiert und eingerichtet werden. Die folgenden Crawl-Provider werden beispielsweise von BEA bereitgestellt:
Hinweis: Informationen über den Bezug von Crawl-Providern erhalten Sie vom ALUIsupport@bea.com. Informationen zur Installation von Crawl-Providern erhalten Sie in Installation Guide for AquaLogic Interaction (edocs.bea.com), in der Dokumentation des Crawl-Providers oder direkt von Ihrem Portal-Administrator.
So erstellen Sie einen Remote-Crawler:
Weitere Informationen zum Editor für den Remote-Crawler finden Sie auf den folgenden Editor-Seiten:
Folgende Crawl-Provider fügen dem Remote-Crawler-Editor zumindest eine zusätzliche Seite hinzu, wenn sie installiert werden:
Windows NT-Datei (in der Portal-Software enthalten)
Inhalts-Crawler-Web-Services ermöglichen Ihnen das Festlegen von allgemeinen Einstellungen für Ihr Remote-Inhalts-Repository. Die Einstellungen für Ziel und Sicherheit werden dann in der zugeordneten Remote-Inhaltsquelle und im Remote-Crawler eingerichtet. So können Sie mehrere Bereiche desselben Inhalts-Repository durchsuchen, ohne die Einstellungen immer wieder neu angeben zu müssen.
Hinweis: Die von Ihnen erstellten Inhalts-Crawler-Web-Services dienen als Grundlage für Ihre Remote-Inhaltsquellen. Weitere Informationen zu Inhaltsquellen finden Sie unter Infos zu Inhaltsquellen.
Weitere Informationen zum Editor für den Inhalts-Crawler-Web-Service finden Sie auf den folgenden Editor-Seiten:
Benutzer können automatisch Zugriff auf den von bestimmten Remote-Crawler importierten Inhalt erhalten. Die Globale ACL Sync-Zuordnung zeigt diesen Crawlern, wie Sicherheitseinstellungen von Quelldokumenten importiert werden sollen.
Ein Beispiel zum Importieren von Sicherheitseinstellungen finden Sie unter Beispiel für das Importieren von Sicherheitseinstellungen.
Sie sollten Folgendes überprüfen, wenn Ihr Crawler nicht den gewünschten Inhalt importiert:
Überprüfen Sie, ob die Filter in Ihren Ordnern richtig eingestellt sind. Informationen zum Testen Ihrer Filter finden Sie auf der Seite „Haupteinstellungen (Filter)“ im Abschnitt Testen von Filtern.
Vergewissern Sie sich, dass Ihr Crawler keinen unerwünschten Inhalt im Zielordner abgelegt hat. Werden Dokumente nicht in Unterordner gefiltert, legt der Crawler sie möglicherweise im Zielordner ab. Dies wird durch eine Einstellung auf der Seite Haupteinstellungen im Ordner-Editor festgelegt.
Vergewissern Sie sich, dass Ihr Crawler keinen unerwünschten Inhalt im Ordner „Nicht klassifizierte Dokumente“ abgelegt hat. Können Dokumente weder in den Ziel- noch in den Unterordnern abgelegt werden, verschiebt der Crawler diese unter Umständen in den Ordner „Nicht klassifizierte Dokumente“. Dies wird durch eine Einstellung auf der Seite Erweiterte Einstellungen im Crawler-Editor festgelegt. Wenn Sie über die entsprechenden Berechtigungen verfügen, können Sie den Ordner „Nicht klassifizierte Dokumente“ beim Bearbeiten des Wissensverzeichnisses oder durch Klicken auf Administration | Dienstprogramm auswählen | Auf nicht klassifizierte Dokumente zugreifen anzeigen.
Stellen Sie sicher, dass Sie mindestens über die Bearbeitungsberechtigung für den Zielordner verfügen.
Bei Web-Crawlern müssen Sie auch darauf achten, dass keine automatischen Ausschlussprotokolle oder andere Ausschlüsse bzw. Aufnahmen den Crawler am Importieren des erwarteten Inhalts hindern. Dies wird durch eine Einstellung auf der Seite „Ausschluss von Webseiten“ im Crawler-Editor festgelegt.
Außerdem müssen die in der zugeordneten Inhaltsquelle angegebenen Authentifizierungsinformationen dem Portal einen Zugriff auf den Inhalt ermöglichen.
Im Auftragsverlauf finden Sie dazu weitere Informationen.