Vous créez un crawler pour importer du contenu provenant de référentiels externes dans le portail. Vous devez exécuter une tâche associée au crawler pour faire des recherches périodiques de contenu dans le référentiel externe et pouvoir importer ce contenu. Pour en savoir davantage sur les tâches, consultez la rubrique À propos des tâches.
Remarque : Les crawlers dépendent des sources de données. Pour en savoir davantage sur les sources de contenu, consultez la rubrique À propos des sources de contenu.
Cette rubrique traite des sujets suivants :
Pour savoir comment créer ou modifier des objets administratifs (y compris les crawlers), cliquez ici.
Un crawler web permet aux utilisateurs d'importer dans le portail du contenu venant du web.
Pour en savoir davantage sur l'éditeur de crawler web, cliquez sur une des pages de l'éditeur ci-dessous :
Un crawler distant permet aux utilisateurs d'importer dans le portail du contenu venant d'un référentiel externe.
Alors que certains fournisseurs d'analyse sont installés avec le portail et à la disposition des utilisateurs du portail, d'autres doivent être installés et configurés manuellement. Par exemple, BEA propose les fournisseurs d'analyse suivants :
Remarque : Pour savoir comment vous procurer des fournisseurs d'analyse, adressez-vous à ALUIsupport@bea.com. Pour plus de renseignements sur l'installation des fournisseurs d'analyse, consultez le document Installation Guide for AquaLogic Interaction (edocs.bea.com) ou la documentation fournie avec le fournisseur d'analyse, ou contactez l'administrateur du portail.
Marche à suivre pour créer un crawler distant :
Pour en savoir davantage sur l'éditeur de crawler distant, cliquez sur une des pages de l'éditeur ci-dessous :
Les fournisseurs d'analyse ci-dessous, quand ils sont installés, comprennent au moins une page supplémentaire vers l'éditeur de crawler distant.
Fichier Windows NT (compris avec le logiciel du portail)
Les services web de crawler de contenu permettent de spécifier les paramètres généraux du référentiel de contenu distant alors que les paramètres de destination et de sécurité sont établis dans la source de contenu distante et le crawler distant associés. Ceci vous permet d'analyser plusieurs emplacements d'un même référentiel de contenu sans avoir à spécifier plusieurs fois les mêmes paramètres.
Remarque : Vos sources de contenu distantes reposent sur les services web de crawler de contenu que vous créez. Pour en savoir davantage sur les sources de contenu, consultez la rubrique À propos des sources de contenu.
Pour en savoir davantage sur l'éditeur de service web de crawler de contenu, cliquez sur une des pages de l'éditeur ci-dessous :
Les utilisateurs peuvent obtenir un accès automatique au contenu importé par certains crawlers distants. Le tableau de synchronisation ACL général indique aux crawlers les modalités d'importation des paramètres de sécurité des documents source.
Pour voir un exemple d'importation des paramètres de sécurité, consultez la rubrique Exemple d'importation des paramètres de sécurité.
Si votre crawler n'importe pas le contenu attendu, plusieurs choses sont à vérifier :
Vérifiez que les filtres des dossiers exécutent un filtrage correct du contenu. Pour savoir comment tester vos filtres, consultez la section Test des filtres de la page Paramètres principaux (filtre).
Vérifiez que le crawler n'a pas placé de contenu indésirable dans le dossier destinataire. Si, par suite du filtrage, un document n'est ventilé dans aucun sous-dossier, il est possible que le crawler place ce document dans le dossier destinataire. Ce paramétrage est défini sur la page Paramètres principaux de l'éditeur de dossier.
Vérifiez que le crawler n'a pas placé de contenu dans le dossier des documents non classés. Si un document ne peut être placé dans aucun dossier ou sous-dossier destinataire, il est possible que le crawler place ce document dans le dossier des documents non classés. Ce paramétrage est défini sur la page Paramètres avancés de l'éditeur de crawler. Si vous disposez des autorisations nécessaires, vous pouvez afficher le dossier Documents non classés quand vous modifiez le répertoire de connaissances ou quand vous cliquez sur Administration | Sélectionner un utilitaire | Accès aux documents non classés.
Vous devez au moins disposer de droits de modification sur le dossier destinataire.
En ce qui concerne les crawlers web, vérifiez que les protocoles d'exclusion de robot ou que certaines instructions d'exclusion ou d'inclusion n'empêchent pas le crawler d'importer le contenu escompté. Ce paramétrage est défini sur la page Exclusions de pages web de l'éditeur de crawler.
Vérifiez que les informations d'authentification spécifiées dans la source de contenu associée permettent au portail d'accéder au contenu.
Pour plus de détails, consultez l'historique des tâches.