La pagina illustra come creare un crawler per importare contenuto nel portale da repository di contenuto esterne. Si dovrà eseguire un job associato al crawler per eseguire ricerche periodiche nella repository esterna sul contenuto, e importare quel contenuto. Per informazioni sui job, consultare Informazioni sui job.
Nota: i crawler dipendono dalle origini dati. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.
Quest'argomento tratta le seguenti informazioni:
Per imparare a creare o modificare oggetti amministrativi (crawler inclusi), fare clic qui.
Un crawler Web consente agli utenti di importare contenuto dal Web nel portale.
Per saperne di più sull'Editor Crawler Web, fare clic su una delle seguenti pagine editor:
Un crawler remoto consente agli utenti di importare contenuto da una repository di contenuto esterna nel portale.
Alcuni provider di analisi vengono installati con il portale e sono immediatamente disponibili per i suoi utenti; altri provider richiedono installazione ed impostazione manuale. Ad esempio, BEA offre i provider di analisi indicati di seguito.
Nota: per ulteriori informazioni su come ottenere provider di analisi, contattare ALUIsupport@bea.com. Per informazioni su come installare i provider di autenticazione, fare riferimento all'Installation Guide for AquaLogic Interaction (edocs.bea.com) oppure alla documentazione in dotazione al provider di autenticazione, o, ancora, contattare l'amministratore del portale.
Per creare un crawler remoto, eseguire i passaggi indicati di seguito.
Per saperne di più sull'Editor Crawler remoto, fare clic su una delle seguenti pagine editor:
Ogni provider di analisi seguente, se installato, include almeno una pagina extra per l'Editor Crawler remoto.
File Windows NT (in dotazione al software del portale)
I Web service Crawler di contenuto consentono di specificare le impostazioni generali per la repository di contenuto remoto, lasciando le impostazioni di destinazione e sicurezza all'origine contenuto remota associata ed al crawler remoto. Questo consente di analizzare più posizioni della stessa repository di contenuto senza dover ripetutamente specificare tutte le impostazioni.
Nota: l'utente crea Web service Crawlerdi contenuto su cui basare le proprie origini contenuto remote. Per informazioni sulle origini dati consultare Informazioni sulle origini contenuto.
Per saperne di più sull'Editor dei Web service Crawler di contenuto, fare clic su una delle seguenti pagine editor:
Agli utenti può essere automaticamente concesso l'accesso al contenuto importato da alcuni crawler remoti. La Mappa ACL di sincronizzazione globale mostra a questi crawler come importare la sicurezza dei documenti d'origine.
Se si desidera vedere un esempio di importazione della sicurezza, fare clic su Esempio di importazione della sicurezza.
Se il crawler non dovesse importare il contenuto previsto, si consiglia di controllare quanto segue.
Verificare che i filtri delle cartelle eseguano correttamente il filtraggio del contenuto. Per saperne di più su come controllare i filtri, consultare la sezione Controllo dei filtri nella pagina Impostazioni principali (Filtro).
Verificare che il crawler non abbia collocato contenuto indesiderato nella cartella di destinazione. Se un documento non passa i filtri di qualsiasi sottocartella, il crawler potrà collocare il documento in una cartella di destinazione. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Cartella.
Verificare che il crawler non abbia collocato contenuto nella cartella Documenti non classificati. Se un documento non può essere collocato in alcuna cartella o sottocartella di destinazione, il crawler potrebbe collocarlo nella cartella Documenti non classificati. Questo viene determinato da un'impostazione sulla pagina Impostazioni principali dell'Editor Crawler. Se l'utente dispone delle autorizzazioni appropriate, potrà vedere la cartella Documenti non classificati quando modifica la directory di conoscenza, oppure quando fa clic su Amministrazione | Seleziona utility | Accedi a Documenti non classificati.
Assicurarsi di disporre almeno dell'accesso di tipo Modifica alla cartella di destinazione.
Per i crawler Web, verificare che i protocolli di esclusione robot o qualsiasi esclusione o inclusione non impediscano al crawler di importare il contenuto previsto. Questo viene determinato da un'impostazione sulla pagina Esclusioni pagina Web dell'Editor Crawler.
Verificare che le informazioni di autenticazione specificate nell'origine contenuto associata consentano al portale di accedere al contenuto.
Rivedere la cronologia job per ulteriori informazioni.