Pour effectuer une collecte, il est nécessaire avant tout d’avoir un corpus de sources que l’outil ira interroger. L’enregistrement des sources se fait via le module « Administrer ».
La plate-forme AMIEI permet d’ajouter principalement trois formats de sources :
- liens : l’outil indexe le contenu de pages comportant des liens ainsi que le contenu des pages ou les documents (PDF, traitement de texte, tableur, diapositives) vers lesquels ces liens dirigent ;
- RSS : l’outil indexe des flux RSS ;
- page : l’outil indexe le contenu d’une page. Cela se prête particulièrement aux pages statiques.
AMI est capable d’indexer le contenu de sources accessibles par le biais de formulaires. Ce sont des sources dites complexes. Cela s’avère très utile, par exemple, dans le cas où vous seriez abonné à une revue proposant un accès web avec identifiant et mot de passe. AMI est ainsi capable d’interroger le web visible et le web invisible.
Une fois vos sources enregistrées, vous pouvez les rassembler dans des favoris via le module « Favoris ». Un favori est un groupe de sources.
Exemple : en créant un favori « Presse française nationale » vous pourrez y classer toutes les sources de type sites web des Échos, du Monde, de L’Express…
Une fois votre sourcing en place, vous pouvez démarrer la collecte de documents.
La collecte est effectuée selon deux méthodes :
- par des plans de collecte pour une collecte régulière automatisée, et donc une démarche de veille, cela via le module « Collecter » ;
- ou par une recherche via le module « Rechercher ». Cette recherche d’information ad hoc permet de tester votre requête avant de la transférer vers un plan de collecte.
Le plan de collecte est une structure arborescente permettant de paramétrer ses requêtes. Pour chaque sujet, le veilleur paramètre la périodicité de ses requêtes ainsi que le(s) critère(s) de sélection des documents disponibles, en définissant des scénarios de collecte.
Le paramétrage d’un scénario consiste à :
- sélectionner les sources à interroger, en choisissant le(s) favori(s) adapté(s) au sujet ;
- spécifier l’activité du scénario (seuls les scénarios actifs seront exécutés) ;
- formuler une requête.
Formulation de la requête
La formulation de la requête s’effectue en imposant une contrainte stricte, une contrainte faible ou une combinaison des deux :
- la contrainte stricte est une requête en langage booléen ou naturel. Très restrictive, elle est particulièrement utile quand le veilleur connaît des termes spécifiques qu’il veut voir (ou non) figurer dans le document. Le nom d’une société constitue, par exemple, une contrainte stricte.
Le langage booléen d’AMI comprend les instructions AND, OR et NOT, ainsi que les guillemets, le parenthésage et la troncature. De plus, un opérateur « AMI » (le point d’interrogation) consiste à demander au système de générer les variations d’un même terme à partir d’une base de connaissances. Cette base, que vous alimentez vous-même, est principalement constituée de synonymes ; - la contrainte faible est également une requête. Très permissive, elle peut consister en un paragraphe entier. Le noyau AMI recherchera des informations semblables. Une contrainte faible est utile quand le veilleur souhaite rassembler des informations ayant une ressemblance avec une information complexe connue. Prenons l’exemple d’une veille sur le cancer, la maladie : la contrainte faible permettra à l’outil de ne pas prendre en compte les documents parlant du signe astrologique du cancer.
Les documents collectés sont conservés dans le « Plan de classement », accessible dans le module « Publier ». Le plan de classement est une arborescence que vous définissez vous-même. Semblable à celle de votre ordinateur, elle est constituée de rubriques et de sous-rubriques. Elle est modifiable à tout instant.