Fouille de textes

Alors que les données quantitatives sont faciles à exploiter grâce aux méthodes statistiques, l’évaluation automatisée de textes libres s’avère bien plus difficile. Ainsi, de mêmes faits peuvent être décrits avec des mots tout à fait différents. Parallèlement, les plus petites nuances de sens peuvent entraîner les plus grandes différences conceptuelles.

C’est ici que la fouille de textes commence. On entend par ce terme la collecte automatisée d’informations à partir du texte libre. Pour ce faire, différents procédés d’analyse basés sur les algorithmes sont utilisés pour identifier et traiter les contenus du texte.

Les sources d’informations standard sont Internet, mais également les données GRC non structurées ou les ensembles de textes, les rapports, etc.

La fouille de textes permet de traiter de manière automatisée de grandes quantités de textes libres Les textes peuvent être catégorisés en fonction de leur contenu. Grâce à l’analyse d’agrégats, des textes similaires peuvent être aussi identifiés et répartis en groupes. Les informations existantes peuvent être connectées à d’autres informations. Il est également possible de chercher des contenus précis sans en connaître la teneur. La liste des applications peut s’allonger à volonté.

Parallèlement, les plus petites nuances de sens peuvent entraîner les plus grandes différences conceptuelles.

C’est ici que la fouille de textes commence. On entend par ce terme la collecte automatisée d’informations à partir du texte libre. Pour ce faire, différents procédés d’analyse basés sur les algorithmes sont utilisés pour identifier et traiter les contenus du texte.

Les sources d’informations standard sont Internet, mais également les données GRC non structurées ou les ensembles de textes, les rapports, etc.

La fouille de textes permet de traiter de manière automatisée de grandes quantités de textes libres Les textes peuvent être catégorisés en fonction de leur contenu. Grâce à l’analyse d’agrégats, des textes similaires peuvent être aussi identifiés et répartis en groupes. Les informations existantes peuvent être connectées à d’autres informations. Il est également possible de chercher des contenus précis sans en connaître la teneur. La liste des applications peut s’allonger à volonté.

Tout d’abord, il est décisif de définir des questions claires et des sources d’informations appropriées. Elles seront ensuite utilisées pour recueillir les informations utiles au moyen de la fouille de textes.
Emergent Actio gère pour vous des projets et vous conseille dans l’implémentation de vos applications.