Analyse de contenu : L’apport de la fouille de textes

Objectifs

La fouille de textes (text mining) regroupe l’ensemble des méthodes, techniques et outils qui permettent d’exploiter et d’analyser des documents écrits, tels que des articles de presse, des publications scientifiques, des fichiers bureautiques, des e-mails, … Elle fédère des thématiques issues des sciences de l’information, de la linguistique, de la statistique et des méthodes d’apprentissage (intelligence artificielle). Cette formation décrit comment la fouille de textes peut être utilisée pour classer des documents, réaliser des résumés de synthèse automatique ou encore pour assister la veille stratégique ou technologique selon des pistes de recherches prédéfinies. Ce stage privilégie l'usage d'outils et de services gratuits (Voyant Tools, VOSViewer, Tropes, Termsuite, RapidMiner, ...).

  • Comprendre les grands principes de la fouille de textes
  • Savoir évaluer des outils de fouille de textes
  • Fournir les connaissances et les compétences requises pour utiliser des outils afin de répondre à des besoins métiers

 

 Public concerné

  • Documentalistes et professionnels de l’information souhaitant disposer d’une vision globale des méthodes et enjeux de cette discipline

 Prérequis

  • Connaissance de base du vocabulaire de l’Internet.
  • Une formation en informatique ou, à défaut, une bonne maîtrise des outils informatiques est un plus pour s’approprier les concepts manipulés durant la formation.

Programme

Introduction

  • Data science, ingénierie et prise de décision orienté données
  • Champs et périmètre de la fouille de textes
  • L’écosystème du traitement automatique du langage naturel : acteurs et outils
  • Panorama de cas d’usage pour les professionnels de l’information
  • Choix des outils et contraintes techniques
  • Contexte juridique sur les contenus informationnels
  • Décomposition d’un processus de fouille de textes
  • La place de la visualisation de données dans la démarche
  • Les types de livrables

 

Connaissances de base des technologies de fouille de textes

  • Les différents moyens d’accès aux sources d’information
  • La manipulation de fichiers
  • Le nettoyage des données
  • La représentation et l’exploration de textes
  • Les expressions régulières
  • La catégorisation et la classification automatique de documents
  • La reconnaissance d’entités nommées
  • L’extraction terminologique et l’organisation de concepts
  • L’analyse de sentiments et l’analyse d’opinions
  • Les outils d’aide pour réaliser une revue de littérature

 

Étude de cas

  • Le text mining dans les pratiques de veille et de gestion des connaissances
    • … pour la recherche et la collecte des sources d’information
    • … pour l’analyse des informations
    • … pour le trie, le classement et le filtrage
    • … pour la diffusion, le partage et l’intégration des informations
    • … pour l’archivage
  • Usage de la fouille de textes sur les publications scientifiques
  • L’analyse des réseaux sociaux
  • L’analyse de forums de discussion

 

 

Modalités

  • Alternance d’exposés et de manipulations pratiques d’outils

Moyens fournis

Tous les stages de l'ADBS se déroulent dans une salle d'une capacité d'accueil en corrélation avec le nombre de stagiaires présents, entièrement équipée (videoprojecteur, poste informatique/internet par stagiaire, paper-board, ... ou espace numérique si la formation le nécessite). Ils sont assurés dans le respect du programme de formation remis préalablement aux stagiaires Un support pédagogique adapté au programme et au minimum en version numérique est remis aux stagiaires.

Formateur

M. Christophe WILLAERT

Se préinscrire
à la formation

Dates
02/04/2020 - 03/04/2020

Horaires
de 09:00 à 17:00

TARIF NON ADHERENT
1 020 € HT (1 224 € TTC)

TARIF ADHERENT
890 € HT (1 068 € TTC)

Contact
Formation ADBS

Je me préinscris

Pour aller plus loin

Domaines

Niveau professionnel

Modalités

Type de stage