L' « opinion mining » est en passe de devenir une véritable industrie, tout aussi stratégique que celle des sondages. Les promesses avancées sont impressionnantes : la puissance de calcul des outils informatiques permettrait de suivre toutes les évolutions de l’opinion sur le web en temps réel, quel qu’en soit le volume. Plus encore, les capacités de traitement linguistique permettraient de détecter les tonalités de tous les verbatims recueillis, grâce aux méthodes dites de « sentiment analysis ».
L’état de l’art des offres commerciales et technologiques présenté dans cet ouvrage rend compte de cette effervescence mais en souligne aussi la démesure, en veillant à distinguer les résultats réels des slogans promotionnels quelquefois trompeurs.
L’ouvrage écrit par des chercheurs du médialab de Sciences Po, laboratoire spécialisé dans le traitement des masses de données disponibles sur le web pour les sciences sociales, permet aussi de resituer l’intérêt de ces nouveaux moyens techniques pour la recherche, dans le cadre de ce qu’on appelle désormais les « humanités numériques ».
Enfin, soucieux de donner la possibilité à chaque lecteur de prendre en main ces outils, certes puissants mais aux limites de validité bien réelles, les auteurs décrivent pas à pas toutes les phases d’un projet mobilisant les méthodes d’opinion mining, en précisant les pièges et les impératifs d’intervention de l’expertise humaine, toujours nécessaire.
Largement illustré, cet ouvrage devrait encourager les chercheurs, les professionnels de l’opinion et du marketing tout autant que les informaticiens et spécialistes des « web studies » à échanger pour faire progresser ces outils communs.
Avant-propos
Introduction
Positionnement de cet ouvrage
Chapitre 1. Historique et état du marché
Ce que change le web 2.0 • Les domaines d'application • Qui pratique l’analyse de sentiment ? • Le marché actuel
Chapitre 2. Les controverses autour du sentiment analysis
Controverse 1 : le langage humain est trop complexe pour une machine • Controverse 2 : les techniques d’analyse automatique du sentiment ne sont pas encore au point • Controverse 3 : l’analyse du sentiment, ça fonctionne très bien • Controverse 4 : l’analyse du sentiment, ça fonctionne trop bien
Chapitre 3. Le sourcing
Qu’est-ce que le sourcing ? • État de l’art : de quelles sources dispose-t-on ? • Mesurer l’influence : éléments de théorie opérationnelle • Méthode : comment faire pour organiser ses sources (les identifier, les classer) ?
Chapitre 4. Constituer et traiter le corpus de travail, avant l’analyse de tonalité
Constituer le corpus de travail : état de l’art • La constitution du corpus en pratique • Le traitement du corpus : état de l’art • Insuffisance des méthodes statistiques et nécessité du sémantique
Chapitre 5. Détecter les tonalités : opinion mining et sentiment analysis
État de l’art : détecter les indices de la présence du subjectif, du jugement • État de l’art : qualifier l’opinion • L’automatique suffit-il ? • Méthode : quels résultats obtient-on ? • Les méthodes de validation
Chapitre 6. Sentiment analysis et SHS
Les enjeux pour les diverses disciplines • Sciences politiques et opinion mining/sentiment analysis • Sociologie, opinion mining et sentiment analysis
Bibliographie