Dans un précédent article, j’ai parlé de l’outil Personas qui réalise une sorte de portrait de l’individu sur le Net. Basé sur les techniques d’analyse syntaxique, l’outil dresse les traits de la personnalité d’un individu sur Internet, par une classification des mots clés dans des catégories prédéfinies (Online, Books, Media, Politics, Education..). Cet outil serait encore plus puissant avec deux fonctionnalités supplémentaires : Utilisation des médias sociaux (Blogs, Réseaux sociaux, Forums…) comme sources d’informations et Mise en œuvre d’une analyse sémantique de tonalité au lieu d’une analyse synthaxique. En effet, il est plus intéressant d’accéder au sens des phrases que de classifier les mots clés des phrases par catégories.
Avec la prolifération des médias sociaux et l’interactivité grimpante des internautes sur ces médias (articles, commentaires, évaluations, avis de consommateurs), Internet est devenu une mine d’informations pour étudier à la fois nos comportements et notre conscience collective en ligne. A ce sujet, dans son numéro du 23 Août, Le New York Times propose un article très intéressant Mining the Web for Feelings, Not Facts.
Le marché des outils d’analyse sémantique de tonalité commence à prendre forme. On retrouve quelques outils innovants tel Scout Labs et Jodange qui ont déjà fait leurs preuves auprès de grandes entreprises américaines. Ces outils sont payants et offrent généreusement 30 jours d’essais. Comme outil gratuit, on retrouve Newssift qui est une plateforme développée par le Financial Times Group. Pour une recherche donnée, Newssift indique le pourcentage d’avis positifs, négatifs et neutres. Newssif indique également le pourcentage d’informations par source (%newspapers, %blogs, %radios, %newswires, %news Portals, %magazines).
Le gros du travail, pour les éditeurs d’outils d’analyse sémantique de tonalité, repose sur l’implémentation d’algorithmes performants capables d’intégrer les subtilités du langage. Les algorithmes les plus simplistes considèreront que « J’aime » est positif et « Je hais » est négatif. Ces algorithmes ne pourront pas détecter des expressions ironiques ou sarcastiques.
Les experts et les spécialistes, cités dans l’article du NYT, s’accordent à dire que l’analyse sémantique de tonalité deviendra une fonctionnalité standard des moteurs de recherches. Dans l’avenir proche, les moteurs de recherche nous proposeront à la fois des faits et des avis relatifs à l’objet de notre requête Web. Impressionnant, non
Cet humble billet est le premier d’une série qu’on consacrera dans notre blog à l’analyse sémantique de tonalité en ligne et son importance dans le domaine de la Veille et de l’E-Reputation en particulier.
Je pense que avant de se focaliser sur la sémantique, les acteurs du marché devrait d’abord se focaliser sur la récupération exhaustive des données.
Pourquoi parce que dans le second cas, il est plus facile d’atteindre un niveau proche de la perfection alors que l’analyse sémantique automatique sera pour encore longtemps incapable de discerner l’ironie et d’autres figure de style propres au langage humain.
Je parle en connaissance de choses, je travaille avec plusieurs prestataires (non cités ci-dessus) et l’exhaustivité des remontés n’est pas toujours au rendez-vous…
Donc pour résumer, je dirais qu’il existe deux pistes de developpement, que certains vont essayer de mener les deux de fronts et que je pense que c’est une mauvaise idée.
Merci Roland pour ce commentaire.
En effet, l’exhaustivité des résultats est également l’un des axes de développement des outils de surveillance des médias sociaux. Il est nécessaire pour les entreprises de disposer de l’ensemble des informations disponibles sur Internet pour optimiser leurs Campagnes de Marketing et Communication en ligne. Cet axe relève de l’aspect quantitatif des outils de monitoring alors que l’analyse sémantique relève de l’aspect qualitatif.
Je pense que le développement des outils de monitoring du point de vue quantitatif se fera du côté des éditeurs alors que le développement de ces mêmes outils du point de vue qualitatif se fera plus au niveau des universités et des laboratoires de R&D. A mon avis, les acteurs du marché qui s’imposeront comme leaders, seront ceux qui développeront davantage les aspects quantitatifs de leurs solutions et resteront attentifs aux développement des aspects qualitatifs pour enrichir leurs offres.
Pingback: Blog de Joël CHAUDY – Internautes ! Vos avis valent de l’Or