Dans un précédent article, j’ai parlé de l’outil Personas qui réalise une sorte de portrait de l’individu sur le Net. Basé sur les techniques d’analyse syntaxique, l’outil dresse les traits de la personnalité d’un individu sur Internet, par une classification des mots clés dans des catégories prédéfinies (Online, Books, Media, Politics, Education..). Cet outil serait encore plus puissant avec deux fonctionnalités supplémentaires : Utilisation des médias sociaux (Blogs, Réseaux sociaux, Forums…) comme sources d’informations et Mise en œuvre d’une analyse sémantique de tonalité au lieu d’une analyse synthaxique. En effet, il est plus intéressant d’accéder au sens des phrases que de classifier les mots clés des phrases par catégories.
Avec la prolifération des médias sociaux et l’interactivité grimpante des internautes sur ces médias (articles, commentaires, évaluations, avis de consommateurs), Internet est devenu une mine d’informations pour étudier à la fois nos comportements et notre conscience collective en ligne. A ce sujet, dans son numéro du 23 Août, Le New York Times propose un article très intéressant Mining the Web for Feelings, Not Facts.
Nombreuses entreprises considèrent, aujourd’hui, que
l’opinion des internautes est devenue une sorte de monnaie virtuelle qui peut autant faire la réputation d’un produit que provoquer la faillite d’une marque. Les avis d’internautes sont également un facteur prépondérant pour les dirigeants d’entreprise pour ajuster leurs stratégies marketing et campagnes publicitaires. La naissance d’un vrai marché d’un nouveau type de logiciels Web est chose faite.
Le marché des outils d’analyse sémantique de tonalité commence à prendre forme. On retrouve quelques outils innovants tel Scout Labs et Jodange qui ont déjà fait leurs preuves auprès de grandes entreprises américaines. Ces outils sont payants et offrent généreusement 30 jours d’essais. Comme outil gratuit, on retrouve Newssift qui est une plateforme développée par le Financial Times Group. Pour une recherche donnée, Newssift indique le pourcentage d’avis positifs, négatifs et neutres. Newssif indique également le pourcentage d’informations par source (%newspapers, %blogs, %radios, %newswires, %news Portals, %magazines).
Le gros du travail, pour les éditeurs d’outils d’analyse sémantique de tonalité, repose sur l’implémentation d’algorithmes performants capables d’intégrer les subtilités du langage. Les algorithmes les plus simplistes considèreront que « J’aime » est positif et « Je hais » est négatif. Ces algorithmes ne pourront pas détecter des expressions ironiques ou sarcastiques.
Les experts et les spécialistes, cités dans l’article du NYT, s’accordent à dire que l’analyse sémantique de tonalité deviendra une fonctionnalité standard des moteurs de recherches. Dans l’avenir proche, les moteurs de recherche nous proposeront à la fois des faits et des avis relatifs à l’objet de notre requête Web. Impressionnant, non
Cet humble billet est le premier d’une série qu’on consacrera dans notre blog à l’analyse sémantique de tonalité en ligne et son importance dans le domaine de la Veille et de l’E-Reputation en particulier.
Mise à jour du 04 Juillet 2010 : dans ce billet, j’ai confondu la notion d’analyse sémantique et d’analyse de la tonalité. L’analyse de tonalité consiste à juger des propos comme positifs, négatifs ou neutres. L’analyse sémantique étant selon moi l’analyse du sens.