Personas_3 Dans un précédent article, j’ai parlé de l’outil Personas qui réalise une sorte de portrait de l’individu sur le Net. Basé sur les techniques d’analyse syntaxique, l’outil dresse les traits de la personnalité d’un individu sur Internet, par une classification des mots clés dans des catégories prédéfinies (Online, Books, Media, Politics, Education..). Cet outil serait encore plus puissant avec deux fonctionnalités supplémentaires : Utilisation des médias sociaux (Blogs, Réseaux sociaux, Forums…) comme sources d’informations et Mise en œuvre d’une analyse sémantique de tonalité au lieu d’une analyse synthaxique.  En effet, il est plus intéressant d’accéder au sens des phrases que de classifier les mots clés des phrases par catégories.

NYT_Logo Avec la prolifération des médias sociaux et l’interactivité grimpante des internautes sur ces médias (articles, commentaires, évaluations, avis de consommateurs), Internet est devenu une mine d’informations pour étudier à la fois nos comportements et notre conscience collective en ligne. A ce sujet, dans son numéro du 23 Août, Le New York Times propose un article très intéressant  Mining the Web for Feelings, Not Facts.

NYT_Smiley_ValeyNombreuses entreprises considèrent, aujourd’hui, que l’opinion des internautes est devenue une sorte de monnaie virtuelle qui peut autant faire la réputation d’un produit que provoquer la faillite d’une marque. Les avis d’internautes sont également un facteur prépondérant pour les dirigeants d’entreprise pour ajuster leurs stratégies marketing et campagnes publicitaires. La naissance d’un vrai marché d’un nouveau type de logiciels Web est chose faite.

TrioLe marché des outils d’analyse sémantique de tonalité commence à prendre forme. On retrouve quelques outils innovants tel  Scout Labs et Jodange qui ont déjà fait leurs preuves auprès de grandes entreprises américaines. Ces outils sont payants et offrent généreusement 30 jours d’essais. Comme outil gratuit, on retrouve Newssift qui est une plateforme développée par le Financial Times Group. Pour une recherche donnée, Newssift indique le pourcentage d’avis positifs, négatifs et neutres. Newssif indique également le pourcentage d’informations par source (%newspapers, %blogs, %radios, %newswires, %news Portals, %magazines).

Le gros du travail, pour les éditeurs d’outils d’analyse sémantique de tonalité, repose sur l’implémentation d’algorithmes performants capables d’intégrer les subtilités du langage. Les algorithmes les plus simplistes considèreront que « J’aime » est positif et « Je hais » est négatif. Ces algorithmes ne pourront pas détecter  des expressions ironiques ou sarcastiques.

Les experts et les spécialistes, cités dans l’article du NYT, s’accordent à dire que l’analyse sémantique de tonalité deviendra une fonctionnalité standard des moteurs de recherches. Dans l’avenir proche, les moteurs de recherche nous proposeront à la fois des faits et des avis relatifs à l’objet de notre requête Web. Impressionnant, non ;-)

Cet humble billet est le premier d’une série qu’on consacrera dans notre blog à l’analyse sémantique de tonalité en ligne et son importance dans le domaine de la Veille et de l’E-Reputation en particulier.

Add to FacebookAdd to DiggAdd to Del.icio.usAdd to StumbleuponAdd to RedditAdd to BlinklistAdd to TwitterAdd to TechnoratiAdd to FurlAdd to Newsvine

Mise à jour du 04 Juillet 2010 : dans ce billet, j’ai confondu la notion d’analyse sémantique et d’analyse de la tonalité. L’analyse de tonalité consiste à juger des propos comme positifs, négatifs ou neutres. L’analyse sémantique étant selon moi l’analyse du sens.

About aminedigirep

Amine est ingénieur en Informatique, concepteur et développeur d'applications de monitoring des médias sociaux.

3 Thoughts on “Internautes ! Vos avis valent de l’Or

  1. Je pense que avant de se focaliser sur la sémantique, les acteurs du marché devrait d’abord se focaliser sur la récupération exhaustive des données.
    Pourquoi parce que dans le second cas, il est plus facile d’atteindre un niveau proche de la perfection alors que l’analyse sémantique automatique sera pour encore longtemps incapable de discerner l’ironie et d’autres figure de style propres au langage humain.
    Je parle en connaissance de choses, je travaille avec plusieurs prestataires (non cités ci-dessus) et l’exhaustivité des remontés n’est pas toujours au rendez-vous…

    Donc pour résumer, je dirais qu’il existe deux pistes de developpement, que certains vont essayer de mener les deux de fronts et que je pense que c’est une mauvaise idée.

  2. aminedigirep on 6 septembre 2009 at 18:08 said:

    Merci Roland pour ce commentaire.

    En effet, l’exhaustivité des résultats est également l’un des axes de développement des outils de surveillance des médias sociaux. Il est nécessaire pour les entreprises de disposer de l’ensemble des informations disponibles sur Internet pour optimiser leurs Campagnes de Marketing et Communication en ligne. Cet axe relève de l’aspect quantitatif des outils de monitoring alors que l’analyse sémantique relève de l’aspect qualitatif.

    Je pense que le développement des outils de monitoring du point de vue quantitatif se fera du côté des éditeurs alors que le développement de ces mêmes outils du point de vue qualitatif se fera plus au niveau des universités et des laboratoires de R&D. A mon avis, les acteurs du marché qui s’imposeront comme leaders, seront ceux qui développeront davantage les aspects quantitatifs de leurs solutions et resteront attentifs aux développement des aspects qualitatifs pour enrichir leurs offres.

  3. Pingback: Blog de Joël CHAUDY – Internautes ! Vos avis valent de l’Or

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Post Navigation