• GEPHI
  • MAGELLAN
  • RTGI
  • WEBATLAS

Web-mining.fr

  • forum
  • technologies
  • méthodes
  • liens
  • science
Accueil › Forums › Support utilisateur › Soutiens de vos projets

cartographie de réseau d'influence

2 replies
ven, 01/22/2010 - 22:44
Frédéric Marin
Joined: 01/22/2010
User offline. Last seen 2 semaines 1 jour ago.

Bonsoir

je réalise un petit projet de veille dans le cadre d'un cursus en intelligence économique ; je suis très intéressé par les techniques de fouille et de validation cartographique (je commence à utiliser assez régulièrement navicrawler, guess, et gephi)

je voudrais aller un peu plus loin, maintenant, dans les phases préliminaires d'analyse des informations collectées ; une piste me paraissant intéressante pourrait être d'élaborer une taxonomie progressive au fur et à mesure de la découverte du coeur du domaine ?

un autre aspect de ce genre d'étude me ramène toujours sur le thème du réseau d'influence dans le domaine : quels sites sont ils "gardiens des clés" du cluster de sites, et qui sont les influenceurs ? (je pars du point de vue que le domaine doit être exploré la première fois dans sa totalité, mais qu'après, il doit suffire de surveiller les sites "points de passage" et les blogs des influenceurs ...

la question qui vient est bien entendu : qu'en pensez vous ? et quels pourraient être les natures d'outils à utiliser ... (la difficulté que j'intuite étant dès lors de les intégrer dans une méthodologie pratique)

Frédéric

Top
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires
lun, 01/25/2010 - 12:18
#1
Sébastien Heymann
Joined: 12/14/2008
User offline. Last seen 3 jours 10h ago.
Bonjour, C'est une réflexion

Bonjour,

C'est une réflexion intéressante : on peut supposer, lors d'un crawl incrémental / exploration progressive, que l'on puisse détecter le franchissement des "frontières thématiques" par l'injection de nouveaux termes dans la taxonomie. Reste à calibrer un seuil de résistance au bruit, et une exploration méthodique (comme celle que propose la doc du Navicrawler) pour l'exploiter correctement.

Pour ce qui est des influenceurs je reste plus prudent, dans la mesure où leur définition dans un réseau n'est pas encore certaine : on pensait initialement que les plus connectés étaient les plus capables de propager des informations ou des tendances. Or, il apparaîtrait selon les travaux de D. Watts que ce sont les "couches médianes" du réseau, c'est-à-dire les noeuds suffisamment connectés mais pas trop, qui possèdent un meilleur pouvoir. En tout cas, la nature des liens tient un rôle capital. Un exemple (simpliste) : faites-vous plus confiance à votre meilleur ami (qui ne publie pas/peu et n'a pas forcément bcp de connexions) ou à Loic Le Meur pour choisir vos prochaines chaussures (même si ce dernier était un pontif des blogs chaussure) ?

Une façon détournée de répondre à la question, est de veiller constamment l'ensemble du réseau pour tenter de détecter des "signaux faibles", signes qu'une tendance prend ou qu'une information se propage de manière accélérée. Ce sont ces données qui permettront de construire des modèles mathématiques de propagation de l'information, et in fine, la définition d'un "influenceur".

Seb

Top
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires
mer, 01/27/2010 - 19:35
#2
Frédéric Marin
Joined: 01/22/2010
User offline. Last seen 2 semaines 1 jour ago.
Bonsoir, je continue, avec le risque d'errer sans fin

Dans un contexte, non de veille, mais de recherche, je pense que le crawl automatique ne peut raisonnablement servir que dans deux situations :
- le besoin de mise en perspective d'une étude en cours dans son contexte (le piège à éviter étant de se focaliser sur le champ de fouille en oubliant tout le reste)
- l'analyse systématique de l'environnement immédiat d'un nombre tout à fait limité de sites.

L'exploration, manuelle et devant par nature rester pertinente, doit donc absolument être réalisée méthodiquement, en surveillant attentivement les passages aux sites "frontières" (je prends l'hypothèse que les sites frontières ont été écartés soit parce qu'ils appartiennent à la couche supérieure des sites fortement connectés à tout, soit justement pour des raisons de "simplification thématique").

humm ... et l'influence ... (pour les chaussures, je fais plutôt dans les grandes tailles, phénomène qui échappe aux spécialistes médians)

j'accepte l'idée des "couches médianes", et la nature des liens semble capitale c'est vrai, mais cela ne facilite pas la résolution du problème ; j'ai l'intuition qu'un condensé de méthode, de fouille, de cartographie, d'analyse de texte (sémantique ...), et d'analyse générale bien orientée doit y faire beaucoup.

Pour la mission de veille qui m'est imposée, J'ai décidé d'abord de théoriser un peu (j'aurais pu tout simplement répondre à la question : quels sont les sites pertinents ...) et d'appliquer ensuite au cas ; je pars de l'hypothèse que certains ont déjà résolu le problème et sont dans un contexte d'influence ; il suffit de les identifier, et d'analyser la nature des relations qu'ils ont établis à partir de leur site, mais également à partir de leur identité propre ... (quel est le système d'influence de Boeing par exemple, ou celui du député trucmuche, ou de la marque machin ...) ; il reste ensuite à confirmer la pertinence de l'hypothèse, et par suite de la solution trouvée ...

Frédéric

Top
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Syndiquer le contenu

Connexion utilisateur

  • Créer un nouveau compte
  • Demander un nouveau mot de passe

Tags

blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags

Recherche

Actu blog

  • Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
  • DevWeb, moteur de recherche spécialisé pour les développeurs
  • WebCSTI Rencontres OCIM 2009
  • gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
  • Konodeo - Les Maîtres de l'Arctique
  • Konodeo - Portail de démonstration Arctique
  • Livre blanc WebAtlas : Du Nuage aux Abymes
  • Communautés de logiciel libre : un écosystème des motivations
  • Le web scientifique européen cartographié
  • CPAN-Explorer : la cartographie de l'univers Perl
en savoir plus

Actu forum

  • libellés
  • gephi et navicrawler
  • crawl sémantique ?
  • cartographie de réseau d'influence
  • citizen-boycott.org
en savoir plus

Partenaires


WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.


RTGI SAS, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.


Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.

Syndication

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Network Sciences, web mining, data mining, text mining, crawling, scrapping, graph viz, data viz, small worlds, clustering, social networks, social network analysis, link analysis, maps, cartographie, indexation, moteurs de recherche, Firefox, Web 2.0

Flux RSS

Syndiquer le contenu
sitemap
  • forum
  • technologies
  • méthodes
  • liens
  • science