cartographie de réseau d'influence
Bonsoir
je réalise un petit projet de veille dans le cadre d'un cursus en intelligence économique ; je suis très intéressé par les techniques de fouille et de validation cartographique (je commence à utiliser assez régulièrement navicrawler, guess, et gephi)
je voudrais aller un peu plus loin, maintenant, dans les phases préliminaires d'analyse des informations collectées ; une piste me paraissant intéressante pourrait être d'élaborer une taxonomie progressive au fur et à mesure de la découverte du coeur du domaine ?
un autre aspect de ce genre d'étude me ramène toujours sur le thème du réseau d'influence dans le domaine : quels sites sont ils "gardiens des clés" du cluster de sites, et qui sont les influenceurs ? (je pars du point de vue que le domaine doit être exploré la première fois dans sa totalité, mais qu'après, il doit suffire de surveiller les sites "points de passage" et les blogs des influenceurs ...
la question qui vient est bien entendu : qu'en pensez vous ? et quels pourraient être les natures d'outils à utiliser ... (la difficulté que j'intuite étant dès lors de les intégrer dans une méthodologie pratique)
Frédéric
Dans un contexte, non de veille, mais de recherche, je pense que le crawl automatique ne peut raisonnablement servir que dans deux situations :
- le besoin de mise en perspective d'une étude en cours dans son contexte (le piège à éviter étant de se focaliser sur le champ de fouille en oubliant tout le reste)
- l'analyse systématique de l'environnement immédiat d'un nombre tout à fait limité de sites.
L'exploration, manuelle et devant par nature rester pertinente, doit donc absolument être réalisée méthodiquement, en surveillant attentivement les passages aux sites "frontières" (je prends l'hypothèse que les sites frontières ont été écartés soit parce qu'ils appartiennent à la couche supérieure des sites fortement connectés à tout, soit justement pour des raisons de "simplification thématique").
humm ... et l'influence ... (pour les chaussures, je fais plutôt dans les grandes tailles, phénomène qui échappe aux spécialistes médians)
j'accepte l'idée des "couches médianes", et la nature des liens semble capitale c'est vrai, mais cela ne facilite pas la résolution du problème ; j'ai l'intuition qu'un condensé de méthode, de fouille, de cartographie, d'analyse de texte (sémantique ...), et d'analyse générale bien orientée doit y faire beaucoup.
Pour la mission de veille qui m'est imposée, J'ai décidé d'abord de théoriser un peu (j'aurais pu tout simplement répondre à la question : quels sont les sites pertinents ...) et d'appliquer ensuite au cas ; je pars de l'hypothèse que certains ont déjà résolu le problème et sont dans un contexte d'influence ; il suffit de les identifier, et d'analyser la nature des relations qu'ils ont établis à partir de leur site, mais également à partir de leur identité propre ... (quel est le système d'influence de Boeing par exemple, ou celui du député trucmuche, ou de la marque machin ...) ; il reste ensuite à confirmer la pertinence de l'hypothèse, et par suite de la solution trouvée ...
Frédéric




Flux général
Bonjour,
C'est une réflexion intéressante : on peut supposer, lors d'un crawl incrémental / exploration progressive, que l'on puisse détecter le franchissement des "frontières thématiques" par l'injection de nouveaux termes dans la taxonomie. Reste à calibrer un seuil de résistance au bruit, et une exploration méthodique (comme celle que propose la doc du Navicrawler) pour l'exploiter correctement.
Pour ce qui est des influenceurs je reste plus prudent, dans la mesure où leur définition dans un réseau n'est pas encore certaine : on pensait initialement que les plus connectés étaient les plus capables de propager des informations ou des tendances. Or, il apparaîtrait selon les travaux de D. Watts que ce sont les "couches médianes" du réseau, c'est-à-dire les noeuds suffisamment connectés mais pas trop, qui possèdent un meilleur pouvoir. En tout cas, la nature des liens tient un rôle capital. Un exemple (simpliste) : faites-vous plus confiance à votre meilleur ami (qui ne publie pas/peu et n'a pas forcément bcp de connexions) ou à Loic Le Meur pour choisir vos prochaines chaussures (même si ce dernier était un pontif des blogs chaussure) ?
Une façon détournée de répondre à la question, est de veiller constamment l'ensemble du réseau pour tenter de détecter des "signaux faibles", signes qu'une tendance prend ou qu'une information se propage de manière accélérée. Ce sont ces données qui permettront de construire des modèles mathématiques de propagation de l'information, et in fine, la définition d'un "influenceur".
Seb