crawl sémantique ?
Bonjour
Navicrawler est tout à fait adapté pour une étude classique de domaine : on part de l'hypothèse que ses frontières se définissent avant tout par un phénomène de "connexité" de site : le coeur est dense, la zone "nébuleuse" l'est moins, etc ... ; on traite par ailleurs de la "valeur sémantique perceptible" par sélection des sites et marquage en "frontière"
Mon problème se trouve ailleurs et j'ai du mal à le résoudre : c'est une étude de repérage de sites d'influences (quel est le réseau d'influence sur le thème de ... et comment s'y positionner) ; ma première réaction a été de déterminer le domaine et son coeur sur la base d'une rapide analyse sémantique, et ma seconde, en m'appuyant sur ce que j'ai pu découvrir, d'analyser les connexités des sites de référence et de les comparer (en repérant les blogs, les communautés, les sites d'information, etc ...)
par exemple, sur le thème de l'équipement sportif de motards ..., je repère le domaine, j'identifie les acteurs industriels, je traque les connexités pour chacun de leur site, et j'analyse les graphes en les comparant un par un : long, fastidieux, et je ne suis pas certain d'être méthodique (à défaut d'être systématique sur le coeur et domaine identifié) ; j'aurais tendance, aujourd'hui, à faire de la "traque" sémantique sur la base du graphe de domaine que j'ai constitué (car il faut un système de référence avant tout).
qu'en pensez vous ? sur le fond et la méthode ? et quelles pistes pourriez vous me suggérer ? (je ne dois pas être le seul à avoir ce genre de problème ...)
Frédéric




Flux général
Bonjour,
Je vous recommande de lire le guide méthodologique du Navicrawler, ainsi que le flowchart d'exploration.
La manière de procéder vous permettra d'être sinon exhaustif, tout du moins pertinent sur les sites retenus.
Je peux difficilement vous répondre plus dans un simple commentaire de forum, car lorsque nous formons des individus au Navicrawler, nous devons prendre une journée complète pour faire saisir la méthodo. Vous conviendrez qu'une réponse tronquée serait aussi insatisfaisante pour vous que pour moi.