• GEPHI
  • MAGELLAN
  • RTGI
  • WEBATLAS

Web-mining.fr

  • forum
  • technologies
  • méthodes
  • liens
  • science
Accueil › Forums › Support utilisateur › Navicrawler

crawl sémantique ?

1 reply
ven, 01/29/2010 - 09:28
Frédéric Marin
Joined: 01/22/2010
User offline. Last seen 2 semaines 1 jour ago.

Bonjour

Navicrawler est tout à fait adapté pour une étude classique de domaine : on part de l'hypothèse que ses frontières se définissent avant tout par un phénomène de "connexité" de site : le coeur est dense, la zone "nébuleuse" l'est moins, etc ... ; on traite par ailleurs de la "valeur sémantique perceptible" par sélection des sites et marquage en "frontière"

Mon problème se trouve ailleurs et j'ai du mal à le résoudre : c'est une étude de repérage de sites d'influences (quel est le réseau d'influence sur le thème de ... et comment s'y positionner) ; ma première réaction a été de déterminer le domaine et son coeur sur la base d'une rapide analyse sémantique, et ma seconde, en m'appuyant sur ce que j'ai pu découvrir, d'analyser les connexités des sites de référence et de les comparer (en repérant les blogs, les communautés, les sites d'information, etc ...)

par exemple, sur le thème de l'équipement sportif de motards ..., je repère le domaine, j'identifie les acteurs industriels, je traque les connexités pour chacun de leur site, et j'analyse les graphes en les comparant un par un : long, fastidieux, et je ne suis pas certain d'être méthodique (à défaut d'être systématique sur le coeur et domaine identifié) ; j'aurais tendance, aujourd'hui, à faire de la "traque" sémantique sur la base du graphe de domaine que j'ai constitué (car il faut un système de référence avant tout).

qu'en pensez vous ? sur le fond et la méthode ? et quelles pistes pourriez vous me suggérer ? (je ne dois pas être le seul à avoir ce genre de problème ...)

Frédéric

Top
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires
dim, 01/31/2010 - 09:48
#1
Sébastien Heymann
Joined: 12/14/2008
User offline. Last seen 3 jours 10h ago.
Bonjour, Je vous recommande

Bonjour,

Je vous recommande de lire le guide méthodologique du Navicrawler, ainsi que le flowchart d'exploration.

La manière de procéder vous permettra d'être sinon exhaustif, tout du moins pertinent sur les sites retenus.

Je peux difficilement vous répondre plus dans un simple commentaire de forum, car lorsque nous formons des individus au Navicrawler, nous devons prendre une journée complète pour faire saisir la méthodo. Vous conviendrez qu'une réponse tronquée serait aussi insatisfaisante pour vous que pour moi.

Top
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Syndiquer le contenu

Connexion utilisateur

  • Créer un nouveau compte
  • Demander un nouveau mot de passe

Tags

blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags

Recherche

Actu blog

  • Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
  • DevWeb, moteur de recherche spécialisé pour les développeurs
  • WebCSTI Rencontres OCIM 2009
  • gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
  • Konodeo - Les Maîtres de l'Arctique
  • Konodeo - Portail de démonstration Arctique
  • Livre blanc WebAtlas : Du Nuage aux Abymes
  • Communautés de logiciel libre : un écosystème des motivations
  • Le web scientifique européen cartographié
  • CPAN-Explorer : la cartographie de l'univers Perl
en savoir plus

Actu forum

  • libellés
  • gephi et navicrawler
  • crawl sémantique ?
  • cartographie de réseau d'influence
  • citizen-boycott.org
en savoir plus

Partenaires


WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.


RTGI SAS, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.


Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.

Syndication

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Network Sciences, web mining, data mining, text mining, crawling, scrapping, graph viz, data viz, small worlds, clustering, social networks, social network analysis, link analysis, maps, cartographie, indexation, moteurs de recherche, Firefox, Web 2.0

Flux RSS

Syndiquer le contenu
sitemap
  • forum
  • technologies
  • méthodes
  • liens
  • science