Web-mining.fr, le portail francophone en web mining et network science qui héberge vos projets.
Qu'est-ce que le Web ? Et comment évolue-t-il ?
C'est sur ces questions que se fonde le web mining, récent domaine d'étude scientifique que Tim Berners-Lee dans Creating a Science of the Web présente comme un défi majeur à relever pour le demi siècle qui s'ouvre à nous. Il ne s'agit ni plus ni moins que d'essayer de comprendre le premier artéfact de l'Humanité dont nous ne maîtrisons pas l'évolution, et qui a pourtant acquis une place de premier ordre dans les rouages de nos sociétés.Plus d'un milliard d'internautes de part le monde utilisent régulièrement le Web, alors que nous sommes incapable de lui aposer une définition.
Web-mining.fr est un portail dédié aux différents aspects du web mining (data mining, text mining, usage mining) ainsi qu'à l'évolution du Web en général. Hébergé par RTGI SAS, il est régulièrement alimenté en contenu par des élèves-ingénieurs, étudiants et chercheurs en Sciences Humaines et Sociales participant au programme WebAtlas de Franck Ghitalla, directeur de recherche et maître de conférence.
Web-mining.fr se propose d'être essentiellement un espace de capitalisation d'expériences et de connaissances centré sur les différents projets réalisés par les étudiants en web mining au cours de leur cursus et durant leurs projets personnels. Ouvert à tous, son objectif est de favoriser l'innovation et la pérennisation des projets par la construction d'une communauté et la mise à disposition d'outils d'exploration du Web, de visualisation de données et d'analyse sémantique.
Introduction de Gephi 0.7 en vidéo
Sébastien Heymann . dim, 03/14/2010 - 16:20
L'équipe Gephi a produit une vidéo d'introduction à l'occasion de la sortie de la nouvelle version. Enjoy!
Introducing Gephi 0.7 from gephi on Vimeo.
Blog de Gephi
Le blog de Sébastien Heymann
1 commentaire
Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
Sébastien Heymann . sam, 01/09/2010 - 16:29
Le nouveau cours d'IC05, dispensé par Fabien Pfaënder dans l'école d'ingénieur UTC, s'est doté d'un nouveau site web. Vous y trouvez les cours en PPT sur l'analyse exploratoire de données (EDA), l'analyse du Web et la sémiologie graphique.
Lien : http://www.utc.fr/~wic05/
Le blog de Sébastien Heymann
DevWeb, moteur de recherche spécialisé pour les développeurs
glebourg . lun, 12/14/2009 - 10:35
Profitant de sa technologie de recherche verticale, Konodeo est très fière de mettre à la disposition des développeurs un portail en libre accès permettant à la fois de suivre l'actualité et d'effectuer des recherches dans le domaine du développement informatique.
Grâce à une catégorisation pointue des sites, les développeurs sont en mesure d'affiner leurs recherches à l'aide de filtres stratégiques :
langage de programmation
type de ressource (documentation, tutorial, site collaboratif)
langue (anglais, français)
La puissance de cette capacité d'affinage est alliée à un évitement des ambiguïtés : dans DevWeb, un programme n'a rien à voir avec la télévision, une bibliothèque est forcément de fonctions, et un moteur n'est pas de voiture : c'est là la grande force d'un moteur de recherche vertical, spécialisé dans un domaine, par rapport à un moteur de recherche généraliste.
En plus de ces caractéristiques, DevWeb propose de nombreuses fonctionnalités :
nuage de mots général de la requête permettant de l'affiner
vignette du site pour chaque résultat de recherche
nuage de mots pour chaque résultat de recherche
recherche dans l'actualité
DevWeb est par nature le compagnon parfait de tous les développeurs, qui leur permettra de chercher de l'information avec une précision nouvelle.
Rendez-vous sur DevWeb pour tester notre moteur !
Et plus d'information à propos de Konodeo sur le site de l'entreprise.
développeurs
Moteur de recherche
Le blog de glebourg
WebCSTI Rencontres OCIM 2009
Sébastien Heymann . lun, 11/30/2009 - 11:33
Nous étions vendredi dernier à Dijon lors des Rencontres organisées par le nouvel Observatoire de la culture scientifique et technique. Ces slides sont une introduction à l'exploration du Web et aux informations que l'on peut en tirer.
WebCSTI Rencontres OCIM 2009
View more documents from Sébastien .
CSTI
Le blog de Sébastien Heymann
gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
Sébastien Heymann . mar, 11/17/2009 - 13:57
Un site web dédié au format de fichier de graphe GEXF vient de voir le jour : http://gexf.net
Il centralise les spécifications, des exemples et un document primer/tutoriel, héberge le toolkit officiel libgexf, ainsi qu'un nouveau projet autour du format : gexf explorer, qui permet de visualiser les fichiers GEXF directement dans un navigateur. Les projets sont en open source (licence MIT), et les spécifications sont aisément extensibles à des besoins particuliers.
fichier
Gephi
GEXF
graphe
XML
Le blog de Sébastien Heymann
Konodeo - Les Maîtres de l'Arctique
glebourg . lun, 10/26/2009 - 16:30
Bienvenue en Arctique
Nous vous proposions il y a quelques temps de vous rendre sur notre portail de démonstration, dédié à la thématique de l'Arctique. Si notre portail est un moyen efficace de visualiser une partie de nos données, la face cachée de l'iceberg reste à explorer...
... et nous avons entamé aujourd'hui cette exploration, en nous attachant à étudier les noms de personnes que notre crawler a détecté sur les pages du web Arctique. Dans cette première et courte analyse, vous apprendrez quels sont les maîtres de l'Arctique, dans le monde scientifique et la société civile.
Impatient de savoir qui est en mesure de rivaliser avec l'ours polaire ? Rendez-vous sur notre blog !
Arctique
Corpus
Personnalités
Le blog de glebourg
Konodeo - Portail de démonstration Arctique
glebourg . mar, 10/06/2009 - 08:20
Toute l'équipe de Konodeo est aujourd'hui très fière de vous présenter son portail de démonstration de ses technologies sur la thématique de l'Arctique. En utilisant cette démo, vous serez à même de chercher de l'information dans notre moteur vertical, et de suivre l'actualité de l'Arctique grâce à l'agrégation de flux RSS et de comptes Twitter. Vous pourrez également contribuer depuis le tableau de bord, en ajoutant des ressources telles que des liens ou des documents.
Vous êtes pressés de tester ?
Rendez-vous sur la page dédiée à notre démo.
Un moteur de recherche vertical
Qu'est-ce qu'un moteur de recherche vertical ? Comparons le web à un univers, en constante expansion. Au sein de cette univers, on peut trouver diverses galaxies : celle des jeux vidéo, de la cuisine, ou de l'écologie par exemple. Un moteur de recherche classique fonctionne ambitieusement en cherchant ses informations sur toutes ces galaxies à la fois, nous privant ainsi de contexte. Chaque moteur Konodeo, à l'opposé, ne se consacre qu'à une galaxie, offrant un véritable contexte aux requêtes effectuées, et donc une meilleure finesse de résultats.
Prenons un exemple simple : glace. Sur Google, vous trouverez un florilège de résultats sur les crèmes glacées, les sorbets ou le Hockey sur glace.
Sur notre portail Arctique, vous trouverez des informations sur la glace en tant qu'eau solide, ou sur les carottes de glace.
Pas encore convaincu ? Notre moteur de recherche vous permet également de retrouver l'information dans les flux RSS, les tweets, et les ressources internes apportées par les utilisateurs du portail.
Une manière originale de présenter des résultats de recherche
En un coup d'oeil, vous avez un aperçu des thèmes liés à votre recherche grâce au nuage de mots dynamique. Les résultats de type page web, billet RSS ou personne vous permettent de visualiser un graphe de relations : quels sont les sites reliés à votre résultat, ou bien quelles sont les personnes co-citées avec celle que vous venez de trouver. En quelques clics, vous aurez une idée claire des autorités du domaine, et des relations entretenues avec d'autres entités.
Pour couronner le tout, vous pouvez affiner les résultats en choisissant des catégories ou des types de documents, et affiner votre recherche en utilisant le nuage de mots.
Flux d'information
À partir de flux RSS ou de comptes Twitter que les utilisateurs vont ajouter dans le module dédié, le robot agrégateur Konodeo indexe les billets toutes les heures pour donner un aperçu dynamique du corpus.
Le robot est également en mesure de détecter les entités nommées de type .personne., et de les insérer dans l.index pour les rendre disponibles dans le module de recherche.
Les flux sont à la fois disponibles dans le moteur principal et dans un module à part.
Ressources internes
Des modules permettent aux utilisateurs du portail de partager des ressources telles que des liens ou des documents. Ces derniers sont alors rendus immédiatement disponibles dans moteur de recherche, et sont consultables depuis le tableau de bord par les autres utilisateurs.
Utilisation
Les technologies Konodeo, construites de façon modulaire, sont disponibles sous d'autres formes qu'un portail complet. Nous pouvons intégrer des modules dans des plate-formes existantes, ou simplement fournir un accès à nos services et nos données via une API Web. N'hésitez pas à vous rendre sur notre site, http://www.konodeo.fr pour plus d'information.
Logo Konodeo
Le blog de glebourg
2 commentaires
Livre blanc WebAtlas : Du Nuage aux Abymes
Sébastien Heymann . ven, 09/04/2009 - 14:43
La première partie du livre blanc de l'association WebAtlas, traitant des dimensions heuristiques et expérimentales ds modèles du Web, est sorti. Franck Ghitalla y interroge les enjeux de cette tâche herculéenne qu'est la production de nouveaux modèles intellectuels du Web intégrant aussi bien les structures et les contenus. Vous pouvez le consulter ci-dessous, ou bien télécharger le PDF.
Open publication - Free publishing - More web mining
Le blog de Sébastien Heymann
Communautés de logiciel libre : un écosystème des motivations
Sébastien Heymann . ven, 07/03/2009 - 10:17
Voici un rapport sur les recherches effectuées en cogntition sociale pour comprendre ce qui pousse des individus à contribuer à des projets de logiciel libre.
Résumé:
Le logiciel libre est un bien public volontairement produit par une communauté d.usagers autonomes. Comment
dès lors expliquer que des individus participent et parviennent à se coordonner sans l.usage d.incitations monétaires ?
Quelles leçons tirer pour une bonne gestion des motivations individuelles ? Par ailleurs, ces projets prennent progressivement
conscience de la nécessité de se construire une identité intégrée dans une stratégie marketing, afin de capter
de nouveaux contributeurs et usagers (ex http ://marketing.openoffice.org). Quels sont alors les risques d.altérer les
motivations des membres actuels ? Comment axer la communication des communautés afin de maximiser les contributions
?
logiciel libre
motivation
Le blog de Sébastien Heymann
5 commentaires
1 fichier attaché
1
2
3
suivant .
dernier »
Syndiquer le contenu Syndiquer le contenu
Connexion utilisateur
Nom d'utilisateur : *
Mot de passe : *
Se souvenir de moi
Créer un nouveau compte
Demander un nouveau mot de passe
Tags
blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags
Recherche
Chercher dans ce site :
Actu blog
Introduction de Gephi 0.7 en vidéo
Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
DevWeb, moteur de recherche spécialisé pour les développeurs
WebCSTI Rencontres OCIM 2009
gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
Konodeo - Les Maîtres de l'Arctique
Konodeo - Portail de démonstration Arctique
Livre blanc WebAtlas : Du Nuage aux Abymes
Communautés de logiciel libre : un écosystème des motivations
Le web scientifique européen cartographié
en savoir plus
Actu forum
novice
Cartographie des liens entre blogs
jeu de données
compatibilité avec firefox > 3.5
Une autre base de données orientée graphe
en savoir plus
Partenaires
WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.
Linkfluence, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.
Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.