Web-mining.fr, le portail francophone en web mining et network science qui héberge vos projets.

Qu'est-ce que le Web ? Et comment évolue-t-il ? C'est sur ces questions que se fonde le web mining, récent domaine d'étude scientifique que Tim Berners-Lee dans Creating a Science of the Web présente comme un défi majeur à relever pour le demi siècle qui s'ouvre à nous. Il ne s'agit ni plus ni moins que d'essayer de comprendre le premier artéfact de l'Humanité dont nous ne maîtrisons pas l'évolution, et qui a pourtant acquis une place de premier ordre dans les rouages de nos sociétés.Plus d'un milliard d'internautes de part le monde utilisent régulièrement le Web, alors que nous sommes incapable de lui aposer une définition. Web-mining.fr est un portail dédié aux différents aspects du web mining (data mining, text mining, usage mining) ainsi qu'à l'évolution du Web en général. Hébergé par RTGI SAS, il est régulièrement alimenté en contenu par des élèves-ingénieurs, étudiants et chercheurs en Sciences Humaines et Sociales participant au programme WebAtlas de Franck Ghitalla, directeur de recherche et maître de conférence. Web-mining.fr se propose d'être essentiellement un espace de capitalisation d'expériences et de connaissances centré sur les différents projets réalisés par les étudiants en web mining au cours de leur cursus et durant leurs projets personnels. Ouvert à tous, son objectif est de favoriser l'innovation et la pérennisation des projets par la construction d'une communauté et la mise à disposition d'outils d'exploration du Web, de visualisation de données et d'analyse sémantique. Introduction de Gephi 0.7 en vidéo Sébastien Heymann . dim, 03/14/2010 - 16:20 L'équipe Gephi a produit une vidéo d'introduction à l'occasion de la sortie de la nouvelle version. Enjoy! Introducing Gephi 0.7 from gephi on Vimeo. Blog de Gephi Le blog de Sébastien Heymann 1 commentaire Cours UTC-IC05 : Analyse Exploratoire de Données Numériques Sébastien Heymann . sam, 01/09/2010 - 16:29 Le nouveau cours d'IC05, dispensé par Fabien Pfaënder dans l'école d'ingénieur UTC, s'est doté d'un nouveau site web. Vous y trouvez les cours en PPT sur l'analyse exploratoire de données (EDA), l'analyse du Web et la sémiologie graphique. Lien : http://www.utc.fr/~wic05/ Le blog de Sébastien Heymann DevWeb, moteur de recherche spécialisé pour les développeurs glebourg . lun, 12/14/2009 - 10:35 Profitant de sa technologie de recherche verticale, Konodeo est très fière de mettre à la disposition des développeurs un portail en libre accès permettant à la fois de suivre l'actualité et d'effectuer des recherches dans le domaine du développement informatique. Grâce à une catégorisation pointue des sites, les développeurs sont en mesure d'affiner leurs recherches à l'aide de filtres stratégiques : langage de programmation type de ressource (documentation, tutorial, site collaboratif) langue (anglais, français) La puissance de cette capacité d'affinage est alliée à un évitement des ambiguïtés : dans DevWeb, un programme n'a rien à voir avec la télévision, une bibliothèque est forcément de fonctions, et un moteur n'est pas de voiture : c'est là la grande force d'un moteur de recherche vertical, spécialisé dans un domaine, par rapport à un moteur de recherche généraliste. En plus de ces caractéristiques, DevWeb propose de nombreuses fonctionnalités : nuage de mots général de la requête permettant de l'affiner vignette du site pour chaque résultat de recherche nuage de mots pour chaque résultat de recherche recherche dans l'actualité DevWeb est par nature le compagnon parfait de tous les développeurs, qui leur permettra de chercher de l'information avec une précision nouvelle. Rendez-vous sur DevWeb pour tester notre moteur ! Et plus d'information à propos de Konodeo sur le site de l'entreprise. développeurs Moteur de recherche Le blog de glebourg WebCSTI Rencontres OCIM 2009 Sébastien Heymann . lun, 11/30/2009 - 11:33 Nous étions vendredi dernier à Dijon lors des Rencontres organisées par le nouvel Observatoire de la culture scientifique et technique. Ces slides sont une introduction à l'exploration du Web et aux informations que l'on peut en tirer. WebCSTI Rencontres OCIM 2009 View more documents from Sébastien . CSTI Le blog de Sébastien Heymann gexf.net, un nouveau site web pour le format de fichier de graphe GEXF Sébastien Heymann . mar, 11/17/2009 - 13:57 Un site web dédié au format de fichier de graphe GEXF vient de voir le jour : http://gexf.net Il centralise les spécifications, des exemples et un document primer/tutoriel, héberge le toolkit officiel libgexf, ainsi qu'un nouveau projet autour du format : gexf explorer, qui permet de visualiser les fichiers GEXF directement dans un navigateur. Les projets sont en open source (licence MIT), et les spécifications sont aisément extensibles à des besoins particuliers. fichier Gephi GEXF graphe XML Le blog de Sébastien Heymann Konodeo - Les Maîtres de l'Arctique glebourg . lun, 10/26/2009 - 16:30 Bienvenue en Arctique Nous vous proposions il y a quelques temps de vous rendre sur notre portail de démonstration, dédié à la thématique de l'Arctique. Si notre portail est un moyen efficace de visualiser une partie de nos données, la face cachée de l'iceberg reste à explorer... ... et nous avons entamé aujourd'hui cette exploration, en nous attachant à étudier les noms de personnes que notre crawler a détecté sur les pages du web Arctique. Dans cette première et courte analyse, vous apprendrez quels sont les maîtres de l'Arctique, dans le monde scientifique et la société civile. Impatient de savoir qui est en mesure de rivaliser avec l'ours polaire ? Rendez-vous sur notre blog ! Arctique Corpus Personnalités Le blog de glebourg Konodeo - Portail de démonstration Arctique glebourg . mar, 10/06/2009 - 08:20 Toute l'équipe de Konodeo est aujourd'hui très fière de vous présenter son portail de démonstration de ses technologies sur la thématique de l'Arctique. En utilisant cette démo, vous serez à même de chercher de l'information dans notre moteur vertical, et de suivre l'actualité de l'Arctique grâce à l'agrégation de flux RSS et de comptes Twitter. Vous pourrez également contribuer depuis le tableau de bord, en ajoutant des ressources telles que des liens ou des documents. Vous êtes pressés de tester ? Rendez-vous sur la page dédiée à notre démo. Un moteur de recherche vertical Qu'est-ce qu'un moteur de recherche vertical ? Comparons le web à un univers, en constante expansion. Au sein de cette univers, on peut trouver diverses galaxies : celle des jeux vidéo, de la cuisine, ou de l'écologie par exemple. Un moteur de recherche classique fonctionne ambitieusement en cherchant ses informations sur toutes ces galaxies à la fois, nous privant ainsi de contexte. Chaque moteur Konodeo, à l'opposé, ne se consacre qu'à une galaxie, offrant un véritable contexte aux requêtes effectuées, et donc une meilleure finesse de résultats. Prenons un exemple simple : glace. Sur Google, vous trouverez un florilège de résultats sur les crèmes glacées, les sorbets ou le Hockey sur glace. Sur notre portail Arctique, vous trouverez des informations sur la glace en tant qu'eau solide, ou sur les carottes de glace. Pas encore convaincu ? Notre moteur de recherche vous permet également de retrouver l'information dans les flux RSS, les tweets, et les ressources internes apportées par les utilisateurs du portail. Une manière originale de présenter des résultats de recherche En un coup d'oeil, vous avez un aperçu des thèmes liés à votre recherche grâce au nuage de mots dynamique. Les résultats de type page web, billet RSS ou personne vous permettent de visualiser un graphe de relations : quels sont les sites reliés à votre résultat, ou bien quelles sont les personnes co-citées avec celle que vous venez de trouver. En quelques clics, vous aurez une idée claire des autorités du domaine, et des relations entretenues avec d'autres entités. Pour couronner le tout, vous pouvez affiner les résultats en choisissant des catégories ou des types de documents, et affiner votre recherche en utilisant le nuage de mots. Flux d'information À partir de flux RSS ou de comptes Twitter que les utilisateurs vont ajouter dans le module dédié, le robot agrégateur Konodeo indexe les billets toutes les heures pour donner un aperçu dynamique du corpus. Le robot est également en mesure de détecter les entités nommées de type .personne., et de les insérer dans l.index pour les rendre disponibles dans le module de recherche. Les flux sont à la fois disponibles dans le moteur principal et dans un module à part. Ressources internes Des modules permettent aux utilisateurs du portail de partager des ressources telles que des liens ou des documents. Ces derniers sont alors rendus immédiatement disponibles dans moteur de recherche, et sont consultables depuis le tableau de bord par les autres utilisateurs. Utilisation Les technologies Konodeo, construites de façon modulaire, sont disponibles sous d'autres formes qu'un portail complet. Nous pouvons intégrer des modules dans des plate-formes existantes, ou simplement fournir un accès à nos services et nos données via une API Web. N'hésitez pas à vous rendre sur notre site, http://www.konodeo.fr pour plus d'information. Logo Konodeo Le blog de glebourg 2 commentaires Livre blanc WebAtlas : Du Nuage aux Abymes Sébastien Heymann . ven, 09/04/2009 - 14:43 La première partie du livre blanc de l'association WebAtlas, traitant des dimensions heuristiques et expérimentales ds modèles du Web, est sorti. Franck Ghitalla y interroge les enjeux de cette tâche herculéenne qu'est la production de nouveaux modèles intellectuels du Web intégrant aussi bien les structures et les contenus. Vous pouvez le consulter ci-dessous, ou bien télécharger le PDF. Open publication - Free publishing - More web mining Le blog de Sébastien Heymann Communautés de logiciel libre : un écosystème des motivations Sébastien Heymann . ven, 07/03/2009 - 10:17 Voici un rapport sur les recherches effectuées en cogntition sociale pour comprendre ce qui pousse des individus à contribuer à des projets de logiciel libre. Résumé: Le logiciel libre est un bien public volontairement produit par une communauté d.usagers autonomes. Comment dès lors expliquer que des individus participent et parviennent à se coordonner sans l.usage d.incitations monétaires ? Quelles leçons tirer pour une bonne gestion des motivations individuelles ? Par ailleurs, ces projets prennent progressivement conscience de la nécessité de se construire une identité intégrée dans une stratégie marketing, afin de capter de nouveaux contributeurs et usagers (ex http ://marketing.openoffice.org). Quels sont alors les risques d.altérer les motivations des membres actuels ? Comment axer la communication des communautés afin de maximiser les contributions ? logiciel libre motivation Le blog de Sébastien Heymann 5 commentaires 1 fichier attaché 1 2 3 suivant . dernier » Syndiquer le contenu Syndiquer le contenu Connexion utilisateur Nom d'utilisateur : * Mot de passe : * Se souvenir de moi Créer un nouveau compte Demander un nouveau mot de passe Tags blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia plus de tags Recherche Chercher dans ce site : Actu blog Introduction de Gephi 0.7 en vidéo Cours UTC-IC05 : Analyse Exploratoire de Données Numériques DevWeb, moteur de recherche spécialisé pour les développeurs WebCSTI Rencontres OCIM 2009 gexf.net, un nouveau site web pour le format de fichier de graphe GEXF Konodeo - Les Maîtres de l'Arctique Konodeo - Portail de démonstration Arctique Livre blanc WebAtlas : Du Nuage aux Abymes Communautés de logiciel libre : un écosystème des motivations Le web scientifique européen cartographié en savoir plus Actu forum novice Cartographie des liens entre blogs jeu de données compatibilité avec firefox > 3.5 Une autre base de données orientée graphe en savoir plus Partenaires WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web. Linkfluence, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis. Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.