Blogs
Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
Sébastien Heymann — sam, 01/09/2010 - 16:29

Le nouveau cours d'IC05, dispensé par Fabien Pfaënder dans l'école d'ingénieur UTC, s'est doté d'un nouveau site web. Vous y trouvez les cours en PPT sur l'analyse exploratoire de données (EDA), l'analyse du Web et la sémiologie graphique.
Lien : http://www.utc.fr/~wic05/
- Le blog de Sébastien Heymann
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
DevWeb, moteur de recherche spécialisé pour les développeurs
glebourg — lun, 12/14/2009 - 10:35
Profitant de sa technologie de recherche verticale, Konodeo est très fière de mettre à la disposition des développeurs un portail en libre accès permettant à la fois de suivre l'actualité et d'effectuer des recherches dans le domaine du développement informatique.
Grâce à une catégorisation pointue des sites, les développeurs sont en mesure d'affiner leurs recherches à l'aide de filtres stratégiques :
- langage de programmation
- type de ressource (documentation, tutorial, site collaboratif)
- langue (anglais, français)
La puissance de cette capacité d'affinage est alliée à un évitement des ambiguïtés : dans DevWeb, un programme n'a rien à voir avec la télévision, une bibliothèque est forcément de fonctions, et un moteur n'est pas de voiture : c'est là la grande force d'un moteur de recherche vertical, spécialisé dans un domaine, par rapport à un moteur de recherche généraliste.
En plus de ces caractéristiques, DevWeb propose de nombreuses fonctionnalités :
- nuage de mots général de la requête permettant de l'affiner
- vignette du site pour chaque résultat de recherche
- nuage de mots pour chaque résultat de recherche
- recherche dans l'actualité
DevWeb est par nature le compagnon parfait de tous les développeurs, qui leur permettra de chercher de l'information avec une précision nouvelle.
Rendez-vous sur DevWeb pour tester notre moteur !
Et plus d'information à propos de Konodeo sur le site de l'entreprise.
- Le blog de glebourg
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
WebCSTI Rencontres OCIM 2009
Sébastien Heymann — lun, 11/30/2009 - 11:33
Nous étions vendredi dernier à Dijon lors des Rencontres organisées par le nouvel Observatoire de la culture scientifique et technique. Ces slides sont une introduction à l'exploration du Web et aux informations que l'on peut en tirer.
- Le blog de Sébastien Heymann
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
Sébastien Heymann — mar, 11/17/2009 - 13:57
Un site web dédié au format de fichier de graphe GEXF vient de voir le jour : http://gexf.net
Il centralise les spécifications, des exemples et un document primer/tutoriel, héberge le toolkit officiel libgexf, ainsi qu'un nouveau projet autour du format : gexf explorer, qui permet de visualiser les fichiers GEXF directement dans un navigateur. Les projets sont en open source (licence MIT), et les spécifications sont aisément extensibles à des besoins particuliers.
Konodeo - Les Maîtres de l'Arctique
glebourg — lun, 10/26/2009 - 16:30
Bienvenue en Arctique
Nous vous proposions il y a quelques temps de vous rendre sur notre portail de démonstration, dédié à la thématique de l'Arctique. Si notre portail est un moyen efficace de visualiser une partie de nos données, la face cachée de l'iceberg reste à explorer...
... et nous avons entamé aujourd'hui cette exploration, en nous attachant à étudier les noms de personnes que notre crawler a détecté sur les pages du web Arctique. Dans cette première et courte analyse, vous apprendrez quels sont les maîtres de l'Arctique, dans le monde scientifique et la société civile.
Impatient de savoir qui est en mesure de rivaliser avec l'ours polaire ? Rendez-vous sur notre blog !
- Le blog de glebourg
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Konodeo - Portail de démonstration Arctique
glebourg — mar, 10/06/2009 - 08:20
Toute l'équipe de Konodeo est aujourd'hui très fière de vous présenter son portail de démonstration de ses technologies sur la thématique de l'Arctique. En utilisant cette démo, vous serez à même de chercher de l'information dans notre moteur vertical, et de suivre l'actualité de l'Arctique grâce à l'agrégation de flux RSS et de comptes Twitter. Vous pourrez également contribuer depuis le tableau de bord, en ajoutant des ressources telles que des liens ou des documents.
Vous êtes pressés de tester ?
Rendez-vous sur la page dédiée à notre démo.
Un moteur de recherche vertical
Qu'est-ce qu'un moteur de recherche vertical ? Comparons le web à un univers, en constante expansion. Au sein de cette univers, on peut trouver diverses galaxies : celle des jeux vidéo, de la cuisine, ou de l'écologie par exemple. Un moteur de recherche classique fonctionne ambitieusement en cherchant ses informations sur toutes ces galaxies à la fois, nous privant ainsi de contexte. Chaque moteur Konodeo, à l'opposé, ne se consacre qu'à une galaxie, offrant un véritable contexte aux requêtes effectuées, et donc une meilleure finesse de résultats.
Prenons un exemple simple : glace. Sur Google, vous trouverez un florilège de résultats sur les crèmes glacées, les sorbets ou le Hockey sur glace.
Sur notre portail Arctique, vous trouverez des informations sur la glace en tant qu'eau solide, ou sur les carottes de glace.
Pas encore convaincu ? Notre moteur de recherche vous permet également de retrouver l'information dans les flux RSS, les tweets, et les ressources internes apportées par les utilisateurs du portail.
Une manière originale de présenter des résultats de recherche
En un coup d'oeil, vous avez un aperçu des thèmes liés à votre recherche grâce au nuage de mots dynamique. Les résultats de type page web, billet RSS ou personne vous permettent de visualiser un graphe de relations : quels sont les sites reliés à votre résultat, ou bien quelles sont les personnes co-citées avec celle que vous venez de trouver. En quelques clics, vous aurez une idée claire des autorités du domaine, et des relations entretenues avec d'autres entités.
Pour couronner le tout, vous pouvez affiner les résultats en choisissant des catégories ou des types de documents, et affiner votre recherche en utilisant le nuage de mots.
Flux d'information
À partir de flux RSS ou de comptes Twitter que les utilisateurs vont ajouter dans le module dédié, le robot agrégateur Konodeo indexe les billets toutes les heures pour donner un aperçu dynamique du corpus.
Le robot est également en mesure de détecter les entités nommées de type “personne”, et de les insérer dans l’index pour les rendre disponibles dans le module de recherche.
Les flux sont à la fois disponibles dans le moteur principal et dans un module à part.
Ressources internes
Des modules permettent aux utilisateurs du portail de partager des ressources telles que des liens ou des documents. Ces derniers sont alors rendus immédiatement disponibles dans moteur de recherche, et sont consultables depuis le tableau de bord par les autres utilisateurs.
Utilisation
Les technologies Konodeo, construites de façon modulaire, sont disponibles sous d'autres formes qu'un portail complet. Nous pouvons intégrer des modules dans des plate-formes existantes, ou simplement fournir un accès à nos services et nos données via une API Web. N'hésitez pas à vous rendre sur notre site, http://www.konodeo.fr pour plus d'information.

Livre blanc WebAtlas : Du Nuage aux Abymes
Sébastien Heymann — ven, 09/04/2009 - 14:43
La première partie du livre blanc de l'association WebAtlas, traitant des dimensions heuristiques et expérimentales ds modèles du Web, est sorti. Franck Ghitalla y interroge les enjeux de cette tâche herculéenne qu'est la production de nouveaux modèles intellectuels du Web intégrant aussi bien les structures et les contenus. Vous pouvez le consulter ci-dessous, ou bien télécharger le PDF.
- Le blog de Sébastien Heymann
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Communautés de logiciel libre : un écosystème des motivations
Sébastien Heymann — ven, 07/03/2009 - 10:17
Voici un rapport sur les recherches effectuées en cogntition sociale pour comprendre ce qui pousse des individus à contribuer à des projets de logiciel libre.
Résumé:
Le logiciel libre est un bien public volontairement produit par une communauté d’usagers autonomes. Comment
dès lors expliquer que des individus participent et parviennent à se coordonner sans l’usage d’incitations monétaires ?
Quelles leçons tirer pour une bonne gestion des motivations individuelles ? Par ailleurs, ces projets prennent progressivement
conscience de la nécessité de se construire une identité intégrée dans une stratégie marketing, afin de capter
de nouveaux contributeurs et usagers (ex http ://marketing.openoffice.org). Quels sont alors les risques d’altérer les
motivations des membres actuels ? Comment axer la communication des communautés afin de maximiser les contributions
?
Le web scientifique européen cartographié
Sébastien Heymann — jeu, 06/25/2009 - 11:29
Quels sont les sites internet qui parlent de science ? A quoi ressemble la toile scientifique ? Est-elle dense, éclatée, peuplée d'îlots perdus dans internet ? Quelles sont les interactions entre institutions, associations, médias ou blogs sur les questions de science ?
Le projet européen Eurosis a tenté d'y répondre en menant des études dans 12 pays*. Le résultat est un ensemble de points plus ou moins gros, reliés par des fils de plusieurs couleurs. Chacun de ces points est un acteur possédant un site internet (université, journal, musée...). Chaque fil indique que les pages web d'un nœud pointent vers le nœud voisin. Au centre sont représentés les nœuds majeurs recueillant beaucoup de liens. En périphérie se trouvent les sites internet isolés, peu cités et citant peu. Ces cartes ne mesurent donc pas la popularité ou l'activité d'un site mais les connections existantes ou non entre les différents acteurs des relations science et société. Elles sont une manière de visualiser le tissu, invisible jusqu'à présent, structurant ce domaine.
Il apparaît d’emblée que les pays sont peu liés entre eux, barrière de la langue oblige. Les frontières virtuelles reproduisent donc les frontières géographiques.
Quant aux toiles scientifiques nationales elles n'ont pas toutes la même allure. Le réseau italien est peu dense et très faiblement connecté. Les réseaux finlandais, belges ou français sont bien plus compacts avec bon nombre de nœuds vers lesquels beaucoup de sites pointent. En France, la Cité des Sciences, Agrobiosciences et le portail du ministère de la recherche (science.gouv.fr) font partie des acteurs majeurs selon les critères de cette méthode. Le réseau italien paraît fragile: la suppression de quelques nœuds isolerait d'autres sites les uns des autres. Le Portugal est également peu dense mais plus solide avec donc plus de nœuds jouant le rôle de carrefour vers les autres.
Pour obtenir ces cartes, des responsables ont dressé dans chaque pays la liste de sites estampillés "science et société". Puis des robots explorateurs du web sont partis à la découverte de nouveaux sites à partir de cette première liste, répertoriant les liens entre tous les nœuds. La nouvelle liste a ensuite été validée par les responsables nationaux. Au total 1750 sites ont été recensés dont 200 en France.
Ensuite, des algorithmes de visualisation ont positionné tous les nœuds afin de dresser une carte lisible. Les sites les moins liés aux autres se retrouvent en périphérie et les gros carrefours, souvent cités, au centre. Un code couleur différencie aussi l'origine des sites qui peuvent être des musées, des universités, des médias, des associations...
Les logiciels utilisés pour l'exploration et la visualisation ont été développés par l'association webatlas partenaire du projet, co-fondée par Franck Ghitalla, de l'Institut national de l'information scientifique et technique (Inist), et Mathieu Jacomy, ingénieur de Paris Tech Telecom. L'ensemble a enfin été aggloméré pour proposer une carte d'Europe comprenant ces douze pays. Tous ces résultats viennent d'être mis en ligne (voir le site d'Eurosis).
Cette cartographie révèle que le rôle des associations ou ONG n'est pas identique selon les pays. Absentes d'Italie ou du Portugal, elles sont très structurantes en France ou en Belgique. Autre enseignement, les colonnes vertébrales de ces réseaux sont essentiellement fournies par les universités, les centres de vulgarisation et les médias.
"Ces cartes ne fournissent pas de résultats fermes, résume Mathieu Jacomy. Elles permettent d'observer une situation, de découvrir des propriétés, de faire des hypothèses... Finalement elles posent plus de questions qu'elles n'apportent de réponses".
Parmi ces questions, on peut ainsi s'étonner, en France, de l'absence d'organismes de recherche comme le CEA ou l'Inserm. Ou bien de celle de Greenpeace alors que sur les mêmes terrains on trouve les Amis de la Terre ou France Nature Environnement. La forte présence sur la carte des musées et autres centres de vulgarisation scientifique soulève également des interrogations.
David Larousserie
Sciences-et-Avenir.com
25/06/09
Repris de l'article du NouvelObs
*Arménie, Belgique, Bulgarie, Estonie, Finlande, France, Hongrie, Italie, Montenegro, Pologne, Portugal, République Tchéque.
CPAN-Explorer : la cartographie de l'univers Perl
Sébastien Heymann — ven, 06/12/2009 - 14:30
CPAN-Explorer est un projet de visualisation et d'analyse des relations entre développeurs et entre packages du langage de programmation Perl, très utilisé en administration système et développement web. Porté par RTGI SAS et Julian Bilcke (Gephi), ceux-ci présent leurs travaux aujourd'hui au FPW'09 (slides).
![]()

Lien : http://cpan-explorer.org/





Flux général