Web
Analyse de la controverse sur la Tour Triangle
Sébastien Heymann — ven, 06/26/2009 - 10:13
Des étudiants de SciencesPo ont créé un site présentant leurs travaux sur la controverse de la Tour Triangle. Le site est superbement réalisé.
Lien: http://ionesco.sciences-po.fr/com2009/tours/wordpress/
Le web scientifique européen cartographié
Sébastien Heymann — jeu, 06/25/2009 - 11:29
Quels sont les sites internet qui parlent de science ? A quoi ressemble la toile scientifique ? Est-elle dense, éclatée, peuplée d'îlots perdus dans internet ? Quelles sont les interactions entre institutions, associations, médias ou blogs sur les questions de science ?
Le projet européen Eurosis a tenté d'y répondre en menant des études dans 12 pays*. Le résultat est un ensemble de points plus ou moins gros, reliés par des fils de plusieurs couleurs. Chacun de ces points est un acteur possédant un site internet (université, journal, musée...). Chaque fil indique que les pages web d'un nœud pointent vers le nœud voisin. Au centre sont représentés les nœuds majeurs recueillant beaucoup de liens. En périphérie se trouvent les sites internet isolés, peu cités et citant peu. Ces cartes ne mesurent donc pas la popularité ou l'activité d'un site mais les connections existantes ou non entre les différents acteurs des relations science et société. Elles sont une manière de visualiser le tissu, invisible jusqu'à présent, structurant ce domaine.
Il apparaît d’emblée que les pays sont peu liés entre eux, barrière de la langue oblige. Les frontières virtuelles reproduisent donc les frontières géographiques.
Quant aux toiles scientifiques nationales elles n'ont pas toutes la même allure. Le réseau italien est peu dense et très faiblement connecté. Les réseaux finlandais, belges ou français sont bien plus compacts avec bon nombre de nœuds vers lesquels beaucoup de sites pointent. En France, la Cité des Sciences, Agrobiosciences et le portail du ministère de la recherche (science.gouv.fr) font partie des acteurs majeurs selon les critères de cette méthode. Le réseau italien paraît fragile: la suppression de quelques nœuds isolerait d'autres sites les uns des autres. Le Portugal est également peu dense mais plus solide avec donc plus de nœuds jouant le rôle de carrefour vers les autres.
Pour obtenir ces cartes, des responsables ont dressé dans chaque pays la liste de sites estampillés "science et société". Puis des robots explorateurs du web sont partis à la découverte de nouveaux sites à partir de cette première liste, répertoriant les liens entre tous les nœuds. La nouvelle liste a ensuite été validée par les responsables nationaux. Au total 1750 sites ont été recensés dont 200 en France.
Ensuite, des algorithmes de visualisation ont positionné tous les nœuds afin de dresser une carte lisible. Les sites les moins liés aux autres se retrouvent en périphérie et les gros carrefours, souvent cités, au centre. Un code couleur différencie aussi l'origine des sites qui peuvent être des musées, des universités, des médias, des associations...
Les logiciels utilisés pour l'exploration et la visualisation ont été développés par l'association webatlas partenaire du projet, co-fondée par Franck Ghitalla, de l'Institut national de l'information scientifique et technique (Inist), et Mathieu Jacomy, ingénieur de Paris Tech Telecom. L'ensemble a enfin été aggloméré pour proposer une carte d'Europe comprenant ces douze pays. Tous ces résultats viennent d'être mis en ligne (voir le site d'Eurosis).
Cette cartographie révèle que le rôle des associations ou ONG n'est pas identique selon les pays. Absentes d'Italie ou du Portugal, elles sont très structurantes en France ou en Belgique. Autre enseignement, les colonnes vertébrales de ces réseaux sont essentiellement fournies par les universités, les centres de vulgarisation et les médias.
"Ces cartes ne fournissent pas de résultats fermes, résume Mathieu Jacomy. Elles permettent d'observer une situation, de découvrir des propriétés, de faire des hypothèses... Finalement elles posent plus de questions qu'elles n'apportent de réponses".
Parmi ces questions, on peut ainsi s'étonner, en France, de l'absence d'organismes de recherche comme le CEA ou l'Inserm. Ou bien de celle de Greenpeace alors que sur les mêmes terrains on trouve les Amis de la Terre ou France Nature Environnement. La forte présence sur la carte des musées et autres centres de vulgarisation scientifique soulève également des interrogations.
David Larousserie
Sciences-et-Avenir.com
25/06/09
Repris de l'article du NouvelObs
*Arménie, Belgique, Bulgarie, Estonie, Finlande, France, Hongrie, Italie, Montenegro, Pologne, Portugal, République Tchéque.
Taille du Web : un trillion de liens selon Google
archive — ven, 12/26/2008 - 00:45
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Du temps a coulé depuis l'estimation du diamètre du Web par R.Albert, H.Jeong et A.Barabasi, déclarant en 1999 un ordre de grandeur de 10^8 documents.
Google a annoncé récemment avoir approximé non pas le nombre de documents, mais le nombre de liens entre eux, à grosso modo un trillion (10^12).
J'en profites enfin pour vous faire part d'un site vous permettant de connaître la taille des index des moteurs de recherche : http://www.worldwidewebsize.com/, donnant environ 27 milliards de documents indexés.
A quand une grande carte ? /)
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Aurora : le futur du navigateur selon Mozilla
archive — ven, 12/26/2008 - 00:42
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Paru dans Digg, donc certains seront déjà tombés dessus. Pour les autres, ça mérite le coup d'oeil :
http://www.vimeo.com/1450211
C'est une vidéo qui présente un concept de navigation. Pardonnons-lui l'habillage sonore inspiré de la Wii, qui plaira surtout aux ménagères de moins de 12 ans. C'est le premier concept que je vois qui associe infoviz poussée et web sémantique à l'ancienne. Sans surprise, la partie sémantique me paraît peu crédible hormis quelques cas particuliers, et leur exemple est tout ce qu'il y a de plus naïf. En revanche le design très up to date de deux dispositif me paraît intéressant : la présence d'un autre usager dans le navigateur, et les clusters. Dommage que ça soit en 3D en revanche (vous remarquerez qu'une souris 3D remplace la traditionnelle).
A quand les clusters-bulles dans Géphi ?
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Tentative de cartographie des forums français
archive — ven, 12/26/2008 - 00:41
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Une tentative de cartographie des forums de discussions français
http://www.ouinon.net/index.php?2008/07/16/357-cartographie-forums-franc...
les PDFs:
Le poster : http://www.ouinon.net/documents/carte-forums.pdf
Explications sur la démarche : http://www.ouinon.net/documents/pourquoi-comment.pdf
ps: apparemment l'auteur est un récidiviste, c'est le même qui a réalisé ceci :
http://www.ouinon.net/documents/cartoblog2.1.pdf
walk2web
archive — ven, 12/26/2008 - 00:04
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Walk2web est une interface de navigation produisant des arbres de navigation à partir d'un crawl en temps réel sur les sites en question (d'abord la page en cours, puis d'autres si on demande plus de résultats). Il dispose aussi d'une gestion communautaire avec les "walk2web teams" pour faire de la navigation à plusieurs.
Je l'ai trouvé excellent, bien que je trouve discutable de représenter un parcours par un arbre (un graphe sans propriété particulière mais avec un marquage des noeuds par couleur aurait permis de restituer les liens entre sites). Beaucoup de techno pour faire tourner ça.
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Data-mining des sites de psychanalyse
archive — jeu, 12/25/2008 - 23:19
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Bonjour tout le monde
Je souhaite utiliser navicrawler pour explorer la webosphère psychanalytique.
Je me concentre uniquement sur les sites institutionnels, c'est à dire sur les sites des principales associations de psychanalyse. 14 sites ont été retenus Je me limite également au domaine francophone. Je cherche à comprendre comment est ce que la psychanalyse diffuse sur l'Internet et plus exactement comment est ce que les discours institutionnels sont produits et diffusés sur l'Internet.
Je donnnerai une visualisation par site, et ensuite (si je le peux) un vision générale regroupant les 14 sites
La recherche porte sur plusieurs dimensions
1. Avoir une "photographie" des liens mis sur les pages d'accueil
2. Explorer les liens que les sites des associations de psychanalyse entretiennent avec d'autres domaines ou avec d'autres associations de psychanalyse
L'idée est d'utiliser ensuite Pajek pour construire une visualisation.
Le Deep Web
archive — jeu, 12/25/2008 - 23:18
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Tiens si on parlais du Deep Web ! C'est quoi ? qu'en sais t-on ? Ou sont les frontières ? Est-ce un territoire numérique ? Quels sont les enjeux de sa connaissance pour un moteur de recherche ? ...
Ce site est un bon point de départ :
- Vous devez vous identifier ou créer un compte pour écrire des commentaires
Les noms de domaine des pays(.fr, .com, .us) représentées sur une carte du monde
archive — jeu, 12/25/2008 - 22:55
Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...
Vu sur le tout nouveau Webilus, voici une carte de toutes les extensions des noms de domaine de pays dont la taille est proportionnelle à leur utilisation :
- Vous devez vous identifier ou créer un compte pour écrire des commentaires






Flux général