• GEPHI
  • LINKFLUENCE
  • MAGELLAN
  • WEBATLAS

Web-mining.fr

  • forum
  • technologies
  • méthodes
  • liens
  • science
Accueil

search engine

  • : Function split() is deprecated in /var/www/web-mining.fr/htdocs/modules/filter/filter.module on line 895.
  • : Function split() is deprecated in /var/www/web-mining.fr/htdocs/modules/filter/filter.module on line 895.

New Book: Search User Interfaces

Sébastien Heymann — ven, 07/17/2009 - 20:38

Un livre complet de Cambridge university est librement consultable sur le Web à propos de la conception de l'interface utilisateur sur les moteurs de recherche :

http://searchuserinterfaces.com/book/index.html

Une mine d'informations !

  • Applications et interfaces
  • interface graphique
  • search engine
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Portail de recherche sur les nanotechnologies

Sébastien Heymann — sam, 01/17/2009 - 20:36

L'équipe Magellan a travaillé en collaboration avec WebAtlas sur le domaine des nanotechnologies pour proposer un portail du domaine, ouvert au public.

Il est volontairement simplifié en fonctionnalités, mais permet de donner un aperçu de l'efficacité d'un moteur de recherche à l'échelle d'une communauté.

Vous y trouverez donc un moteur de recherche au sein du corpus, un aggrégateur de flux des sites du corpus, et une cartographie réalisée par WebAtlas. Le crawl a été effectué avec focus, c'est à dire que seules ont été retenues les pages qui parlaient effectivement de nanotechnologies.

Il s'agit encore d'un prototype, qui peut accuser quelques faiblesses, et les retours utilisateurs sont donc bien évidemment bienvenus.

Image

Lien : http://nanotech.magellan-project.com

  • crawling
  • Magellan
  • nanotechnologie
  • search engine
  • Blog de Magellan
  • Le blog de Sébastien Heymann
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Moteur de recherche visuel

archive — jeu, 12/25/2008 - 22:30

Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...

oSkope est un nouveau moteur de recherche permettant d'interroger flickr, youtube, ebay et amazon. Son originalité tient dans son interface proposant 5 modes de visualisation (synoptiques) : grid, stack, pile, list, graph. Je trouve que c'est particulièrement pertinent sur flickr.

A essayer de toute urgence, rien que par curiosité ! ;)

  • Applications et interfaces
  • search engine
  • visualisation
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

PanImages : la recherche multilingue pour les images

archive — jeu, 12/25/2008 - 22:02

Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...

Repris de InternetActu :


PanImages est un projet développé par le professeur Oren Etzioni du Centre Turing de l’université de Washington qui permet de faire une recherche multilingue sur les banques d’images de Google et de FlickR afin de vous aider à trouver des résultats pertinents. Si vous cherchez une image de fleur en anglais, Google image produit 11,4 millions de résultats, mais si vous cherchez flores en espagnol, le moteur ne vous indique que 2,2 millions de photos. L’idée est de permettre aux mots, dans des langues différentes, de correspondre, en vous accompagnant pour rendre les termes de votre recherche moins ambigus.

Grâce à un dictionnaire de termes traduits en plus de 300 langues, PanImages permet de faire des recherches quelque soit la langue que l’on parle.

Note de Seb:

Les résultats sont affichés en parallèle sur Flickr et Google image sur 2 frames séparées (et c'est génial sur un écran 22' O0). Je me demande ce que ça donnerait si le service était couplé à un dictionnaire de synonymes...

  • Applications et interfaces
  • search engine
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Moteurs de recherche de personnes + reconnaissance faciale dans les vidéos

archive — jeu, 12/25/2008 - 21:58

Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...

Pompé grassement sur Outils Froids, parce que j'ai rien à ajouter et que le minimum est là :

Le moteur de recherche de personnes baptisé Spock a beaucoup fait parler de lui il y a quelques semaines. Avant cela le site Mashable avait effectué une revue de 6 moteurs(notaSeb : excellent article) de recherche du même type, dont certains bien plus performants. Au menu:

  • Peekyou
  • Wink
  • Spock
  • Zoominfo
  • Yoname
  • ex.plode.us

Vous pouvez en ajouter quelques autres comme Facebook, qui se revendique clairement comme tel depuis juillet dernier ou encore Peoplefinders ou Pipl.

Et après Facebook dont l'API est accessible à tous, Xing s'ouvre aussi.

Et vu récemment toujours sur Outils Froids, Reuters Lab vient de sortir un moteur de recherche de personnalités appelé Viewdle, "mêlant une technologie de reconnaissance faciale et la capacité à isoler les passages d'une vidéo dans lesquels une personne apparait parmi d'autres."

  • Applications et interfaces
  • search engine
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires

Silobreaker, le traitement automatique du langage appliqué à l'actualité

archive — jeu, 12/25/2008 - 21:50

Discussion d'archives, les auteurs initiaux ont été perdu durant le transfert...

Vu sur Outils Froids :

En deux mots, Silobreaker est l'équivalent de google news avec des fonctionnalités de filtrage sur des ontologies extraites automatiquement de l'actualité, avec possibilité de génerer des historiques de volume d'information et d'un "graphe relationnel cliquable des thèmes et personnes citées dans chaque page thématique".

Faites le "Getting started" pour vite avoir un aperçu. Ca a l'air super bien fichu pour qui est capable d'appréhender correctement ces informations.

Le site : http://beta.silobreaker.com

  • Applications et interfaces
  • Named Entities
  • search engine
  • 1 commentaire

Moteurs de recherche et compétition

Chapeau: 
Ceci est un mémoire réalisé suite au séminaire de sciences cognitives 2007 de l'UTC intitulé "Interaction et Cognition". L'étude porte sur les rapports qu'entretiennent les moteurs de recherche avec la compétition. Il existe en effet une tension révélatrice d'une compétition économique autour d'une ressource limitée et convoitée : la tête de classement des résultats de requêtes, qui est une conséquence de choix technologiques liés à la virtualisation du Web par les moteurs de recherche. Cette rivalité se réalise à travers différents comportements sociaux tels la concurrence, le duel, la lutte ou la coopération.

Auteurs

Sébastien Heymann

Date de publication

printemps 2007

Mots-clés

virtualité, pertinence, compétition, ressource, espace

Introduction

Les moteurs de recherche, capables d'associer à la demande une liste de sites à des mots-clés, sont des dispositifs majeurs du web actuel. La tâche qu'ils remplissent mieux qu'aucun autre outil existant est de proposer des ressources relatives à des mots-clés, sans qu'il soit nécessaire de naviguer de lien en lien dans l'ensemble des pages qui les environnent : ils cherchent pour nous l'information, et proposent leurs résultats. Cette proposition, sous forme de liste, a des conséquences connues sur le nombre de visites des sites y figurant : plus un site apparaît souvent dans la « tête de liste », plus il est susceptible d'attirer des visiteurs. Pour attirer de nouveaux visiteurs, un webmestre peut donc mettre en œuvre des stratégies destinées à faire "monter" son site dans les listes de résultats. Mécaniquement, "monter" dans les moteurs signifie que d'autres « descendent », et on peut citer le cas d'acteurs du web l'ayant considéré comme un enjeu de compétition (en particulier des marques, cf. le cas de BMW : http://www.zdnet.fr/actualites/internet/0,39020774,39309221,00.htm). Cependant, nous pensons que le web n'est pas un espace de compétition, ou pas systématiquement, et en tout cas pas seulement. Nous pensons que les listes de résultats des moteurs sont en partie responsables de l'idée selon laquelle le web est un espace compétitif. L’enjeu de la lutte pour les premières places des résultats des moteurs est l’accès à une ressource limitée au sens biologique et économique du terme, symbolisé par le « Triangle d’Or ».

Ayant démontré que l'accès aux ressources Web que proposent les moteurs est virtuel alors que les pages de résultats sont bien actuelles en ce qu'elles participent du Web, nous montrerons en quoi l’effet de pertinence des listes de résultats suscite le recouvrement et le débordement partiels de l'actuel du Web par le virtuel actualisé des moteurs. La perte occasionnée par cette simplification de l'espace de navigation concerne directement l'interprétation des liens hypertextes, entamant la capacité de l'internaute à percevoir la spatialité du Web, à identifier les controverses et à mobiliser son esprit critique.

Open publication - Free publishing - More virtualite
  • Exalead
  • Google
  • search engine
  • Web
  • Vous devez vous identifier ou créer un compte pour écrire des commentaires
  • 1 fichier attaché

Syndiquer le contenu Syndiquer le contenu

Connexion utilisateur

  • Créer un nouveau compte
  • Demander un nouveau mot de passe

Tags

blogosphère carte communauté crawling design Firefox Flem Gephi Google graphe information retrieval interface graphique Internet Navicrawler science search engine Social Network Analysis système d'information web sémantique TALN visualisation Web WebAtlas Wikipedia
plus de tags

Recherche

Actu blog

  • Introduction de Gephi 0.7 en vidéo
  • Cours UTC-IC05 : Analyse Exploratoire de Données Numériques
  • DevWeb, moteur de recherche spécialisé pour les développeurs
  • WebCSTI Rencontres OCIM 2009
  • gexf.net, un nouveau site web pour le format de fichier de graphe GEXF
  • Konodeo - Les Maîtres de l'Arctique
  • Konodeo - Portail de démonstration Arctique
  • Livre blanc WebAtlas : Du Nuage aux Abymes
  • Communautés de logiciel libre : un écosystème des motivations
  • Le web scientifique européen cartographié
en savoir plus

Actu forum

  • jeu de données
  • compatibilité avec firefox > 3.5
  • Une autre base de données orientée graphe
  • Détection de communautés dans les réseaux sociaux
  • libellés
en savoir plus

Partenaires


WebAtlas, le projet de recherche dirigé par Franck Ghitalla, qui a vu naître le Navicrawler de Mathieu Jacomy, une petite merveille pour l'exploration du Web.


Linkfluence, dont l'Observatoire Présidentielle 2007 a fait beaucoup de bruit, avec notamment sa blogopole cartographiant la blogosphère politique, et désormais aux Etats-Unis.


Gephi, le logiciel libre d'exploration et de manipulation des réseaux, permet de représenter et d'interpréter des structures complexes. Il est téléchargeable gratuitement.

Syndication

  • Flux général
  • Flux général des commentaires
  • Flux du Forum

Network Sciences, web mining, data mining, text mining, crawling, scrapping, graph viz, data viz, small worlds, clustering, social networks, social network analysis, link analysis, maps, cartographie, indexation, moteurs de recherche, Firefox, Web 2.0

Flux RSS

Syndiquer le contenu
sitemap
  • forum
  • technologies
  • méthodes
  • liens
  • science