INCONTOURNABLES

Défi J’arrête, j’y gagne !
Soumission belairdirect
PUB

Bulletin Techno

Apprenez les nouvelles dès qu'elles se produisent..


Adresse électronique :

Tous nos bulletins

Membres Canoe.ca


La topologie du Web comme outil de recherche.

Canoë 
23/07/1998 16h44 

Un professeur de la Cornell University a mis au point une nouvelle technique de classification de l'information sur le Web qui pourrait grandement améliorer le rendement des moteurs de recherche.

La technique du professeur Jon Kleinberg est fondée sur la topologie du réseau, dont les liens reliant un site à un autre peuvent s'avérer riche d'enseignements. Lorsqu'on cherche de l'information à l'aide de robots arpentant les pages Web (type AltaVista ou Excite), la classification est opérée de façon mécanique et le jugement humain n'est pas mis à contribution. Or, le Pr Kleinberg postule que le jugement humain est inhérent aux nombres de liens qui réfèrent une page sur l'ensemble des sites Web. Plus d'auteurs pointent vers une page donnée, plus il y a de chances pour que sa valeur subjective soit grande.

Le Pr Kleinberg a donc mis au point des algorithmes et des applications permettant de filtrer les résultats de recherche selon leur popularité. Un filtre de second niveau est nécessaire pour évacuer les liens non pertinents, comme ceux de moteurs de recherche qui, justement, indexent n'importe quoi.

De plus, cette technique topologique permet de classifier les pages par "communautés" de sujets. Elle peut ainsi différencier le jaguar/animal de la Jaguar/auto ou du Jaguar/ordinateur (une ancienne marque aujourd'hui disparue).

Le Centre de recherche Almaden d'IBM, où le Pr Kleinberg a développé cette technique, cherche actuellement des débouchés auprès d'entreprises commercialisant des outils de recherche en ligne comme AltaVista. « C'est une grande idée et son tour viendra sûrement », affirme avec confiance un cadre d'Almaden.

Plus de détails dans Technology Review (MIT).
Voir les documents en format PS ou PDF chez le Pr Kleinberg.








[Autres cyberactualités]