

Le PageRank du moteur de recherche Google est une mesure qui permet de quantifier récursivement la popularité d’une page web.
La structure dynamique ainsi que la taille toujours croissante du web exige la mise en œuvre de mécanismes rapides de calcul du PageRank.
Il est proposé, dans ce livre, une vision décentralisée et collaboratrice où le vecteur PageRank est approximé par site, de sorte que la mise à jour de la base d’index d’un site soit faite sans exiger de crawler tout le web.
Hormis les algorithmes proposés dans les deux premières parties, la dernière partie de ce livre présente des algorithmes originaux pour un calcul rapide du PageRank distribué en sites.
Les expérimentations ont été faites sur base de matrices issues d’un crawling centralisé.
Des algorithmes pour la partition des matrices du web en sites et pour la réalisation d’un équilibrage de charge entre processeurs sont proposés.
Ces nouveaux algorithmes, ParBlowRank et SpeedSiteRank, ont montré leur efficacité.
Un classement des premières pages web, similaire au PageRank de référence, est obtenu.
Lire la suite
Est Docteur en Informatique de Mons en Belgique.
Il enseigne dans plusieurs Institutions Universitaires de la République Démocratique du Congo et dirige également le CRIA (Centre de Recherche en Informatique Appliquée).
Il a déjà publié plusieurs articles scientifiques et deux livres (Réseaux par la pratique et Outils et langages du Web n.0)
Fiche technique