DEA DISIC 2003 Cost-Aware WWW Proxy Caching Algorithms Pei Cao & Sandy Irani, Proceedings of the 1997 USENIX Symposium on Internet Technology and Systems, Dec 1997 Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 1 Plan de la présentation • • • • • • Introduction Algorithmes de remplacement existants L’algorithme GreedyDual-Size Comparaison et pérformance Conclusion Critiques Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 2 Introduction • Avantages des caches : ( réduction ) Trafic réseau ; La moyenne d’attente pour la recherche d’un document; Le chargement d’un serveur occupé. • Les techniques de remplacement de pages dans le cas de la mémoire virtuelle ne sont pas trop adaptées au cache proxy. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 3 Introduction (2) • Le secret d’éfficacité d’un cache est son algorithme de replacement de document. • LRU : l’algorithme de remplacementle plus utilisé Simple; Néglige la taille des fichiers et le temps de latence; • GreedyDual-Size : prend en compte la localité temporelle, le coût et la taille des documents. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 4 Algorithmes de remplacement • • • • • • • • • • Least-Recently-Used (LRU) Least-Frequently-Used (LFU) LRU-Threshold Size Log(Size)+LRU Hyper-G Pitkow/Recker Lowest-Latency-First Hybrid Lowest Relative Value (LRV) Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 5 Localité temporelle La probabilité de référencer un document décroît dés que le temps de dernière référence augmente. La probabilité de référencer un document référencé t minutes auparavant peut être : Prob(t)= k/t ( k : constant) Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 6 Le besoin de … • On omettant la taille et le coût des documents LRU est le meilleur algorithme. • Dés qu’on parle de taille & coût !! • Le besoin d’un algorithme qui combine la localité, la taille et le coût. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 7 L’algorithme GreedyDual-Size L := 0 ; Pour chaque requête demandant un document P faire Si P est présent dans le cache alors H := L + coût (P) / taille (P) ; Sinon Tant que il y a pas assez d’espace dans le cache pour P faire L := minq H(q) ; Expulser q ; ( L = H(q) ) Ftq Mettre P dans le cache ; H(P) : = L + coût (P) / taille(P ) ; Fsi Fpour Fin Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 8 Variante de l’algorithme GD-size Variante Coût GD-Size (1) 1 GD-Size (packets) 2+ ( file_size/536 ). GD-Size (latency) Latence nécessaire pour télécharger le document. Éstimation de la latence GD-Size (avg_latency) nécessaire pour télécharger le document. GD-Size (hops) Valeur du hop associé au serveur web du document. ( 1 ou 32 ) GD-Size(weightedhops) hops*(2+file_size/536). Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms Objectif hit ratio byte hit ratio latency reduction latency reduction hop reduction weighted-hop reduction 9 Tests et résultats Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 10 Critères de pérformance • Hit ratio ; • Byte hit ratio ; • Reduction latency ; • Hop reduction. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 11 Traces Proxy Web • Digital Equipement Corporation Web Proxy server traces qui desserve environ 17 000 stations de travail, pour une période de 25 jours, contenant environ 24 000 000 accès; • University of Virginia Proxy server and client traces contenant quatre types de traces, chacune d’elle desserve 25 à 61 stations de travail ; de 13 127 à 227 21 accès ; • Boston University client traces contenant deux types de traces. La première desserve 5 stations de travail (17 008 accès) et L’autre 32 stations de travail ( 118 105 accès). Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 12 Hit ratio Boston University Traces Virginia Tech traces DEC-U1 traces DEC-U2 traces Relative cache size % Résultats : GD-Size(1) donne le meilleur hit ratio, suivi de GD-Size(packets). Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 13 Byte hit ratio Boston University Traces DEC-U2 traces Virginia Tech traces DEC-U1 traces Relative cache size % Résultats : GD-Size( packets) domine pour le byte hit ratio. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 14 Reduced Latency Boston University Traces DEC-U1 traces DEC-U2 traces Relative cache size % Résultats : GD-Size(1) donne est le meileur GD-Size(latency) et GD-Size(packets) viennent aprés. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 15 Hops Reduction Boston University Traces Virginia Tech traces DEC-U1 traces DEC-U2 traces Relative cache size % Résultat: GD-Size(hops) accomplit le mieux Les algorithmes qui prennent en considération le coût réseau accomplissent mieux que ceux qui le néglige. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 16 Synthèse Selon l’objectif qu’on veut atteindre : • Grand hit ratio ou faible average latency GD-Size (1) • Grand byte hit ratio GD-Size ( packets ) • Les documents ont des coûts associés au réseau GD-Size ( hops ) ou GD-Size ( weightedhops ) Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 17 Conclusion • Simplicité de l’algorithme. • Combine la localité, la taille et le coût. • Plusieurs variantes. • Dépasse expérimentalement les autres algorithmes existants dans plusieurs aspects ( hit ratio, byte hit ratio,…). • Plusieurs traces pour la simulation. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 18 Critiques • Quel l’algorithme qu’on doit utiliser ? • L’algorithme optimise un seul critère de performance à la fois. Comment l’ajuster pour qu’il puisse être multi-critères ? • L’intégration du Prefetching avec l’algorithme de remplacement. Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 19 Questions ? Guebli Sid Ali Cost-Aware WWW Proxy Caching Algorithms 20