Cost-Aware WWW Proxy Caching Algorithms

publicité
DEA DISIC 2003
Cost-Aware WWW Proxy
Caching Algorithms
Pei Cao & Sandy Irani,
Proceedings of the 1997 USENIX Symposium on
Internet Technology and Systems, Dec 1997
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
1
Plan de la présentation
•
•
•
•
•
•
Introduction
Algorithmes de remplacement existants
L’algorithme GreedyDual-Size
Comparaison et pérformance
Conclusion
Critiques
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
2
Introduction
• Avantages des caches : ( réduction )
 Trafic réseau ;
 La moyenne d’attente pour la recherche d’un
document;
 Le chargement d’un serveur occupé.
• Les techniques de remplacement de pages dans le cas
de la mémoire virtuelle ne sont pas trop adaptées au
cache proxy.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
3
Introduction (2)
• Le secret d’éfficacité d’un cache est son algorithme de
replacement de document.
• LRU : l’algorithme de remplacementle plus utilisé
 Simple;
 Néglige la taille des fichiers et le temps de latence;
• GreedyDual-Size : prend en compte la localité temporelle,
le coût et la taille des documents.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
4
Algorithmes de remplacement
•
•
•
•
•
•
•
•
•
•
Least-Recently-Used (LRU)
Least-Frequently-Used (LFU)
LRU-Threshold
Size
Log(Size)+LRU
Hyper-G
Pitkow/Recker
Lowest-Latency-First
Hybrid
Lowest Relative Value (LRV)
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
5
Localité temporelle
 La probabilité de référencer un
document décroît dés que le
temps de dernière référence
augmente.
 La probabilité de référencer un
document référencé t minutes
auparavant peut être : Prob(t)= k/t
( k : constant)
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
6
Le besoin de …
• On omettant la taille et le coût des documents
 LRU est le meilleur algorithme.
• Dés qu’on parle de taille & coût !!
• Le besoin d’un algorithme qui combine la
localité, la taille et le coût.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
7
L’algorithme GreedyDual-Size
L := 0 ;
Pour chaque requête demandant un document P faire
Si P est présent dans le cache alors
H := L + coût (P) / taille (P) ;
Sinon
Tant que il y a pas assez d’espace dans le cache pour P faire
L := minq H(q) ;
Expulser q ; ( L = H(q) )
Ftq
Mettre P dans le cache ;
H(P) : = L + coût (P) / taille(P ) ;
Fsi
Fpour
Fin
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
8
Variante de l’algorithme GD-size
Variante
Coût
GD-Size (1)
1
GD-Size (packets)
2+ ( file_size/536 ).
GD-Size (latency)
Latence nécessaire pour
télécharger le document.
Éstimation de la latence
GD-Size (avg_latency) nécessaire pour télécharger
le document.
GD-Size (hops)
Valeur du hop associé au
serveur web du document.
( 1 ou 32 )
GD-Size(weightedhops) hops*(2+file_size/536).
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
Objectif
hit ratio
byte hit ratio
latency
reduction
latency
reduction
hop reduction
weighted-hop
reduction
9
Tests et résultats
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
10
Critères de pérformance
• Hit ratio ;
• Byte hit ratio ;
• Reduction latency ;
• Hop reduction.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
11
Traces Proxy Web
• Digital Equipement Corporation Web Proxy server traces
qui desserve environ 17 000 stations de travail, pour une
période de 25 jours, contenant environ 24 000 000 accès;
• University of Virginia Proxy server and client traces
contenant quatre types de traces, chacune d’elle desserve 25 à
61 stations de travail ; de 13 127 à 227 21 accès ;
• Boston University client traces
contenant deux types de traces.
 La première desserve 5 stations de travail (17 008 accès) et
 L’autre 32 stations de travail ( 118 105 accès).
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
12
Hit ratio
Boston University
Traces
Virginia Tech traces
DEC-U1 traces
DEC-U2 traces
Relative cache size %
Résultats :
GD-Size(1) donne le meilleur hit ratio, suivi de GD-Size(packets).
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
13
Byte hit ratio
Boston University
Traces
DEC-U2 traces
Virginia Tech
traces
DEC-U1 traces
Relative cache size %
Résultats :
GD-Size( packets) domine pour le byte hit ratio.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
14
Reduced Latency
Boston University
Traces
DEC-U1 traces
DEC-U2 traces
Relative cache size %
Résultats :
 GD-Size(1) donne est le meileur
 GD-Size(latency) et GD-Size(packets) viennent aprés.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
15
Hops Reduction
Boston University
Traces
Virginia Tech traces
DEC-U1 traces
DEC-U2 traces
Relative cache size %
Résultat:
 GD-Size(hops) accomplit le mieux
Les algorithmes qui prennent en considération le coût réseau
accomplissent mieux que ceux qui le néglige.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
16
Synthèse
Selon l’objectif qu’on veut atteindre :
• Grand hit ratio ou faible average latency
 GD-Size (1)
• Grand byte hit ratio
 GD-Size ( packets )
• Les documents ont des coûts associés au réseau
 GD-Size ( hops ) ou GD-Size ( weightedhops )
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
17
Conclusion
• Simplicité de l’algorithme.
• Combine la localité, la taille et le coût.
• Plusieurs variantes.
• Dépasse expérimentalement les autres algorithmes
existants dans plusieurs aspects ( hit ratio, byte hit
ratio,…).
• Plusieurs traces pour la simulation.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
18
Critiques
• Quel l’algorithme qu’on doit utiliser ?
• L’algorithme optimise un seul critère de performance
à la fois.
Comment l’ajuster pour qu’il puisse être multi-critères ?
• L’intégration du Prefetching avec l’algorithme de
remplacement.
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
19
Questions ?
Guebli Sid Ali
Cost-Aware WWW Proxy Caching
Algorithms
20
Téléchargement