 S é m i n a i r e


Arbres équilibrés en RAM

Structures de fichiers unidimensionnelles

Structures de fichiers multidimensionnelles

Structures de fichiers distribuées

Les structures de données constituent un concept vital dans la science des ordinateurs : quelque soit le problème que l’on veut automatiser, on se trouve toujours confronter au choix des structures de données les mieux adaptées à l’implémentation de sa solution.  


Nous envisageons deux volets fort intéressants:

- les arbres de recherche binaires équilibrés en RAM

- les structures de fichiers


Les arbres constituent les structures de données les plus utilisées en RAM. Ces derniers sont efficaces seulement quand ils sont équilibrés.

Bien que les  arbres 2-3 et 2-4 sont équilibrés par construction, ils consomment un espace non utilisé du aux nœuds non complètement remplis. Afin d'éviter ceci, les arbres de Anderson ( arbres AA) et de Sedgewick (arbres Red Black) ont été proposés comme des alternatives  aux arbres BB (Binary B-trees) et SBB (Symmetric Binary B-trees) qui ne sont en fait que des  représentations en arbre de recherche binaire des arbres 2-3 et 2-4 respectivement. En dépit de plusieurs propositions d'arbres de recherche binaire équilibrés, les arbres d'Adelson/Velscii/Landis (arbres AVL), historiquement les premiers, restent toujours les arbres les plus équilibrés.


Dans tous les sortes d'arbres cités, les algorithmes ont pour rôle de maintenir dynamiquement l'équilibrage de l'arbre. Une autre catégorie d'algorithmes permettent d'équilibrer l'arbre à postériori et périodiquement. L'algorithme de Day/Stout/Warren  (DSW) is certainement l'une des méthodes les plus efficaces.


Les structures de fichiers peuvent être étudiées de plusieurs points de vue :

- Organisation directe(table d'index ou hash-code) ou organisation d'arbre ( tables d'index hiérarchisées

- Simple attribut, plusieurs attributs

- Statique ou dynamique

- Préservation de l'ordre ou pas

- Local ou distribué



Aussi, le module que nous proposons couvre trois catégories de structures de fichiers :  Les structures de fichiers unidimensionnelles , multidimensionnelles et distribuées.



Afin de donner plus de clarté et plus de facilité pour ce cours, nous avons choisi trois structures de données uni-dimensionnelles de pointe : B-arbres,  LH ( Linear Hashing) et TH ( Trie Hashing ). Ensuite, nous leur avons donné les généralisations dans les cas multidimensionel (LHM : Multidimensional Linear hashing, MTH : Multidimensional Trie Hashing et MBtrees : Multidimensional B-trees ) et distribué ( LH*, TH* et RP*).



Structures de fichiers uni-dimensionnelles


Les structures de fichiers uni-dimensionnelles permettent l’accès aux fichiers par une seule clé dite clé primaire. Il existe deux classes de structures de fichiers : celles à base de hachage et celles à base d’arbre.

L’une des structures de fichiers les plus populaires est celle des B-arbres et de ses variantes. Ce sont des structures de données qui préservent l’ordre des articles et de plus elles ont un comportement dynamique.


Vers les années 80, une nouvelle forme de hachage avait vu le jour grâce aux travaux de Litwin et Larson. Cette nouvelle forme de hachage, appelée hachage dynamique, a bouleversé les idées sur le hachage au sens de Knuth qui sont caractérisées par le fait que la fonction de hachage est une fonction mathématique produisant des adresses aléatoires dans un intervalle limité. Parmi les premiers travaux sur le hachage dynamique, on peut citer LH ( Linear Hashing) et TH ( Trie Hashing).  



Structures de fichiers multi-dimensionnelles


Les méthodes traditionnelles pour l’accès aux données multidimensionnelles ( par plusieurs critères ) nécessitent l’emploi des tables d’index secondaires organisées sous forme de listes inversées. Ces méthodes se sont avérées très coûteuses en espace et en temps. Des méthodes modernes ont été apparues entre les années 80 et 90. La plupart des méthodes sont à base de hachage dit hachage dynamique. Ces méthodes n’utilisent pratiquement pas d ‘index et permettent un accès très rapide à l’information. Nous présenterons trois méthodes : MHL, HTM et MB-trees ; M pour multidimensionnel .  



Structures de fichiers distribuées



Une nouvelle classe de structures de données a émergé cette dernière décennie. Cette classe a été baptisée SDDS : Scalable Distributed Data Structures. Elle est caractérisée par l’absence d’un site maître, l’absence de dialogue entre les clients et la scalabilté.  Cette dernière caractéristique stipule que le fichier peut grandir indéfiniment sans dégradation des performances des opérations sur le fichier. Les SDDS utilisent des machines à partage de rien  ( nothing sharing ). Ces machines constituent ce qu’on appelle un multiordinateur ( réseau d’ordinateurs ). Nous commençons par décrire les SDDS et par rappeler quelques termes relatifs aux réseaux avant de présenter trois classes très différentes de SDDS : Lh*, Th* et Rp*.



Autres structures de données


A coté de ces structures de données, il existe celles qui sont spécifiques à un domaine précis. Aussi les 'quadtrees', par exemple,  sont des structures de données orientées images, les 'R-trees' sont des structures de données orientées données spatiales, etc.


PARTIE 0 : Introduction & Pré-requis  


1. Introduction

2. Pré- requis : Structures de données classiques

3. Pré- requis : Structures de fichiers classiques



PARTIE 1 : ARBRES équilibrés EN RAM  


4. Arbres AVL

5. Arbres 2-3

6. Arbres 2-4

7. Arbres RB

8. Arbres AA

9. Arbres LLRB




10. B-arbres    

11. B+-arbres

12. B+-arbres avec expansion partielle

13. Hachage dynamique

14. Hachage linéaire

15. Hachage digital




16. Concept du multidimensionnel    

17. B-arbres multidimensionnels

18. Hachage linéaire multidimensionnel ( LHM )

19. Hachage digital multidimensionnels ( THM )




20. Structures de données distribuées

21. Concept réseau

22. Hachage linéaire distribué ( LH* )

23. B-arbres distribués ( RP* )

24  Hachage digital distribué ( TH* )


