Thèses de magister soutenues

Comparaison entre les B-arbres et le hachage digital pour l'accès multi-multidimensionnel.

Description et simulation des architectures parallèles de type SIMD.

Hachage digital multidimensionnel compact avec expansion partielle.

Élaboration d'un modèle pour les SGBD Objet parallèles et réalisation de son exécuteur de requêtes.

Distribution du ‘Hachage par ‘interpolation’ ( HI ) Conformément aux contraintes des SDDS(Scalable Distributed Data Structures)  

Gestion de transactions dans Act21

Reprises après pannes dans Act21

CTH* avec utilisation massive du multicast

Un système à base d'acteurs pour l'interrogation des BDD en langage naturel

Etude comparative des méthodes CTH* et DRT*

Adaptation de la méthode CTH (Compact Trie Hashing) à un environnement distribué mobile

Adaptation des SDDS dans les réseaux téléphoniques Ad-hoc

Adaptation de CTH* aux architectures peer-to-peer

Distribution des données selon la méthode PBST sur les ‘Grid Computer’

Vers une analyse d’images spatiales par bissections

 

Thèses de magister en cours

Traitement d’images à base de PBST   (Partionned Binary Search Tree)

 


 

SUJET Comparaison entre les B-arbres et le hachage digital pour l'accès multi-multidimensionnel
PRÉSENTÉ PAR W.K  HIDOUCI
Après une étude bibliographique importante et très riche en matière de structuration des données sur les médias, Il est demandé d'abord de faire un état de l'art sur ce domaine, surtout en ce qui concerne l'aspect multidimensionnel puis étudier deux schémas "antagonistes" : un schéma représentatif des B-arbres et un autre représentatif du hachage dynamique pour l'accès multidimensionnel.
Le travail consiste dans un premier temps, à retrouver les algorithmes pour les deux méthodes, de les réaliser afin de pouvoir les comparer en procédant essentiellement par simulation. La comparaison portera aussi sur les algorithmes de maintenances et les différents facteurs pouvant affecter une technique d'accès aux fichiers.
top vers la page ENCADREMENT

 

SUJET Description et simulation des architectures parallèles de type SIMD.
PRÉSENTÉ PAR L. DAHMOUNE
Le travail consiste dans un premier temps à étudier et développer un logiciel   ( en C/Unix/Xwindows) permettant de construire une machine parallèle SIMD virtuelle, puis dans un deuxième temps d'évaluer ses performances.
Après une étude bibliographique importante sur le parallélisme et notamment  sur les machines parallèles du type SIMD, un simulateur a été développé. On a ainsi défini une machine avec ses principaux paramètres puis écrit toutes les procédures de communication associées aux diverses topologies aussi bien statiques que dynamiques   telles que les tableaux linéaires, les anneaux, les grilles 2D, les réseaux   'cross bar', etc.
Le logiciel est orienté vers la pédagogique et offre les possibilités suivantes :
- Présenter des algorithmes parallèles
- Modéliser les machines parallèles
- Simuler l'exécution et évaluer les performances d'un algorithme parallèle donné sur une machine SIMD donnée.
Des outils sont alors offerts pour les mises au point et contrôle.
top vers la page ENCADREMENT

 

SUJET Hachage digital multidimensionnel compact avec expansion partielle.
PRÉSENTÉ PAR M. ARIDJ
De nos jours, les méthodes pour l'accès multi-attributs n'utilisent plus le concept des listes inversées, longtemps utilisées dans les langages à requêtes multiples, qui consistent à associer à chaque attribut une table d'index secondaire.
Les techniques actuelles visent un accès disque, pour une requête à plusieurs attributs. On peut citer les articles de Burkhard, Nievergelt, Otto, et beaucoup d'autres.
Le schéma proposé est original. D'une part, on exige que la technique du hachage digital soit utilisée sous sa forme séquentielle ( représentation compacte). D'autres part, les blocs adressés ne sont pas fixes selon l'idée de l'expansion partielle, récemment développée sur  les arbres B+ ( Article de Ricardo et Larson ).
Le travail consiste dans un premier temps à étudier ce schéma en retrouvant tous les algorithmes qui s'y rattachent, puis dans un deuxième temps, évaluer ses performances principalement par simulation.
De plus, il serait souhaitable de réaliser une application ( bibliothèque ) en se servant de ce schéma et montrer l'apport par rapport à ce qui existe.
top vers la page ENCADREMENT

 

 

 


SUJET

SUJET Élaboration d'un modèle pour les SGBD Objet parallèles et réalisation de son exécuteur de requêtes.
PRÉSENTÉ PAR S. DELLYS     ( Abandon )
De nos jours, les SGBD objets tendent à remplacer la génération des systèmes relationnels du fait de leur puissance de modélisation. Dans le même temps, les machines à architecture parallèle ainsi que les stations de travail interconnectées en réseaux à grand débit, font l'objet d'intenses recherches. Il serait donc intéressant d'intégrer ces deux concepts (bases de données objet et systèmes parallèles) afin d'aboutir à une nouvelle génération de SGBD à modèle de donnée riche tout en profitant des performances des nouvelles architectures.
Le travail demandé consiste à étudier les différents travaux effectués dans ce domaine et de faire une synthèse des différentes approches adoptées dans le but de proposer un modèle de données et de réaliser un prototype d'exécuteur de requêtes pour un sous ensemble de ce modèle.
top vers la page ENCADREMENT

 

 


SUJET Distribution du ‘Hachage par ‘interpolation’ ( HI ) Conformément aux contraintes des SDDS(Scalable Distributed Data Structures)
PRÉSENTÉ PAR D. BOUKHLEF   

Le Hachage par interpolation ( HI ) est une extension du hachage linéaire conçue principalement pour l’accès multidimensionnel. La technique préserve l’ordre des clés et utilise une fonction de projection particulière ( ‘Shuffle Order’) pour transformer une clé multi-attribut en une adresse. L’objectif de ce travail est d’étendre la technique dans un environnement distribué tout en respectant les contraintes des Sdds

Les structures des données distribuées et ‘scalables’ (SDDS)  sont  une famille des structures de données dédiées spécialement pour les traitements distribués s’effectuant généralement sur une architecture multi-ordinateurs.

Les SDDS ont été proposées au début des années 90. Leur principe de base consiste à stocker les données sur des sites désignés Serveurs. D’autres sites appelés Clients y accèdent. Les sites Clients gardent généralement des paramètres pour les opérations sur des fichiers distribués sur les sites Serveurs.

Le but de ce travail est multiple :
- initiation à la recherche sur les structures de données distribuées
- Définition d'un schéma pour distribuer HI
- Mise en œuvre d'un protocole de communication ( sous Unix) pour tester le nouveau schéma. 
- Simulation et comparaison avec les méthodes concurrentes.

top vers la page ENCADREMENT

Projet "ACT"

 


 

SUJET Gestion de transactions dans Act21
PRÉSENTÉ PAR AMROUCHE Hakim

 Act21 est un SGBD parallèle basé sur un modèle de données par acteurs en cours de développement à l’INI (Projet de recherche Act21). Ce système intègre les objets actifs (acteurs) et les nouvelles structures de données distribuées (SDDS) dans les bases de données. L’architecture en couches du SGBD est  comme suit :

-  Au niveau le plus interne, on a un gestionnaire de fichiers répartis à base de SDDS.

-  Au niveau intermédiaire, se trouve un gestionnaire d’acteurs et de catalogues.

- Au niveau externe, on trouve un interpréteur de requêtes et un langage de programmation de bases de données par acteurs (PACT).

La notion de transaction existe aussi bien dans les SGBD centralisés que dans les SGBD réparti. Une transaction est une suite d’opérations sur la base de données, devant s’exécuter de manière atomique (soit toutes les opérations de la transactions s’exécutent soit aucune), de plus un ensemble de transactions lancées en parallèle doit avoir le même effet qu’une exécution en série de ces même transactions.

Le problème majeur de la gestion des transactions est l’interblocage (dead lock) où deux ou plusieurs transactions parallèles sont bloquées en attente de ressources verrouillées par ces même transactions . En général plus le degré du parallélisme entre transactions est grand, plus le risque d’interblocage est important..

Le travail demander est d’abord d’étudier les différentes solutions existantes pour les bases de données réparties dans les modèles relationnels et objet. Ensuite de proposer un modèle de transaction adapté à la programmation par acteurs pour être utilisé dans Act21. Un gestionnaire de transaction par acteurs devra alors être réalisé.

Echéancier :

- Etude sur la gestion des transactions réparties (relationnel et objet).(3 mois)

- Choix et solutions adoptés pour le modèle Act21. (3 mois)

- Réalisation d’un prototype de gestionnaire de transaction par acteurs.(4 mois)

- Tests et  rédaction. (2 mois)

top vers la page ENCADREMENT

Projet "ACT"

 


 

SUJET Reprises après pannes dans Act21
PRÉSENTÉ PAR LOUNES NAIMA

 Act21 est un SGBD parallèle basé sur un modèle de données par acteurs en cours de développement à l’INI (Projet de recherche Act21). Ce système intègre les objets actifs (acteurs) et les nouvelles structures de données distribuées (SDDS) dans les bases de données. L’architecture en couches du SGBD est  comme suit :

- Au niveau le plus interne, on a un gestionnaire de fichiers répartis à base de SDDS.

- Au niveau intermédiaire, se trouve un gestionnaire d’acteurs et de catalogues.

- Au niveau externe, on trouve un interpréteur de requêtes et un langage de programmation de bases de données par acteurs (PACT).

Le travail demander est de réaliser une solution pour la reprise après panne au niveau intermédiaire de l’architecture Act21 (gestionnaires d’acteurs et de catalogues).

Une base de données sous Act21 peut être vue comme un ensemble d’acteurs coopératifs dans un réseau d’ordinateurs. Chaque site abrite alors un ensemble d’acteurs résidant en mémoire centrale.

En cas de panne d’un ou plusieurs sites (et/ou lignes de communications). Le reste du système distribué doit rester dans la mesure du possible fonctionnel. Lors de la reprise du ou des sites qui étaient en panne, ces derniers doivent se re-synchroniser avec le reste du système soit en continuant soit en annulant leurs tâches interrompues par la panne. La base de données doit rester dans un état cohérent. L’une des techniques de reprise après pannes est l’utilisation de fichiers journaux à écriture directe (sans passer par les buffers systèmes).

Echéancier :

- Etude théorique sur les techniques de reprises utilisées dans les SGBD répartis (relationnels et objets). (3 mois)

- Choix et proposition de solutions adaptés au modèle Act21.(2 mois)

- Implémentation des techniques de reprise au niveau du gestionnaire d’acteurs.( 4 mois)

- Tests et rédaction du mémoire.(3mois)

top vers la page ENCADREMENT

Projet "ACT"

 


SUJET CTH* avec utilisation massive du multicast.
PRÉSENTÉ PAR K. AIT ALI

Une classe de structures de données appelée SDDS « Scalable Distributed Data Structures » a été conçue cette dernière décennie pour répondre aux besoins d’un environnement distribué.

Plusieurs algorithmes ont été proposés dont LH*, RP*, DRT, etc.

Récemment, une nouvelle famille de SDDS  a vu le jour. Les nouveaux algorithmes sont à base de la méthode « Trie Hashing » (TH*).

Plusieurs variantes sont proposées :  Hachage digital avec l’arbre décentralisé sans multicast, Hachage digital avec l’arbre centralisé sans multicast, Hachage digital avec Multicast.

Le présent travail a trait à la variante qui utilise intensément le Multicast.  Il s’agit d’étudier le schéma afin de déduire les algorithmes et de les réaliser dans un réseau d’ordinateurs.

Une étude comparative avec les méthodes utilisant le Multicast notamment LH* et RP*C est à faire.

Outils de travail : Linux et PVM/
 

top vers la page ENCADREMENT

Projet "SDDM"

 


SUJET Un système à base d'acteurs pour l'interrogation des BDD en langage naturel
PRÉSENTÉ PAR A. BADAOUI

Le travail s'inscrit dans le cadre du projet ACT21 en cours de développement à l'INI. Il consiste à proposer une architecture d'un système autorisant la manipulation d'une BDD en langue naturelle. Ce système recevra en entrée une question en langage naturel, la traduit en une requête SQl et la transmet au module EXEC chargé de l'exécution des requêtes de type SQL.

top vers la page ENCADREMENT

Projet "ACT"

 


 

SUJET Etude comparative des méthodes CTH* et DRT*
PRÉSENTÉ PAR Y. Benmoussa

CTH* et DRT* sont deux structures de données distribuées et scalables (SDDS). Chacune des deux méthodes utilise un arbre particulier pour représenter la fonction d'accès d'un client à un fichier distribué. De plus, chaque méthode a sa politique de distribution des données et de l'arbre sur les serveurs de données.
Il s'agit d'étudier les deux méthodes en détail afin de les comparer.
Actuellement, CTH* est implémenté sur la plateforme LINUX.
Concrètement, il est donc demandé de réaliser DRT* dans les mêmes conditions afin de faire des mesures de performances.
 

top vers la page ENCADREMENT

Projet "ACT"

 

 


SUJET Adaptation de la méthode CTH (Compact Trie Hashing) à un environnement distribué mobile
PRÉSENTÉ PAR AMAR-KHODJA M.

On assiste cette dernière décennie à l’émergence d’une nouvelle classe de structures de données consacrée à un environnement distribué. L’avantage de cette tendance est de tirer profit des performances affichées par ces structures de données dans un contexte mono ordinateur, tout en profitant des avantages offerts par les réseaux d’ordinateurs (grande capacité de stockage, traitement parallèle, sensibilité aux pannes réduite …).

Les principales structures de données distribuées existantes actuellement sont : LH (Linear Hashing), TH (Trie Hashing) et RP (Rang Partitionning).

Le travail se portera sur l’adaptation d’une variante de TH (CTH : Compact TH) à un environnement distribué et mobile. Dans cette optique, on devra non seulement tenir compte des caractéristiques des systèmes distribués (distribution des données, absence du site maître, scalabilité …), mais en respectant aussi les contraintes liées à l’indépendance des déplacements.

top vers la page ENCADREMENT

Projet "SD2M"

 

 


SUJET Adaptation des SDDS dans les réseaux téléphoniques Ad-hoc
PRÉSENTÉ PAR KHELDOUN A.

Il s’agit  dans un premier temps d’étudier les structures de données distribuées et scalables (SDDS) et leur implémentation dans une architecture P2P.

Puis, dans un deuxième temps, faire un état de l’art sur les réseaux téléphoniques mobiles et plus particulièrement sur les réseaux Ad hoc. Cette étude sera orientée principalement dans les transmissions des données.

Le travail demandé consiste à concevoir une plate-forme permettant l’implantation des SDDS dans une architecture mobile P2P Ad hoc.

Nous considérons comme SDDS la méthode CTH* ( Distributed Compact Trie Hashing) et nous nous contentons des outils de simulation existants pour implémenter la méthode, puis procéder à des tests.

top vers la page ENCADREMENT

Projet "SD2M"

 


SUJET Adaptation de CTH* aux architectures peer-to-peer
PRÉSENTÉ PAR BENNACEUR Amel

Le hachage digital compact distribué (CTH*) est une structure de données distribuée et scalable qui permet de gérer de grands volumes de données tout en maintenant des performances stables et optimales et en préservant l'ordre des enregistrements.
CTH* a été implémenté sur différents environnements distribués fixes et mobiles et a permis de réaliser des temps d'accès courts et indépendants de la taille du fichier.

L'objectif est d'élaborer une nouvelle plate-forme CTH* basée sur une architecture peer-to-peer et qui permettra, d'une part, de réduire le nombre de messages nécessaires au traitement des requêtes et, d'autre part, de passer facilement à une plate-forme totalement mobile.

top vers la page ENCADREMENT

Projet "SD2M"

 


SUJET Distribution des données selon la méthode PBST sur les ‘Grid Computer’
PRÉSENTÉ PAR CHIKHAOUI Amina

On désigne par ‘Grid Computing’ l’utilisation  de plusieurs ordinateurs  pour résoudre simultanément un problème donné qui consomme généralement beaucoup de temps CPU et /ou de quantité de données.

PBST (Partitioned Binary Search Tree) est une nouvelle structure de données dont le but principal est le partitionnement de données.

Il s’agit de faire une étude bibliographique sur les ‘Grid computing’.

Il serait intéressant de combiner la méthode PBST avec les ‘grid computing’ pour réaliser les traitements parallèles sur les données.

top vers la page ENCADREMENT

Projet "D3"

 


SUJET Vers une analyse d’images spatiales par bissections
PRÉSENTÉ PAR GOUGACHE Mohammed

Les applications spatiales sont l'un des domaines qui connaît depuis quelques années un formidable essor. Encore réservée à des spécialistes il y a une dizaine d'années, l'utilisation de données spatiales se répand au sein d'un public de plus en plus large. A l'origine cantonnées dans les applications traditionnelles de cartographie, aujourd'hui les données spatiales sont utilisées dans des domaines très variés, tels que le web-mapping, les entrepôts de données, les systèmes d’informations géographiques, la conception assistée par ordinateur (CAD)…, mais aussi dans la mise en œuvre de stratégies de prévention ou de planification (pour la protection de l'environnement, l'étude de la démographie, etc.).

     Les bases de données spatiales sont caractérisées par leur importante taille. Et par conséquence, les requêtes spatiales prennent un temps considérable dans leur exécution. Afin de résoudre ce problème, les SGBD spatiaux utilisent d’autres méthodes d’indexation plus adaptées  à ce type de données.

     Les index spatiaux à base d’arbre R (R trees) sont les plus recommandés à cause de plusieurs avantages qu’ils offrent : l’adaptation aux changement, la non-redondance des données, l’efficacité en temps de réponse.

    Il s’agit de considérer des bases de données spatiales 3D  indexées par les R_trees,  d’étudier et/ou proposer les algorithmes permettant de réaliser des opérations de bissections (coupes par différent sortes de plan au sens mathématique).

top vers la page ENCADREMENT

 

 

 


SUJET Traitement d’images à base de PBST   (Partionned Binary Search Tree)
PRÉSENTÉ PAR

BOUCIF Mohamed El Amine

Le traitement des images reste toujours l’un des problèmes les plus étudiés. L’efficacité du traitement dépend principalement de la structure de données utilisée pour la représentation des images. Plusieurs structures de données ont été proposées dans ce cadre. Ces dernières sont basées essentiellement sur le partitionnement des images (données). Comme la structure PBST (Partitioned Binary Search Tree) est une nouvelle structure de données dont le rôle principal est le partitionnement de données,  il serait donc intéressant de classer cette méthode parmi celles utilisées dans le traitement des images.

Il s’agit dans un premier temps de recenser les principales structures de données utilisées.

Dans un deuxième temps, il est question d’étudier la structure PBST et son adaptation à la représentation et le traitement des images.

La méthode ne peut être validée qu’à travers des tests et de comparaisons avec les méthodes compétitives.

Une plateforme de tests est donc à réaliser.

top vers la page ENCADREMENT