Vous êtes ici : UVSQ RechercheHDR

"Contributions aux systèmes de stockage de données : modélisation, simulation et outils d’évaluation" par Soraya Zertal

Discipline : Informatique

le 18 mai 2018

Le Vendredi 18 Mai 2018 à 14h
UFR des Sciences de Versailles
Bâtiment Descartes - Salle 301
45 Avenue des états unis
78000 Versailles
Résumé
L'explosion des volumes de données manipulées et que les systèmes sont amenés à stocker, accèder, traiter et gérer atteignent les Exa-octets. Cette progression va continuer dans le futur, tout specialement à cause des supports mobiles et communiquants. En conséquance, l'étude des systèmes de stockage represente un intérêt certain aussi bien pour la performance que pour la robustesse. Durant ces dernières années, mes travaux de recherche ont abordé trois thèmes de ce domaine, alliant les aspects technologiques et théoriques. Premièrement, la proposition de stratégies de placement de données pour répondre aux critères de performance et de robustesse. Deuxièmement, le dévelopement de simulateurs pour les systèmes de stockage larges et hétérogènes avec la production du logiciel libre OGSSim, mis à la disposition de la communauté scientifique. Troisièmement, la proposition de modèles analytiques à base de files d'attente et fluide pour représenter de tels systèmes. L'ensemble de ces outils et modèles a été validé et calibré. La caractérisation des profils d'entrées/sorties en utlisant les processus Markovien cachés, compléte ces travaux et permet la conception, l'analyse et la prediction de l'impact de chaque paramètre d'une application sur le système de stockage dans le but d'atteindre la performance et la fiabilité exigées. J'ai considéré les systèmes basés sur les mémoires Flash, pour appliquer ces stratégies, outils et modèles en raison de la place prépondérante que cette technologie occupe sur le marché du stockage. La compréhension fine de son utilisation et de son comportement est le paramètre clé pour décupler sa performance et renforcer sa robustesse selon le contexte d'utilisation.
Plusieurs extensions découlent de ces contributions: certaines sont impulsées par les ordres de grandeurs non atteints pour le moment comme les systèmes distribués à base de Blobs, certaines sont impulsées par les nouvelles technologies des supports de stockage avec l'avènement des mémoires non-volatiles avec comme conséquence directe la révision complète du stockage et un nouveau champs applicatif à déterminer et certaines sont impulsées par l'analyse prédictive appliquée aux profils des entrées/sorties pour accélérer leur traitement.

Abstract
The increasing amounts of manipulated data that systems are storing, accessing, processing and managing are reaching the Exabytes. This will continue in the future, especially due to mobile and communicating devices. Consequently, storage systems are a focus of interest considering both performance and robustness features. During these last years, my research works addressed three topics in this field covering both technological and theoretical aspects. First, the proposition of data placement schemes to meet performance and/or robustness criteria. Second, the development of simulators for heterogenous and very large storage systems with OGSSim as an open-source tool, made available for the storage community. Third, the proposition of queueing and fluid models to represent such systems. All these tools and models were validated and calibrated. Then, achieving I/O profiles characterisation using Hidden Markovian Models completes these works and gives the ability to design, analyse and predict the impact of any application feature on the storage system in order to meet the requirements in terms of performance and reliability.
I considered Flash-based systems as particular focus of interest to apply these strategies, tools and models because this technology figures prominently in the storage market. The fine comprehension of its usage and behaviour is the key to multiply its delivered performance and enhance its robustness according to the context of use.
Many extensions arise from these contributions, some driven by scales not seen yet as distributed Blobs storage, some driven by the hardware technology with the advent of non-volatile memories, the related storage overhaul and the new appropriate applications scope and some driven by predictive analysis applied to applications profiles for I/O process acceleration.
Informations complémentaires
Monsieur Allen MALONY , Professeur des Universités, Université d'Oregon - Rapporteur
Monsieur François BODIN, Professeur des Universités, Université de Rennes - Rapporteur
Monsieur Jean-François MEHAUT, Professeur des Universités, Université de Grenoble - Rapporteur
Monsieur Pierre SENS, Professeur des Universités, Université Pierre et Marie Curie - Examinateur
Monsieur Peter HARRISON, Professeur des Universités, Imperial College London- Examinateur
Monsieur Jacques-Charles LAFOUCRIERE, Directeur du service informatique, CEA-DAM - Membre invité
Monsieur William JALBY, Professeur des Universités, Université de Versailles Saint-Quentin-en-Yvelines - Tuteur
Contact :
DSR - Service FED :