Vous êtes ici : UVSQ RechercheDoctoratSoutenances de thèse

«Analyse et optimisation de performances sur architectures multicoeurs» par Andres Salim Charif-Rubial

Présentée par : Andres Salim Charif-Rubial Laboratoire : PRISM Discipline : informatique

Résumé :
L’augmentation rapide du nombre de cœurs dans les processeurs actuels ne se traduit pas par une mise à l'échelle en conséquence de la bande passante mémoire. Or les performances dépendent de plus en plus des motifs d'accès à la mémoire. Les transformations permettant d'améliorer aussi bien la localité spatiale que temporelle, deviennent incontournables pour les applications de calcul haute performance.
Il existe un réel besoin d'outils d'évaluation et d'amélioration de performance permettant de mieux appréhender les problèmes dont souffrent les applications parallèles, et ainsi de mieux tirer parti de l'énorme puissance de calcul disponible et qui ne cesse de croitre.
Nous débutons par la présentation de l'outil d'analyse de performance MAQAO.
Nous montrons comment il permet, grâce au couplage d'analyses statiques et dynamiques, de mieux cerner les problèmes d'évaluation de performance, qui possèdent en générale plusieurs facettes.
Nous décrivons ensuite la première contribution majeure de cette thèse, à savoir un langage dédié à l'instrumentation permettant de construire efficacement des outils d’évaluation de performance à surcoûts réduits.
Finalement, nous mettons en avant un outil de caractérisation du comportement mémoire d'applications, qui représente la seconde contribution majeure. Notre travail se focalise aussi bien sur les problèmes mono-thread que multi-thread. Nous utilisons plusieurs analyses permettant de déceler des motifs d'accès à la mémoire inefficaces ainsi que de rechercher les problèmes liés à l'interaction entre plusieurs threads et affectant la hiérarchie mémoire (les caches).

Abstract :
The fast increase in the number of cores of modern Chip Multiprocessors (CMP) is not followed by a similar increase of memory bandwidth. Performance depends more and more on access patterns and transformations enhancing spatial or temporal locality are essential for high performance applications.
There is a need for performance tuning tools in order to gain a better understanding of issues suffered by parallel applications and thus to harness the ever-increasing available horsepower.
In this thesis, we first present the MAQAO performance analysis tool. We show how it combines static and dynamic analyses in order to better understand performance evaluation issues which are generally multifaceted.
We then describe the first major contribution of this thesis, a domain specific instrumentation language (DSL) to easily build low-overhead performance evaluation tools.
Finally, we propose a tool to characterize the memory behaviour of applications, which is the second major contribution. Our work focuses both on single threaded and multi-threaded issues. We use several analyses to detect inefficient access patterns and lookup for issues related to interactions between threads, and their impact on the memory hierarchy (caches).
Informations complémentaires
Philippe CLAUSS, Professeur des Universités, à l’Université de Strasbourg/Laboratoire des Sciences de l'Image, de l'Informatique et de la Télédétection (LSIIT) - Illkirch - Rapporteur
David LEVINTHAL, Ingénieur de Recherche, à Google - Mountain View (Etats-Unis) - Rapporteur
William JALBY, Professeur des Universités, à l’Université de Versailles Saint-Quentin-en-Yvelines/Laboratoire Parallélisme, Réseaux, Système, Modélisation (PRISM) - Versailles - Directeur de thèse
Denis BARTHOU, Professeur des Universités, à l’Université de Bordeaux 1/Laboratoire Bordelais de Recherche en Informatique (LaBRI) - Talence - Examinateur
Allen MALONY, Professeur des Universités, à l’Université d’Oregon - Eugene (Etats-Unis) - Examinateur
Raymond NAMYST, Professeur des Universités, à l’Université de Bordeaux 1/Laboratoire Bordelais de Recherche en Informatique (LaBRI) - Talence - Examinateur
Contact :
dredval service FED :