10 results on '"Keller Tesser, Rafael"'
Search Results
2. A lightweight performance proxy for deep‐learning model training on Amazon SageMaker.
- Author
-
Keller Tesser, Rafael, Marques, Alvaro, and Borin, Edson
- Subjects
ESTIMATION theory ,CLOUD computing ,PRICES ,DEEP learning - Abstract
Summary: Cloud computing has become popular for training deep‐learning (DL) models, avoiding the costs of acquiring and maintaining on‐premise systems. SageMaker is a cloud service that automates the execution of DL workloads. Its features include automatic hyperparameter optimization and use of spot instances. Nonetheless, it does not assist in selecting the right instance type for a workload. In public clouds, rent price depends on the configuration of the chosen instance type. Advanced and faster instances are typically more expensive, but not always the best choice. To select the optimal instance type, users must compare the workload's relative performance (and hence cost) on several candidates. Building on the execution profiles of multiple DL applications, we model the performance and cost of training DL applications on SageMaker and propose a lightweight technique to estimate these at low temporal and monetary cost. This method is a performance proxy that can be used to replace more expensive performance measurement procedures. So, it could speed up any technique that relies on such measurements. We show how it can help cloud customers seeking suitable instance types to train DL models, and that it can accurately predict the performance of different instance types when training these models on SageMaker. [ABSTRACT FROM AUTHOR]
- Published
- 2024
- Full Text
- View/download PDF
3. Using Simulation to Evaluate and Tune the Performance of Dynamic Load Balancing of an Over-Decomposed Geophysics Application
- Author
-
Keller Tesser, Rafael, Mello Schnorr, Lucas, Legrand, Arnaud, Dupros, Fabrice, Olivier Alexandre Navaux, Philippe, Hutchison, David, Series editor, Kanade, Takeo, Series editor, Kittler, Josef, Series editor, Kleinberg, Jon M., Series editor, Mattern, Friedemann, Series editor, Mitchell, John C., Series editor, Naor, Moni, Series editor, Pandu Rangan, C., Series editor, Steffen, Bernhard, Series editor, Terzopoulos, Demetri, Series editor, Tygar, Doug, Series editor, Weikum, Gerhard, Series editor, Rivera, Francisco F., editor, Pena, Tomás F., editor, and Cabaleiro, José C., editor
- Published
- 2017
- Full Text
- View/download PDF
4. Containers in HPC: a survey
- Author
-
Keller Tesser, Rafael, primary and Borin, Edson, additional
- Published
- 2022
- Full Text
- View/download PDF
5. Simulation et évaluation de performance de l'équilibrage de charge dynamique d'applications parallèles itératives sur-décomposées
- Author
-
Keller Tesser, Rafael, Universidade Federal do Rio Grande do Sul [Porto Alegre] (UFRGS), Performance analysis and optimization of LARge Infrastructures and Systems (POLARIS ), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'Informatique de Grenoble (LIG ), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Universidade Federal Do Rio Grande Do Sul, Philippe Olivier A. Navaux, and Arnaud Legrand (arnaud.legrand@imag.fr)
- Subjects
SimGrid ,over-decomposition ,Calcul parallèle HPC ,iterative applications ,Charm++ ,simulation of distributed systems ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,dynamic load balancing ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,AMPI ,performance evaluation ,Parallel computing: HPC - Abstract
In this thesis we present a novel simulation workflow to evaluate the performance of dynamic load balancing with over-decomposition applied to iterative parallel applications at low-cost. Its goals are to perform such evaluation with minimal application modification and at a low cost in terms of time and of resource requirements. Many parallel applications suffer from dynamic (temporal) load imbalance that can not be treated at the application level. It may be caused by intrinsic characteristics of the application or by external software and hardware factors. As demonstrated in this thesis, such dynamic imbalance can be found even in applications whose codes do not hint at any dynamism. Therefore, we need to rely on runtime dynamic load balancing mechanisms, such as dynamic load balancing based on over-decomposition. The problem is that evaluating and tuning the performance of such technique can be costly. This usually entails modifications to the application and a large number of executions to get statistically sound performance measurements with different load balancing parameter combinations. Moreover, useful and accurate measurements often require big resource allocations on a production cluster. Our simulation workflow, dubbed Simulated Adaptive MPI (SAMPI), employs a combined sequential emulation and trace-replay simulation approach to reduce the cost of such an evaluation. Both sequential emulation and trace-replay require a single computer node. Additionally, the trace-replay simulation lasts a small fraction of the real-life parallel execution time of the application. Besides the basic SAMPI simulation, we developed spatial aggregation and application-level rescaling techniques to speed-up the emulation process. To demonstrate the real-life performance benefits of dynamic load balance with over-decomposition, we evaluated the performance gains obtained by employing this technique on a iterative parallel geophysics application, called Ondes3D. Dynamic load balancing support was provided by Adaptive MPI (AMPI). This resulted in up to 36.58% performance improvement, on 288 cores of a cluster. This real-life evaluation also illustrates the difficulties found in this process, thus justifying the use of simulation. To implement the SAMPI workflow, we relied on SimGrid’s Simulated MPI (SMPI) interface in both emulation and trace-replay modes. To validate our simulator, we compared simulated (SAMPI) and real-life (AMPI) executions of Ondes3D. The simulations presented a load balance evolution very similar to real-life and were also successful in choosing the best load balancing heuristic for each scenario. Besides the validation, we demonstrate the use of SAMPI for load balancing parameter exploration and for computational capacity planning. As for the performance of the simulation itself, we roughly estimate that our full workflow can simulate the execution of Ondes3D with 24 different load balancing parameter combinations in ≈ 5 hours for our heavier earthquake scenario and in ≈ 3 hours for the lighter one.; Dans cette thèse, nous présentons un nouveau workflow de simulation pour évaluer la performance de l'équilibrage dynamique de charge quand on surdécompose des applications parallèles itératives à faible coût. L'objectif est d'effectuer une telle évaluation avec un minimum de modifications des applications et à un faible coût en termes de temps et de ressources nécessaires. De nombreuses applications parallèles souffrent d'un déséquilibre de charge dynamique (temporel) qui ne peut être traité au niveau de l'application. Elle peut être causée par des caractéristiques intrinsèques de l'application ou par des facteurs logiciels et matériels externes. Comme le démontre cette thèse, un tel déséquilibre dynamique se retrouve même dans des applications dont les codes ne laissent entrevoir aucun dynamisme. Par conséquent, nous devons nous appuyer sur des mécanismes d'équilibrage de charge dynamique, tels que l'équilibrage de charge dynamique basé sur la surdécomposition. Le problème est que l'évaluation et l'ajustement des performances d'une telle technique peuvent être coûteux. Cela implique généralement des modifications à l'application et un grand nombre d'exécutions pour obtenir des mesures de performance statistiquement fiables avec différentes combinaisons de paramètres d'équilibrage de charge. De plus, des mesures utiles et précises nécessitent souvent d'importantes allocations de ressources sur un cluster de production. Notre workflow de simulation, appelé SAMPI (Simulated Adaptive Adaptive MPI), utilise une approche combinée d'émulation séquentielle et de simulation en mode trace-replay pour réduire le coût d'une telle évaluation. L'émulation séquentielle et l'analyse de traces nécessitent toutes deux un seul nœud d'ordinateur. De plus, la simulation de trace-replay ne dure qu'une petite fraction du temps d'exécution parallèle réel de l'application. En plus de la simulation SAMPI de base, nous avons développé des techniques d'agrégation spatiale et de redimensionnement au niveau de l'application pour accélérer le processus d'émulation. Pour démontrer les avantages réels de l'équilibrage dynamique de charge avec surdécomposition, nous avons évalué les gains de performance obtenus en utilisant cette technique sur une application itérative de géophysique parallèle, appelée Ondes3D. L'équilibrage dynamique de la charge a été assuré par Adaptive MPI (AMPI). Il en a résulté une amélioration de la performance pouvant atteindre 36,58 % sur 288 cœurs d'une grappe. Cette évaluation en situation réelle illustre également les difficultés rencontrées dans ce processus, justifiant ainsi le recours à la simulation. Pour implémenter le workflow SAMPI, nous nous sommes appuyés sur l'interface Simulated MPI (SMPI) de SimGrid en mode émulation et trace-replay. Pour valider notre simulateur, nous avons comparé les exécutions simulées (SAMPI) et réelles (AMPI) d'Ondes3D. Les simulations ont présenté une évolution de l'équilibrage de charge très similaire à la vie réelle et ont également permis de choisir la meilleure heuristique d'équilibrage de charge pour chaque scénario. En plus de la validation, nous démontrons l'utilisation de SAMPI pour l'exploration des paramètres d'équilibrage de charge et pour la planification de la capacité de calcul. Quant à la performance de la simulation elle-même, nous estimons que notre workflow complet peut simuler l'exécution d'Ondes3D avec 24 combinaisons différentes de paramètres d'équilibrage de charge dans ≈ 5 heures pour notre scénario de séisme plus lourd et dans ≈ 3 heures pour le plus simple.
- Published
- 2018
6. A Simulation Workflow to Evaluate the Performance of Dynamic Load Balancing with Over-decomposition for Iterative Parallel Applications
- Author
-
Keller Tesser, Rafael, Universidade Federal do Rio Grande do Sul [Porto Alegre] (UFRGS), Performance analysis and optimization of LARge Infrastructures and Systems (POLARIS ), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'Informatique de Grenoble (LIG ), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Universidade Federal Do Rio Grande Do Sul, Philippe Olivier A. Navaux, and Arnaud Legrand (arnaud.legrand@imag.fr)
- Subjects
SimGrid ,over-decomposition ,Calcul parallèle HPC ,iterative applications ,Charm++ ,simulation of distributed systems ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,dynamic load balancing ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,AMPI ,Parallel computing: HPC ,performance evaluation - Abstract
In this thesis we present a novel simulation workflow to evaluate the performance of dynamic load balancing with over-decomposition applied to iterative parallel applications at low-cost. Its goals are to perform such evaluation with minimal application modification and at a low cost in terms of time and of resource requirements. Many parallel applications suffer from dynamic (temporal) load imbalance that can not be treated at the application level. It may be caused by intrinsic characteristics of the application or by external software and hardware factors. As demonstrated in this thesis, such dynamic imbalance can be found even in applications whose codes do not hint at any dynamism. Therefore, we need to rely on runtime dynamic load balancing mechanisms, such as dynamic load balancing based on over-decomposition. The problem is that evaluating and tuning the performance of such technique can be costly. This usually entails modifications to the application and a large number of executions to get statistically sound performance measurements with different load balancing parameter combinations. Moreover, useful and accurate measurements often require big resource allocations on a production cluster. Our simulation workflow, dubbed Simulated Adaptive MPI (SAMPI), employs a combined sequential emulation and trace-replay simulation approach to reduce the cost of such an evaluation. Both sequential emulation and trace-replay require a single computer node. Additionally, the trace-replay simulation lasts a small fraction of the real-life parallel execution time of the application. Besides the basic SAMPI simulation, we developed spatial aggregation and application-level rescaling techniques to speed-up the emulation process. To demonstrate the real-life performance benefits of dynamic load balance with over-decomposition, we evaluated the performance gains obtained by employing this technique on a iterative parallel geophysics application, called Ondes3D. Dynamic load balancing support was provided by Adaptive MPI (AMPI). This resulted in up to 36.58% performance improvement, on 288 cores of a cluster. This real-life evaluation also illustrates the difficulties found in this process, thus justifying the use of simulation. To implement the SAMPI workflow, we relied on SimGrid’s Simulated MPI (SMPI) interface in both emulation and trace-replay modes. To validate our simulator, we compared simulated (SAMPI) and real-life (AMPI) executions of Ondes3D. The simulations presented a load balance evolution very similar to real-life and were also successful in choosing the best load balancing heuristic for each scenario. Besides the validation, we demonstrate the use of SAMPI for load balancing parameter exploration and for computational capacity planning. As for the performance of the simulation itself, we roughly estimate that our full workflow can simulate the execution of Ondes3D with 24 different load balancing parameter combinations in ≈ 5 hours for our heavier earthquake scenario and in ≈ 3 hours for the lighter one.; Dans cette thèse, nous présentons un nouveau workflow de simulation pour évaluer la performance de l'équilibrage dynamique de charge quand on surdécompose des applications parallèles itératives à faible coût. L'objectif est d'effectuer une telle évaluation avec un minimum de modifications des applications et à un faible coût en termes de temps et de ressources nécessaires. De nombreuses applications parallèles souffrent d'un déséquilibre de charge dynamique (temporel) qui ne peut être traité au niveau de l'application. Elle peut être causée par des caractéristiques intrinsèques de l'application ou par des facteurs logiciels et matériels externes. Comme le démontre cette thèse, un tel déséquilibre dynamique se retrouve même dans des applications dont les codes ne laissent entrevoir aucun dynamisme. Par conséquent, nous devons nous appuyer sur des mécanismes d'équilibrage de charge dynamique, tels que l'équilibrage de charge dynamique basé sur la surdécomposition. Le problème est que l'évaluation et l'ajustement des performances d'une telle technique peuvent être coûteux. Cela implique généralement des modifications à l'application et un grand nombre d'exécutions pour obtenir des mesures de performance statistiquement fiables avec différentes combinaisons de paramètres d'équilibrage de charge. De plus, des mesures utiles et précises nécessitent souvent d'importantes allocations de ressources sur un cluster de production. Notre workflow de simulation, appelé SAMPI (Simulated Adaptive Adaptive MPI), utilise une approche combinée d'émulation séquentielle et de simulation en mode trace-replay pour réduire le coût d'une telle évaluation. L'émulation séquentielle et l'analyse de traces nécessitent toutes deux un seul nœud d'ordinateur. De plus, la simulation de trace-replay ne dure qu'une petite fraction du temps d'exécution parallèle réel de l'application. En plus de la simulation SAMPI de base, nous avons développé des techniques d'agrégation spatiale et de redimensionnement au niveau de l'application pour accélérer le processus d'émulation. Pour démontrer les avantages réels de l'équilibrage dynamique de charge avec surdécomposition, nous avons évalué les gains de performance obtenus en utilisant cette technique sur une application itérative de géophysique parallèle, appelée Ondes3D. L'équilibrage dynamique de la charge a été assuré par Adaptive MPI (AMPI). Il en a résulté une amélioration de la performance pouvant atteindre 36,58 % sur 288 cœurs d'une grappe. Cette évaluation en situation réelle illustre également les difficultés rencontrées dans ce processus, justifiant ainsi le recours à la simulation. Pour implémenter le workflow SAMPI, nous nous sommes appuyés sur l'interface Simulated MPI (SMPI) de SimGrid en mode émulation et trace-replay. Pour valider notre simulateur, nous avons comparé les exécutions simulées (SAMPI) et réelles (AMPI) d'Ondes3D. Les simulations ont présenté une évolution de l'équilibrage de charge très similaire à la vie réelle et ont également permis de choisir la meilleure heuristique d'équilibrage de charge pour chaque scénario. En plus de la validation, nous démontrons l'utilisation de SAMPI pour l'exploration des paramètres d'équilibrage de charge et pour la planification de la capacité de calcul. Quant à la performance de la simulation elle-même, nous estimons que notre workflow complet peut simuler l'exécution d'Ondes3D avec 24 combinaisons différentes de paramètres d'équilibrage de charge dans ≈ 5 heures pour notre scénario de séisme plus lourd et dans ≈ 3 heures pour le plus simple.
- Published
- 2018
7. Performance Modeling of a Geophysics Application to Accelerate the Tuning of Over-decomposition Parameters through Simulation
- Author
-
Keller Tesser, Rafael, Mello Schnorr, Lucas, Legrand, Arnaud, Heinrich, Christian, Dupros, Fabrice, Alexandre Navaux, Philippe Olivier, Instituto de Informática da UFRGS (UFRGS), Universidade Federal do Rio Grande do Sul [Porto Alegre] (UFRGS), Performance analysis and optimization of LARge Infrastructures and Systems (POLARIS ), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'Informatique de Grenoble (LIG ), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), and Bureau de Recherches Géologiques et Minières (BRGM) (BRGM)
- Subjects
High-Performance Computing ,Computer System Simulation ,Geophysics FDM application ,Performance prediction ,Load balancing and over-decomposition ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation - Abstract
International audience; Finite-difference methods are commonplace in High Performance Computing applications. Despite their apparent regularity, they often exhibit load imbalance that damages their efficiency. We characterize the spatial and temporal load imbalance of Ondes3D, a typical finite-differences application dedicated to earthquake mod-eling. Our analysis reveals imbalance originating from the structure of the input data, and from low-level CPU optimizations. Ondes3D was successfully ported to AMPI/CHARM++ using over-decomposition and MPI process migration techniques to dynamically rebalance the load. However, this approach requires careful selection of the over-decomposition level, the load balancing algorithm, and its activation frequency. These choices are usually tied to application structure and platform characteristics. In this article, we propose a workflow that leverages the capabilities of SimGrid to conduct such study at low experimental cost. We rely on a combination of emulation, simulation, and application modeling that requires minimal code modification and manages to capture both spatial and temporal load imbalance to faithfully predict the performance of dynamic load balancing. We evaluate the quality of our simulation by comparing simulation results with the outcome of real executions and demonstrate how this approach can be used to quickly find the optimal load balancing configuration for a given application/hardware configuration.
- Published
- 2018
8. Performance modeling of a geophysics application to accelerate over‐decomposition parameter tuning through simulation
- Author
-
Keller Tesser, Rafael, primary, Mello Schnorr, Lucas, additional, Legrand, Arnaud, additional, Heinrich, Franz Christian, additional, Dupros, Fabrice, additional, and Navaux, Philippe O.A., additional
- Published
- 2018
- Full Text
- View/download PDF
9. Challenges of Load Balancing for Hybrid Architectures
- Author
-
Martinez Abaunza, Victor Eduardo, Keller Tesser, Rafael, Dupros, Fabrice, Navaux, Philippe Olivier Alexandre, Instituto de Informática da UFRGS (UFRGS), Universidade Federal do Rio Grande do Sul [Porto Alegre] (UFRGS), and Bureau de Recherches Géologiques et Minières (BRGM) (BRGM)
- Subjects
[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] - Published
- 2013
10. Performance modeling of a geophysics application to accelerate over‐decomposition parameter tuning through simulation.
- Author
-
Keller Tesser, Rafael, Mello Schnorr, Lucas, Legrand, Arnaud, Heinrich, Franz Christian, Dupros, Fabrice, and Navaux, Philippe O.A.
- Subjects
GEOPHYSICS ,FINITE difference method ,EMULATION software ,DYNAMIC loads ,DYNAMIC balance (Mechanics) ,HIGH performance computing - Abstract
Summary: Finite‐difference methods are commonplace in High Performance Computing applications. Despite their apparent regularity, they often exhibit load imbalance that damages their efficiency. We characterize the spatial and temporal load imbalance of Ondes3D, a typical finite‐differences application dedicated to earthquake modeling. Our analysis reveals imbalance originating from the structure of the input data, and from low‐level CPU optimizations. Ondes3D was successfully ported to AMPI/CHARM++ using over‐decomposition and MPI process migration techniques to dynamically rebalance the load. However, this approach requires careful selection of the over‐decomposition level, the load balancing algorithm, and its activation frequency. These choices are usually tied to application structure and platform characteristics. In this article, we propose a workflow that leverages the capabilities of SimGrid to conduct such study at low experimental cost. We rely on a combination of emulation, simulation, and application modeling that requires minimal code modification and manages to capture both spatial and temporal load imbalance to faithfully predict the performance of dynamic load balancing. We evaluate the quality of our simulation by comparing simulation results with the outcome of real executions and demonstrate how this approach can be used to quickly find the optimal load balancing configuration for a given application/hardware configuration. [ABSTRACT FROM AUTHOR]
- Published
- 2019
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.