69 results on '"Julien Bigot"'
Search Results
2. Dynamic Allocations in a Hierarchical Parallel Context - A Study on Performance, Memory Footprint, and Portability Using SYCL.
- Author
-
Aymeric Millan, Thomas Padioleau, and Julien Bigot
- Published
- 2023
- Full Text
- View/download PDF
3. Dask-Extended External Tasks for HPC/ML In transit Workflows.
- Author
-
Amal Gueroudji, Julien Bigot, Bruno Raffin, and Robert B. Ross
- Published
- 2023
- Full Text
- View/download PDF
4. An Optimization Pass for Training Speed-Up and Strategy Search in 3D Parallelism.
- Author
-
Ryubu Hosoki, Kento Sato, Toshio Endo, Julien Bigot, and Edouard Audit
- Published
- 2024
- Full Text
- View/download PDF
5. Performance portable Vlasov code with C++ parallel algorithm.
- Author
-
Yuuichi Asahi, Thomas Padioleau, Guillaume Latu, Julien Bigot, Virginie Grandgirard, and Kevin Obrejan
- Published
- 2022
- Full Text
- View/download PDF
6. DEISA: Dask-Enabled In Situ Analytics.
- Author
-
Amal Gueroudji, Julien Bigot, and Bruno Raffin
- Published
- 2021
- Full Text
- View/download PDF
7. Optimization strategy for a performance portable Vlasov code.
- Author
-
Yuuichi Asahi, Guillaume Latu, Julien Bigot, and Virginie Grandgirard
- Published
- 2021
- Full Text
- View/download PDF
8. gym-DSSAT: a crop model turned into a Reinforcement Learning environment.
- Author
-
Romain Gautron, Emilio J. Padrón 0001, Philippe Preux, Julien Bigot, Odalric-Ambrym Maillard, and David Emukpere
- Published
- 2022
- Full Text
- View/download PDF
9. Fine-Grained MPI+OpenMP Plasma Simulations: Communication Overlap with Dependent Tasks.
- Author
-
Jérôme Richard, Guillaume Latu, Julien Bigot, and Thierry Gautier
- Published
- 2019
- Full Text
- View/download PDF
10. Performance Portable Implementation of a Kinetic Plasma Simulation Mini-App.
- Author
-
Yuuichi Asahi, Guillaume Latu, Virginie Grandgirard, and Julien Bigot
- Published
- 2019
- Full Text
- View/download PDF
11. InKS: a programming model to decouple algorithm from optimization in HPC codes.
- Author
-
Ksander Ejjaaouani, Olivier Aumage, Julien Bigot, Michel Mehrenberger, Hitoshi Murai, Masahiro Nakao, and Mitsuhisa Sato
- Published
- 2020
- Full Text
- View/download PDF
12. InKS, a Programming Model to Decouple Performance from Algorithm in HPC Codes.
- Author
-
Ksander Ejjaaouani, Olivier Aumage, Julien Bigot, Michel Mehrenberger, Hitoshi Murai, Masahiro Nakao, and Mitsuhisa Sato
- Published
- 2018
- Full Text
- View/download PDF
13. Scaling and Optimizing the Gysela Code on a Cluster of Many-Core Processors.
- Author
-
Guillaume Latu, Yuuichi Asahi, Julien Bigot, Tamas B. Fehér, and Virginie Grandgirard
- Published
- 2018
- Full Text
- View/download PDF
14. Extensibility and Composability of a Multi-Stencil Domain Specific Framework.
- Author
-
Hélène Coullon, Julien Bigot, and Christian Pérez
- Published
- 2019
- Full Text
- View/download PDF
15. Combining Both a Component Model and a Task-based Model for HPC Applications: a Feasibility Study on Gysela.
- Author
-
Olivier Aumage, Julien Bigot, Hélène Coullon, Christian Pérez, and Jérôme Richard
- Published
- 2017
- Full Text
- View/download PDF
16. Pre-exascale Architectures: OpenPOWER Performance and Usability Assessment for French Scientific Community.
- Author
-
Gabriel Hautreux, Alfredo Buttari, Arnaud Beck, Victor Cameo, Dimitri Lecas, Dominique Aubert, Emeric Brun, Eric Boyer, Fausto Malvagi, Gabriel Staffelbach, Isabelle d'Ast, Joeffrey Legaux, Ghislain Lartigue, Gilles Grasseau, Guillaume Latu, Juan Escobar Munoz, Julien Bigot, Julien Derouillat, Matthieu Haefele, Nicolas Renon, Philippe Parnaudeau, Philippe Wautelet, Pierre-Francois Lavallee, Pierre Kestener, Rémi Lacroix, Stéphane Requena, Anthony Scemama, Vincent Moureau, Jean-Matthieu Etancelin, and Yann Meurdesoif
- Published
- 2017
- Full Text
- View/download PDF
17. Overlapping communications in gyrokinetic codes on accelerator-based platforms.
- Author
-
Yuuichi Asahi, Guillaume Latu, Julien Bigot, Shinya Maeyama, Virginie Grandgirard, and Yasuhiro Idomura
- Published
- 2020
- Full Text
- View/download PDF
18. From DSL to HPC component-based runtime: a multi-stencil DSL case study.
- Author
-
Julien Bigot, Hélène Coullon, and Christian Pérez
- Published
- 2015
- Full Text
- View/download PDF
19. A 5D gyrokinetic full-f global semi-Lagrangian code for flux-driven ion turbulence simulations.
- Author
-
Virginie Grandgirard, Jérémie Abiteboul, Julien Bigot, Thomas Cartier-Michaud, Nicolas Crouseilles, Guilhem Dif-Pradalier, Charles Ehrlacher, Damien Estève, Xavier Garbet, Philippe Ghendrih, Guillaume Latu, Michel Mehrenberger, C. Norscini, Chantal Passeron, Fabien Rozar, Yanick Sarazin, Eric Sonnendrücker, A. Strugarek, and David Zarzoso
- Published
- 2016
- Full Text
- View/download PDF
20. A Low Level Component Model Enabling Performance Portability of HPC Applications.
- Author
-
Julien Bigot, Zhengxiong Hou, Christian Pérez, and Vincent Pichon
- Published
- 2012
- Full Text
- View/download PDF
21. High Performance Composition Operators in Component Models.
- Author
-
Julien Bigot and Christian Pérez
- Published
- 2010
- Full Text
- View/download PDF
22. Increasing Reuse in Component Models through Genericity.
- Author
-
Julien Bigot and Christian Pérez
- Published
- 2009
- Full Text
- View/download PDF
23. On Abstractions of Software Component Models for Scientific Applications.
- Author
-
Julien Bigot, Hinde-Lilia Bouziane, Christian Pérez, and Thierry Priol
- Published
- 2008
- Full Text
- View/download PDF
24. A low level component model easing performance portability of HPC applications.
- Author
-
Julien Bigot, Zhengxiong Hou, Christian Pérez, and Vincent Pichon
- Published
- 2014
- Full Text
- View/download PDF
25. Scalable data management for map-reduce-based data-intensive applications: a view for cloud and hybrid infrastructures.
- Author
-
Gabriel Antoniu, Alexandru Costan, Julien Bigot, Frédéric Desprez, Gilles Fedak, Sylvain Gault, Christian Pérez, Anthony Simonet, Bing Tang, Christophe Blanchet, Raphael Terreux, Luc Bougé, François Briant, Franck Cappello, Kate Keahey, Bogdan Nicolae, and Frédéric Suter
- Published
- 2013
- Full Text
- View/download PDF
26. Optilization of the gyroaverage operator based on hermite interpolation.
- Author
-
Fabien Rozar, Christophe Steiner, Guillaume Latu, Michel Mehrenberger, Virginie Grandgirard, Julien Bigot, Thomas Cartier-Michaud, and Jean Roman
- Published
- 2016
27. Evaluating kernels on Xeon Phi to accelerate Gysela application.
- Author
-
Guillaume Latu, Matthieu Haefele, Julien Bigot, Virginie Grandgirard, Thomas Cartier-Michaud, and Fabien Rozar
- Published
- 2015
28. Benefits of SMT and of Parallel Transpose Algorithm for the Large-Scale GYSELA Application.
- Author
-
Guillaume Latu, Julien Bigot, Nicolas Bouzat, Judit Giménez, and Virginie Grandgirard
- Published
- 2016
29. Overlapping communications in gyrokinetic codes on accelerator‐based platforms
- Author
-
Shinya Maeyama, Virginie Grandgirard, Yasuhiro Idomura, Yuuichi Asahi, Julien Bigot, Guillaume Latu, Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Rokkasho Fusion Institute [Aomori], National Institutes for Quantum and Radiological Science and Technology (QST), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Department of Physics, Nagoya University, Japan Atomic Energy Agency [Ibaraki] (JAEA), and Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)
- Subjects
Computer Networks and Communications ,Computer science ,01 natural sciences ,010305 fluids & plasmas ,Computer Science Applications ,Theoretical Computer Science ,[INFO.INFO-PF]Computer Science [cs]/Performance [cs.PF] ,Computational Theory and Mathematics ,Computer architecture ,0103 physical sciences ,[INFO]Computer Science [cs] ,010306 general physics ,Software ,ComputingMilieux_MISCELLANEOUS - Abstract
International audience
- Published
- 2019
- Full Text
- View/download PDF
30. Performance Portable Implementation of a Kinetic Plasma Simulation Mini-App
- Author
-
Julien Bigot, Yuuichi Asahi, Guillaume Latu, Virginie Grandgirard, National Institutes for Quantum and Radiological Science and Technology (QST), Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Maison de la Simulation (MDLS), and Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Scheme (programming language) ,Kinetic model ,Computer science ,Fusion plasma ,010103 numerical & computational mathematics ,02 engineering and technology ,Parallel computing ,01 natural sciences ,Porting ,Acceleration ,Software portability ,[INFO.INFO-PF]Computer Science [cs]/Performance [cs.PF] ,[PHYS.PHYS.PHYS-PLASM-PH]Physics [physics]/Physics [physics]/Plasma Physics [physics.plasm-ph] ,020204 information systems ,0202 electrical engineering, electronic engineering, information engineering ,Code (cryptography) ,0101 mathematics ,High dimensionality ,computer ,ComputingMilieux_MISCELLANEOUS ,computer.programming_language - Abstract
WACCPD 2019: International Workshop on Accelerator Programming Using Directivesisbn 978-3-030-49943-3; International audience; Performance portability is considered to be an inevitable requirement in the exascale era. We explore a performance portable approach for fusion plasma turbulence simulation code employing kinetic model, namely the GYSELA code. For this purpose, we extract the key features of GYSELA such as the high dimensionality and the semi-Lagrangian scheme, and encapsulate them into a mini-application which solves the similar but a simplified Vlasov-Poisson system. We implement the mini-app with a mixed OpenACC/OpenMP and Kokkos, where we suppress unnecessary duplications of code lines. For a reference case with the problem size of 128$^4$, the Skylake (Kokkos), Nvidia Tesla P100 (OpenACC), and P100 (Kokkos) versions achieve an acceleration of 1.45, 12.95, and 17.83, respectively, with respect to the baseline OpenMP version on Intel Skylake. In addition to the performance portability, we discuss the code readability and productivity of each implementation. Based on our experience, Kokkos can offer a readable and productive code at the cost of initial porting efforts, which would be enormous for a large scale simulation code like GYSELA.
- Published
- 2019
- Full Text
- View/download PDF
31. Fine-grained MPI+OpenMP plasma simulations: communication overlap with dependent tasks
- Author
-
Guillaume Latu, Julien Bigot, Jérôme Richard, Thierry Gautier, Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Algorithms and Software Architectures for Distributed and HPC Platforms (AVALON), Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Lyon, Institut National de Recherche en Informatique et en Automatique (Inria), European Project: 676629,H2020 Pilier Excellent Science,H2020-EINFRA-2015-1,EoCoE(2015), European Project: 824158,H2020-EU.1.4. - EXCELLENT SCIENCE - Research Infrastructures ,EoCoE-II(2019), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), and Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS)
- Subjects
Computer science ,Mpi openmp ,Computation ,OpenMP 4.5 ,02 engineering and technology ,Parallel computing ,01 natural sciences ,Keywords: Dependent tasks ,010305 fluids & plasmas ,Task (project management) ,Many-core ,[INFO.INFO-PF]Computer Science [cs]/Performance [cs.PF] ,Dependent tasks, OpenMP 4.5, MPI, Many-core ,[PHYS.PHYS.PHYS-PLASM-PH]Physics [physics]/Physics [physics]/Plasma Physics [physics.plasm-ph] ,0103 physical sciences ,0202 electrical engineering, electronic engineering, information engineering ,020201 artificial intelligence & image processing ,MPI ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,ComputingMilieux_MISCELLANEOUS - Abstract
25th International Conference on Parallel and Distributed Computing, Göttingen, Germany, August 26-30, 2019 Proceedings; International audience; This paper demonstrates how OpenMP 4.5 tasks can be used to efficiently overlap computations and MPI communications based on a case-study conducted on multi-core and many-core architectures. It focuses on task granularity, dependencies and priorities, and also identifies some limitations of OpenMP. Results on 64 Skylake nodes show that while 64% of the wall-clock time is spent in MPI communications, 60% of the cores are busy in computations, which is a good result. Indeed, the chosen dataset is small enough to be a challenging case in terms ofoverlap and thus useful to assess worst-case scenarios in future simulations. Two key features were identified: by using task priority we improved the performance by 5.7% (mainly due to an improved overlap), and with recursive tasks we shortened the execution time by 9.7%. We also illustrate the need to have access to tools for task tracing and task visualization. These tools allowed a fine understanding and a performance increase for this task-based OpenMP+MPI code.
- Published
- 2019
- Full Text
- View/download PDF
32. InKS, a Programming Model to Decouple Algorithm from Optimization in HPC Codes
- Author
-
Julien Bigot, Olivier Aumage, Ksander Ejjaaouani, Michel Mehrenberger, Masahiro Nakao, Hitoshi Murai, Mitsuhisa Sato, Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS), Institut de Mathématiques de Marseille (I2M), Aix Marseille Université (AMU)-École Centrale de Marseille (ECM)-Centre National de la Recherche Scientifique (CNRS), RIKEN Center for Computational Science [Kobe] (RIKEN CCS), RIKEN - Institute of Physical and Chemical Research [Japon] (RIKEN), Center for Computational Sciences [Tsukuba] (CCS), Université de Tsukuba = University of Tsukuba, and École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL)
- Subjects
020203 distributed computing ,LOOP (programming language) ,Computer science ,05 social sciences ,Process (computing) ,050801 communication & media studies ,02 engineering and technology ,Solver ,Theoretical Computer Science ,Domain (software engineering) ,Set (abstract data type) ,0508 media and communications ,Hardware and Architecture ,0202 electrical engineering, electronic engineering, information engineering ,Programming paradigm ,Code (cryptography) ,[INFO]Computer Science [cs] ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Algorithm ,Software ,Information Systems - Abstract
International audience; Existing programming models tend to tightly interleave algorithm and optimization in HPC simulation codes. This requires scientists to become experts in both the simulated domain and the optimization process and makes the code difficult to maintain or port to new architectures. In this paper, we propose the InKS programming model that decouples these concerns with two distinct languages: InKS pia to express the simulation algorithm and InKS pso for optimizations. We define InKS pia and evaluate the feasibility of defining InKS pso with three test-languages: InKS o/C++ , InKS o/loop , InKS o/XMP. We evaluate the approach on synthetic benchmarks (NAS and heat equation) as well as on a more complex example (6D Vlasov-Poisson solver). Our evaluation demonstrates the soundness of the approach as it improves the separation of algorithmic and optimization concerns at no performance cost. We also identify a set of guidelines for the later full definition of the InKS pso language.
- Published
- 2019
- Full Text
- View/download PDF
33. Optimization of the Gyroaverage operator based on Hermite interpolation
- Author
-
Christophe Steiner, Michel Mehrenberger, Julien Bigot, Virginie Grandgirard, Guillaume Latu, T. Cartier-Michaud, Jean Roman, Fabien Rozar, Laboratoire Bordelais de Recherche en Informatique (LaBRI), Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB), High-End Parallel Algorithms for Challenging Numerical Simulations (HiePACS), Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), TOkamaks and NUmerical Simulations (TONUS), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)-Inria Nancy - Grand Est, Maison de la Simulation (MDLS), Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest, and Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)
- Subjects
FOS: Computer and information sciences ,Scheme (programming language) ,Computer science ,Computation ,[INFO.INFO-DS]Computer Science [cs]/Data Structures and Algorithms [cs.DS] ,[PHYS.MPHY]Physics [physics]/Mathematical Physics [math-ph] ,FOS: Physical sciences ,01 natural sciences ,Plasma physics ,010305 fluids & plasmas ,Operator (computer programming) ,Hermite interpolation ,0103 physical sciences ,QA1-939 ,FOS: Mathematics ,Code (cryptography) ,Optimisation ,Fraction (mathematics) ,0101 mathematics ,computer.programming_language ,T57-57.97 ,Applied mathematics. Quantitative methods ,Computer Science - Numerical Analysis ,Numerical Analysis (math.NA) ,Computational Physics (physics.comp-ph) ,Data structure ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,010101 applied mathematics ,Computer Science - Distributed, Parallel, and Cluster Computing ,Product (mathematics) ,Hermite Interpolation ,Distributed, Parallel, and Cluster Computing (cs.DC) ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Physics - Computational Physics ,Algorithm ,computer ,Mathematics - Abstract
Gyrokinetic modeling is appropriate for describing Tokamak plasma turbulence, and the gyroaverage operator is a cornerstone of this approach. In a gyrokinetic code, the gyroaveraging scheme needs to be accurate enough to avoid spoiling the data but also requires a low computation cost because it is applied often on the main unknown, the 5D guiding-center distribution function, and on the 3D electric potentials. In the present paper, we improve a gyroaverage scheme based on Hermite interpolation used in the Gysela code. This initial implementation represents a too large fraction of the total execution time. The gyroaverage operator has been reformulated and is now expressed as a matrix-vector product and a cache-friendly algorithm has been setup. Different techniques have been investigated to quicken the computations by more than a factor two. Description of the algorithms is given, together with an analysis of the achieved performance.
- Published
- 2016
- Full Text
- View/download PDF
34. Evaluating Kernels on Xeon Phi to accelerate Gysela application
- Author
-
Matthieu Haefele, T. Cartier-Michaud, Guillaume Latu, Julien Bigot, Virginie Grandgirard, Fabien Rozar, Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Max-Planck-Institut für Plasmaphysik [Garching] (IPP), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Martin Campos Pinto and Frédérique Charles, EDP Sciences, ANR-10-BLAN-0941,GYPSI,Simulation GYrocinétique haute Performance Pour ITER(2010), and ANR-10-G8EX-0005,Nu-FuSe(2010)
- Subjects
FOS: Computer and information sciences ,Intel xeon phi coprocessor ,FOS: Physical sciences ,010103 numerical & computational mathematics ,02 engineering and technology ,Parallel computing ,01 natural sciences ,Porting ,Execution time ,0202 electrical engineering, electronic engineering, information engineering ,Code (cryptography) ,QA1-939 ,0101 mathematics ,020203 distributed computing ,T57-57.97 ,Computer Science - Performance ,Applied mathematics. Quantitative methods ,Computational Physics (physics.comp-ph) ,Performance (cs.PF) ,[INFO.INFO-PF]Computer Science [cs]/Performance [cs.PF] ,Computer Science - Distributed, Parallel, and Cluster Computing ,Vectorization (mathematics) ,Distributed, Parallel, and Cluster Computing (cs.DC) ,Physics - Computational Physics ,Xeon Phi ,Mathematics ,Interpolation - Abstract
This work describes the challenges presented by porting parts ofthe Gysela code to the Intel Xeon Phi coprocessor, as well as techniques used for optimization, vectorization and tuning that can be applied to other applications. We evaluate the performance of somegeneric micro-benchmark on Phi versus Intel Sandy Bridge. Several interpolation kernels useful for the Gysela application are analyzed and the performance are shown. Some memory-bound and compute-bound kernels are accelerated by a factor 2 on the Phi device compared to Sandy architecture. Nevertheless, it is hard, if not impossible, to reach a large fraction of the peek performance on the Phi device,especially for real-life applications as Gysela. A collateral benefit of this optimization and tuning work is that the execution time of Gysela (using 4D advections) has decreased on a standard architecture such as Intel Sandy Bridge., Comment: submitted to ESAIM proceedings for CEMRACS 2014 summer school version reviewed
- Published
- 2016
- Full Text
- View/download PDF
35. Scaling and optimizing the Gysela code on a cluster of many-core processors
- Author
-
Yuuichi Asahi, Guillaume Latu, Julien Bigot, Virginie Grandgirard, T. Feher, Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Max-Planck-Institut für Plasmaphysik [Garching] (IPP), EC H2020 RIA, and European Project: 676629,H2020 Pilier Excellent Science,H2020-EINFRA-2015-1,EoCoE(2015)
- Subjects
020203 distributed computing ,Speedup ,Computer science ,KNL ,plasma physics ,02 engineering and technology ,Parallel computing ,Intrinsics ,SIMD ,Kernel (linear algebra) ,[PHYS.PHYS.PHYS-PLASM-PH]Physics [physics]/Physics [physics]/Plasma Physics [physics.plasm-ph] ,Vectorization (mathematics) ,Scalability ,0202 electrical engineering, electronic engineering, information engineering ,Programming paradigm ,vectorization ,020201 artificial intelligence & image processing ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,many-core ,Xeon Phi - Abstract
International audience; The current generation of the Xeon Phi Knights Landing (KNL) processor provides a highly multi-threaded environment on which regular programming models such as MPI/OpenMP can be used. This specific hardware offers both large memory bandwidth and large computing resources and is currently available on computing facilities. Many factors impact the performance achieved by applications, one of the key points is the efficient exploitation of SIMD vector units, another one is the memory access pattern. Thus, vectorization and optimization works have been conducted on a plasma turbulence application, namely Gysela. A set of different techniques have been used: loop splitting, inlining, grouping a set of LU solve operations, removing conditionals and some loop nests, auto-tuning of one computation kernel, changing a key numerical scheme – Lagrange interpolation instead of cubic splines. As a result, KNL execution times have been reduced by up to a factor 3 in some configurations. This effort has also permitted to gain a speedup of 2x on Broadwell architecture and 3x on Skylake. Nice scalability curves up to a few thousands cores have been obtained on a strong scaling experiment. Incremental work for vectorizing the Gysela code meant a large payoff without resorting to writing assembly code or using low-level intrinsics.
- Published
- 2018
36. Building and Auto-Tuning Computing Kernels: Experimenting with BOAST and StarPU in the GYSELA Code
- Author
-
Jérôme Richard, Julien Bigot, Guillaume Latu, Luís Felipe Millani, Steven Quinito Masnada, Brice Videau, C. Passeron, Virginie Grandgirard, Jean-François Méhaut, Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Compiler Optimization and Run-time Systems (CORSE), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'Informatique de Grenoble (LIG ), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Laboratoire d'Informatique de Grenoble (LIG ), Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP )-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), Algorithms and Software Architectures for Distributed and HPC Platforms (AVALON), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Laboratory of Atomistic Simulation (LSIM ), Modélisation et Exploration des Matériaux (MEM), Institut de Recherche Interdisciplinaire de Grenoble (IRIG), Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Direction de Recherche Fondamentale (CEA) (DRF (CEA)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut de Recherche Interdisciplinaire de Grenoble (IRIG), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes [2016-2019] (UGA [2016-2019]), European Project: 610402,EC:FP7:ICT,FP7-ICT-2013-10,MONT-BLANC 2(2013), Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Inria Lyon, Institut National de Recherche en Informatique et en Automatique (Inria), Université Grenoble Alpes [2016-2019] (UGA [2016-2019])-Institut de Recherche Interdisciplinaire de Grenoble (IRIG), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'Informatique de Grenoble (LIG), Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Université Grenoble Alpes (UGA)-Centre National de la Recherche Scientifique (CNRS)-Université Grenoble Alpes (UGA)-Institut polytechnique de Grenoble - Grenoble Institute of Technology (Grenoble INP ), Université Grenoble Alpes (UGA), Laboratoire d'Informatique de Grenoble (LIG), Laboratory of Atomistic Simulation (LSIM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes (UGA)-Institut de Recherche Interdisciplinaire de Grenoble (IRIG), and Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Grenoble Alpes (UGA)
- Subjects
Auto tuning ,T57-57.97 ,Software portability ,Applied mathematics. Quantitative methods ,Coprocessor ,Computer science ,Computation ,QA1-939 ,Parallel computing ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Execution time ,Mathematics ,Scheduling (computing) - Abstract
International audience; Modeling turbulent transport is a major goal in order to predict confinement performance in a tokamak plasma. The gyrokinetic framework considers a computational domain in five dimensions to look at kinetic issues in a plasma; this leads to huge computational needs. Therefore, optimization of the code is an especially important aspect, especially since coprocessors and complex manycore architectures are foreseen as building blocks for Exascale systems. This project aims to evaluate the applicability of two auto-tuning approaches with the BOAST and StarPU tools on the gysela code in order to circumvent performance portability issues. A specific computation intensive kernel is considered in order to evaluate the benefit of these methods. StarPU enables to match the performance and even sometimes outperform the hand-optimized version of the code while leaving scheduling choices to an automated process. BOAST on the other hand reveals to be well suited to get a gain in terms of execution time on four architectures. Speedups in-between 1.9 and 5.7 are obtained on a cornerstone computation intensive kernel.
- Published
- 2018
- Full Text
- View/download PDF
37. Extensibility and Composability of a Multi-Stencil Domain Specific Framework
- Author
-
Christian Pérez, Hélène Coullon, Julien Bigot, Laboratoire des Sciences du Numérique de Nantes (LS2N), Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST), Université de Nantes (UN)-Université de Nantes (UN)-École Centrale de Nantes (ECN)-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Département Automatique, Productique et Informatique (IMT Atlantique - DAPI), IMT Atlantique (IMT Atlantique), Software Stack for Massively Geo-Distributed Infrastructures (LS2N - équipe STACK), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire des Sciences du Numérique de Nantes (LS2N), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Nantes - UFR des Sciences et des Techniques (UN UFR ST), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Algorithms and Software Architectures for Distributed and HPC Platforms (AVALON), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Laboratoire de l'Informatique du Parallélisme (LIP), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS), Grid'5000, IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Université de Nantes (UN)-Université de Nantes (UN)-École Centrale de Nantes (ECN)-Centre National de la Recherche Scientifique (CNRS), Software Stack for Massively Geo-Distributed Infrastructures (STACK), Université de Nantes (UN)-Université de Nantes (UN)-École Centrale de Nantes (ECN)-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École normale supérieure - Lyon (ENS Lyon), Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), and Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL)
- Subjects
Domain-specific language ,Computer science ,Data parallelism ,Task parallelism ,02 engineering and technology ,Parallel computing ,Numerical simulation ,[INFO.INFO-SE]Computer Science [cs]/Software Engineering [cs.SE] ,01 natural sciences ,Stencil ,Theoretical Computer Science ,Component programming models ,Composability ,0103 physical sciences ,0202 electrical engineering, electronic engineering, information engineering ,Domain specific language (DSL) ,010302 applied physics ,[INFO.INFO-PL]Computer Science [cs]/Programming Languages [cs.PL] ,Scheduling ,Separation of concerns ,Code reuse ,OpenMP ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,020202 computer hardware & architecture ,Programming paradigm ,MPI ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Software ,Information Systems - Abstract
International audience; As the computation power of modern high performance architectures increases, their heterogeneity and complexity also become more important. One of the big challenges of exascale is to reach programming models that give access to high performance computing (HPC) to many scientists and not only to a few HPC specialists. One relevant solution to ease parallel programming for scientists is domain specific language (DSL). However, one problem to avoid with DSLs is to mutualize existing codes and libraries instead of implementing each solution from scratch. For example, this phenomenon occurs for stencil-based numerical simulations, for which a large number of languages has been proposed without code reuse between them. The Multi-Stencil Framework (MSF) presented in this paper combines a new DSL to component-based programming models to enhance code reuse and separation of concerns in the specific case of stencils. MSF can easily choose one parallelization technique or another, one optimization or another, as well as one back-end implementation or another. It is shown that MSF can reach same performances than a non component-based MPI implementation over 16,384 cores. Finally, the performance model of the framework for hybrid parallelization is validated by evaluations.
- Published
- 2017
- Full Text
- View/download PDF
38. Combining Both a Component Model and a Task-based Model for HPC Applications: a Feasibility Study on GYSELA
- Author
-
Christian Pérez, Olivier Aumage, Julien Bigot, Jérôme Richard, Hélène Coullon, STatic Optimizations, Runtime Methods (STORM), Laboratoire Bordelais de Recherche en Informatique (LaBRI), Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Université de Bordeaux (UB)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Centre National de la Recherche Scientifique (CNRS)-Inria Bordeaux - Sud-Ouest, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Algorithms and Software Architectures for Distributed and HPC Platforms (AVALON), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), ELCI, Guillaume Latu, Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Université de Bordeaux (UB)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Électronique, Informatique et Radiocommunications de Bordeaux (ENSEIRB)-Inria Bordeaux - Sud-Ouest, Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), and Université de Lyon-École normale supérieure - Lyon (ENS Lyon)
- Subjects
Multi-cores ,Computer science ,business.industry ,Distributed computing ,Separation of concerns ,Software Component Model ,020207 software engineering ,02 engineering and technology ,Parallel computing ,Modularity ,Task (project management) ,Task scheduling ,Shared-memory ,Software ,Task-Based Model ,Shared memory ,Component (UML) ,Component-based software engineering ,HPC ,0202 electrical engineering, electronic engineering, information engineering ,Comet (programming) ,020201 artificial intelligence & image processing ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,business - Abstract
International audience; This paper studies the feasibility of efficiently combining both a software component model and a task-based model. Task based models are known to enable efficient executions on recent HPC computing nodes while component models ease the separation of concerns of application and thus improve their modularity and adaptability. This paper describes a prototype version of the COMET programming model combining concepts of task-based and component models, and a preliminary version of the COMET runtime built on top of StarPU and L2C. Evaluations of the approach have been conducted on a real-world use-case analysis of a subpart of the production application GYSELA . Results show that the approach is feasible and that it enables easy composition of independent software codes without introducing overheads. Performance results are equivalent to those obtained with a plain OpenMP based implementation.
- Published
- 2017
- Full Text
- View/download PDF
39. Luxation antérieure d’un utérus rétroversé incarcéré à 21 semaines d’aménorrhée : à propos d’un cas
- Author
-
Sandrine Depret, Julien Bigot, Lucie Bresson, Bernadette De Gasquet, Stéphane Langlois, Justine Figurelli, and Damien Subtil
- Subjects
Gynecology ,medicine.medical_specialty ,business.industry ,Treatment outcome ,medicine ,Obstetrics and Gynecology ,Patient positioning ,Uterine Retroversion ,business ,medicine.disease ,Retroverted uterus - Abstract
Resume Contexte L'incarceration uterine se definit par un uterus gravide retroverse dans le pelvis du fait de l'absence de bascule anterieure a la fin du premier trimestre. Les incarcerations uterines negligees ou decouvertes perpartum peuvent entrainer des complications obstetricales graves. Plusieurs auteurs rapportent leur experience de desincarceration uterine a 12, a 14 et a 16 semaines d'amenorrhee. Cas Nous rapportons un cas de desincarceration uterine a 21 semaines d'amenorrhee obtenue par la combinaison d'un protocole d'anesthesie particulier et d'une installation de la patiente permettant un desenclavement de l'uterus aide par des manœuvres externes. Aucun signe de recidive n'a ete observe. Conclusion La desincarceration uterine est possible au-dela de16 semaines d'amenorrhee.
- Published
- 2014
- Full Text
- View/download PDF
40. Idiopathic scoliosis in children and adolescents: assessment with a biplanar X-ray device
- Author
-
Fabian Uyttenhove, Bernard Herbaux, Nathalie Boutry, Eric Nectoux, E. Amzallag-Bellenger, Julien Bigot, and Antoine Moraux
- Subjects
Orthodontics ,medicine.medical_specialty ,business.industry ,Radiography ,Radiation dose ,Idiopathic scoliosis ,Pictorial Review ,Skeletal maturity ,Surgery ,Conventional radiography ,Low-dose digital imaging system ,medicine ,Spinal deformity ,Radiology, Nuclear Medicine and imaging ,3D reconstruction ,business ,Neuroradiology - Abstract
Idiopathic scoliosis is one of the most common conditions encountered in paediatric practice. It is a three-dimensional (3D) spinal deformity. Conventional radiography is still the modality of choice for evaluation of children and adolescents with idiopathic scoliosis, but it requires repeat radiographs until skeletal maturity is reached and does not provide information about spinal deformity in all three planes. A biplanar X-ray device is a new technique that enables standing frontal and lateral radiographs of the spine to be obtained at lowered radiation doses. With its specific software, this novel vertical biplanar X-ray unit provides 3D images of the spine and offers the opportunity of visualising the spinal deformity in all three planes. This pictorial review presents our experience with this new imaging system in children and adolescents with idiopathic scoliosis. • The biplanar X-ray device produces two orthogonal spine X-ray images in a standing position. • The biplanar X-ray device can assess idiopathic scoliosis with a lower radiation dose. • The biplanar X-ray device provides 3D images of the spine.
- Published
- 2014
41. Scaling gysela code beyond 32K-cores on bluegene/Q***
- Author
-
Virginie Grandgirard, Guillaume Latu, Olivier Thomine, Julien Bigot, C. Passeron, and Fabien Rozar
- Subjects
T57-57.97 ,Applied mathematics. Quantitative methods ,Computer science ,Parallel computing ,Blue gene ,symbols.namesake ,Factor (programming language) ,symbols ,Code (cryptography) ,QA1-939 ,Scaling ,computer ,Lagrangian ,Simulation ,Mathematics ,computer.programming_language - Abstract
Gyrokinetic simulations lead to huge computational needs. Up to now, the semi- Lagrangian code Gysela performed large simulations using a few thousands cores (8k cores typically). Simulation with finer resolutions and with kinetic electrons are expected to increase those needs by a huge factor, providing a good example of applications requiring Exascale machines. This paper presents our work to improve Gysela in order to target an architecture that presents one possible way towards Exascale: the Blue Gene/Q. After analyzing the limitations of the code on this architecture, we have implemented three kinds of improvement: computational performance improvements, memory consumption improvements and disk i/o improvements. As a result, we show that the code now scales beyond 32k cores with much improved performances. This will make it possible to target the most powerful machines available and thus handle much larger physical cases.
- Published
- 2013
42. Pre-exascale Architectures: OpenPOWER Performance and Usability Assessment for French Scientific Community
- Author
-
Julien Derouillat, Philippe Parnaudeau, Juan Escobar, Guillaume Latu, Dominique Aubert, Dimitri Lecas, Vincent Moureau, Pierre-Francois Lavallee, Ghislain Lartigue, Gabriel Hautreux, Alfredo Buttari, Anthony Scemama, Yann Meurdesoif, Eric Boyer, Matthieu Haefele, Arnaud Beck, Joeffrey Legaux, Philippe Wautelet, Nicolas Renon, Julien Bigot, Pierre Kestener, Gabriel Staffelbach, G. Grasseau, Fausto Malvagi, Victor Cameo, Jean-Matthieu Etancelin, Remi Lacroix, Stephane Requena, Isabelle d'Ast, Emeric Brun, Centre Informatique National de l'Enseignement Supérieur (CINES), CINES, Algorithmes Parallèles et Optimisation (IRIT-APO), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Toulouse Mind & Brain Institut (TMBI), Université Toulouse - Jean Jaurès (UT2J), Université de Toulouse (UT)-Université de Toulouse (UT)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université Toulouse Capitole (UT Capitole), Université de Toulouse (UT), Centre National de la Recherche Scientifique (CNRS), Laboratoire Leprince-Ringuet (LLR), Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3)-École polytechnique (X)-Centre National de la Recherche Scientifique (CNRS), Centre Hospitalier Universitaire de Reims (CHU Reims), Service d’Études des Réacteurs et de Mathématiques Appliquées (SERMA), Département de Modélisation des Systèmes et Structures (DM2S), CEA-Direction des Energies (ex-Direction de l'Energie Nucléaire) (CEA-DES (ex-DEN)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-CEA-Direction des Energies (ex-Direction de l'Energie Nucléaire) (CEA-DES (ex-DEN)), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay, Grand Equipement National de Calcul Intensif (GENCI), Laboratoire d'Informatique Fondamentale d'Orléans (LIFO), Université d'Orléans (UO)-Ecole Nationale Supérieure d'Ingénieurs de Bourges, Complexe de recherche interprofessionnel en aérothermochimie (CORIA), Université de Rouen Normandie (UNIROUEN), Normandie Université (NU)-Normandie Université (NU)-Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie), Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'aérologie (LAERO), Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Observatoire Midi-Pyrénées (OMP), Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Institut de Recherche pour le Développement (IRD)-Institut national des sciences de l'Univers (INSU - CNRS)-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Météo-France -Centre National de la Recherche Scientifique (CNRS), Centre Interuniversitaire de Calcul de Toulouse (CICT), Université de Toulouse (UT)-Université de Toulouse (UT), Algorithms Adapted to Intensive Numerical Computing (ALADIN), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-INRIA Rennes, Institut National de Recherche en Informatique et en Automatique (Inria), Laboratoire de Physique de l'ENS Lyon (Phys-ENS), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Centre Science des Matériaux et des Structures (SMS-ENSMSE), École des Mines de Saint-Étienne (Mines Saint-Étienne MSE), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Groupe Méthodes et outils de la chimie quantique (LCPQ) (GMO), Laboratoire de Chimie et Physique Quantiques (LCPQ), Institut de Recherche sur les Systèmes Atomiques et Moléculaires Complexes (IRSAMC), Université de Toulouse (UT)-Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut de Chimie du CNRS (INC)-Institut de Recherche sur les Systèmes Atomiques et Moléculaires Complexes (IRSAMC), Université de Toulouse (UT)-Université de Toulouse (UT)-Centre National de la Recherche Scientifique (CNRS)-Institut de Chimie du CNRS (INC), Centre de Recherche en Sciences et Technologies de l'Information et de la Communication - EA 3804 (CRESTIC), Université de Reims Champagne-Ardenne (URCA), Laboratoire des Sciences du Climat et de l'Environnement [Gif-sur-Yvette] (LSCE), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Kunkel, Julian M., Yokota, Rio, Taufer, Michela, Shalf, John, Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Centre National de la Recherche Scientifique (CNRS)-École polytechnique (X)-Institut National de Physique Nucléaire et de Physique des Particules du CNRS (IN2P3), Service des Réacteurs et de Mathématiques Appliquées (SERMA), Ecole Nationale Supérieure d'Ingénieurs de Bourges-Université d'Orléans (UO), Centre National de la Recherche Scientifique (CNRS)-Institut national des sciences appliquées Rouen Normandie (INSA Rouen Normandie), Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Université de Rouen Normandie (UNIROUEN), Normandie Université (NU), Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Centre National de la Recherche Scientifique (CNRS)-Observatoire Midi-Pyrénées (OMP), Météo France-Centre National d'Études Spatiales [Toulouse] (CNES)-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD)-Météo France-Centre National d'Études Spatiales [Toulouse] (CNES)-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées, Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Rennes 1 (UR1), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-INRIA Rennes, École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon, Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Chimie du CNRS (INC)-Institut de Recherche sur les Systèmes Atomiques et Moléculaires Complexes (IRSAMC), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Chimie du CNRS (INC), Institut national des sciences de l'Univers (INSU - CNRS)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Université Toulouse 1 Capitole (UT1)-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), CEA-Direction de l'Energie Nucléaire (CEA-DEN), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-CEA-Direction de l'Energie Nucléaire (CEA-DEN), Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Normandie Université (NU)-Institut National des Sciences Appliquées (INSA)-Université de Rouen Normandie (UNIROUEN), Laboratoire Statistique et Génome, Université d'Évry-Val-d'Essonne (UEVE), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Université Paris-Sud - Paris 11 (UP11)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'aérologie (LA), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse III - Paul Sabatier (UT3), École normale supérieure - Lyon (ENS Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche sur les Systèmes Atomiques et Moléculaires Complexes (IRSAMC), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS), Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Centre National de la Recherche Scientifique (CNRS), Météo-France -Institut de Recherche pour le Développement (IRD)-Centre National de la Recherche Scientifique (CNRS)-Université Fédérale Toulouse Midi-Pyrénées-Centre National d'Études Spatiales [Toulouse] (CNES)-Météo-France -Institut de Recherche pour le Développement (IRD)-Centre National de la Recherche Scientifique (CNRS)-Université Fédérale Toulouse Midi-Pyrénées-Centre National d'Études Spatiales [Toulouse] (CNES)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Observatoire Midi-Pyrénées (OMP), Météo France-Centre National d'Études Spatiales [Toulouse] (CNES)-Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD)-Météo France-Centre National d'Études Spatiales [Toulouse] (CNES)-Centre National de la Recherche Scientifique (CNRS)-Institut de Recherche pour le Développement (IRD)-Centre National de la Recherche Scientifique (CNRS), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut National des Sciences Appliquées - Toulouse (INSA Toulouse), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut de Chimie du CNRS (INC)-Institut de Recherche sur les Systèmes Atomiques et Moléculaires Complexes (IRSAMC), and Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Institut de Chimie du CNRS (INC)
- Subjects
Computer science ,010103 numerical & computational mathematics ,computer.software_genre ,01 natural sciences ,7. Clean energy ,Porting ,Resource (project management) ,0103 physical sciences ,benchmarks ,0101 mathematics ,010303 astronomy & astrophysics ,ComputingMilieux_MISCELLANEOUS ,Multimedia ,business.industry ,programmability ,OpenMP ,technological watch ,usability ,OpenACC ,Programming paradigm ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Software engineering ,business ,computer ,System software ,Efficient energy use ,OpenPOWER assessment - Abstract
International audience; Exascale implies a major pre-requisite in terms of energy efficiency, as an improvement of an order of magnitude must be reached in order to stay within an acceptable envelope of 20 MW. To address this objective and to continue to sustain performance, HPC architectures have to become denser, embedding many-core processors (to several hundreds of computing cores) and/or become heterogeneous, that is, using graphic processors or FPGAs. These energy-saving constraints will also affect the underlying hardware architectures (e.g., memory and storage hierarchies, networks) as well as system software (runtime, resource managers, file systems, etc.) and programming models. While some of these architectures, such as hybrid machines, have existed for a number of years and occupy noticeable ranks in the TOP 500 list, they are still limited to a small number of scientific domains and, moreover, require significant porting effort. However, recent developments of new paradigms (especially around OpenMP and OpenACC) make these architectures much more accessible to programmers. In order to make the most of these breakthrough upcoming technologies, GENCI and its partners have set up a technology watch group and lead collaborations with vendors, relying on HPC experts and early adopted HPC solutions. The two main objectives are providing guidance and prepare the scientific communities to challenges of exascale architectures.
- Published
- 2017
- Full Text
- View/download PDF
43. A Hybrid Monte Carlo Scheme for Multibackbone Protein Design
- Author
-
Edouard Audit, Karen Druart, Thomas Simonson, Julien Bigot, Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Laboratoire de Biochimie de l'Ecole polytechnique (BIOC), and École polytechnique (X)-Centre National de la Recherche Scientifique (CNRS)
- Subjects
0301 basic medicine ,Scheme (programming language) ,Mathematical optimization ,Computer science ,Protein design ,Molecular Dynamics Simulation ,Topology ,Hybrid Monte Carlo ,src Homology Domains ,03 medical and health sciences ,symbols.namesake ,Catalytic Domain ,Side chain ,[SDV.BBM]Life Sciences [q-bio]/Biochemistry, Molecular Biology ,Physical and Theoretical Chemistry ,Conformational isomerism ,computer.programming_language ,Quantitative Biology::Biomolecules ,Sampling (statistics) ,Proteins ,Computer Science Applications ,Enzymes ,Protein Structure, Tertiary ,030104 developmental biology ,Boltzmann constant ,symbols ,Thermodynamics ,[INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM] ,computer ,Monte Carlo Method ,Energy (signal processing) - Abstract
International audience; Multistate protein design explores side chain mutations, with the backbone allowed to sample a small, predetermined library of conformations. To achieve Boltzmann sampling of sequences and conformations, we use a hybrid Monte Carlo (MC) scheme: a trial hop between backbone models is followed by a short MC segment where side chain rotamers adjust to the new backbone, before applying a Metropolis-like acceptance test. The theoretical form and a practical approximation for the acceptance test are derived. We then compute backbone conformational free energies for two SH2 and SH3 proteins using different routes and protocols, and verify that for simple test problems, the free energy behaves like a state function, a hallmark of Boltzmann sampling.
- Published
- 2016
- Full Text
- View/download PDF
44. Benefits of SMT and of Parallel Transpose Algorithm for the Large-Scale GYSELA Application
- Author
-
Nicolas Bouzat, Guillaume Latu, Virginie Grandgirard, Julien Bigot, Judit Gimenez, Barcelona Supercomputing Center, Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), TOkamaks and NUmerical Simulations (TONUS), Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)-Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS)-Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria), Barcelona Supercomputing Center - Centro Nacional de Supercomputacion (BSC - CNS), EC H2020 RIA, and European Project: 676629,H2020 Pilier Excellent Science,H2020-EINFRA-2015-1,EoCoE(2015)
- Subjects
Scheme (programming language) ,Parallel algorithms ,Computer science ,010103 numerical & computational mathematics ,02 engineering and technology ,Parallel computing ,Simultaneous multithreading ,01 natural sciences ,Simultaneous multithreading (SMT) ,Reduction (complexity) ,Supercomputadors ,[PHYS.PHYS.PHYS-PLASM-PH]Physics [physics]/Physics [physics]/Plasma Physics [physics.plasm-ph] ,Factor (programming language) ,Transpose ,0202 electrical engineering, electronic engineering, information engineering ,Code (cryptography) ,0101 mathematics ,Implementation ,computer.programming_language ,Processament en paral·lel (Ordinadors) ,Software architecture ,Enginyeria electrònica [Àrees temàtiques de la UPC] ,[INFO.INFO-PF]Computer Science [cs]/Performance [cs.PF] ,x86 ,020201 artificial intelligence & image processing ,Core ,computer ,Algorithm ,INTEL architectures - Abstract
This article describes how we manage to increase performance and to extend features of a large parallel application through the use of simultaneous multithreading (SMT) and by designing a robust parallel transpose algorithm. The semi-Lagrangian code Gysela typically performs large physics simulations using a few thousands of cores, between 1k cores up to 16k on x86-based clusters. However, simulations with finer resolutions and with kinetic electrons increase those needs by a huge factor, providing a good example of applications requiring Exascale machines. To improve Gysela compute times, we take advantage of efficient SMT implementations available on recent INTEL architectures. We also analyze the cost of a transposition communication scheme that involves a large number of cores in our case. Adaptation of the code for balance load whenever using both SMT and good deployment strategy led to a significant reduction that can be up to 38% of the execution times. This work was strongly supported by the Energy oriented Centre of Excellence (EoCoE), grant agreement number 676629, funded within the Horizon 2020 framework of the European Union. We gratefully acknowledge the POP project, that has also received funding from the European Union’s Horizon 2020 research and innovation programme under grant agreement No 676553. This work was possible due to the generous computational and software engineering supports from FZJ Juelich (Germany) and CCRT Bruyères- le-Châtel (France). The authors would also like to thank Chantal Passeron for assistance and for her precious help.
- Published
- 2016
- Full Text
- View/download PDF
45. Synthesis and Properties of Tetrathiafulvalene End-Functionalized Polymers Prepared via RAFT Polymerization
- Author
-
Bernadette Charleux, François Stoffelbach, Joel Lyskawa, David Fournier, Patrice Woisel, Julien Bigot, François Delattre, and Graeme Cooke
- Subjects
chemistry.chemical_classification ,Acrylate ,Polymers and Plastics ,Organic Chemistry ,Radical polymerization ,Chain transfer ,Polymer ,Raft ,Inorganic Chemistry ,chemistry.chemical_compound ,chemistry ,Polymerization ,Polymer chemistry ,Materials Chemistry ,Reversible addition−fragmentation chain-transfer polymerization ,Tetrathiafulvalene - Abstract
The reversible addition−fragmentation chain transfer (RAFT) polymerization technique has been employed to synthesize various linear tetrathiafulvalene end-functionalized polymers. n-Butyl acrylate,...
- Published
- 2009
- Full Text
- View/download PDF
46. Aspect échographique et IRM de la grossesse extra-utérine
- Author
-
Mathieu Lernout, Yann Robert, Emmanuel Closset, Jean-Philippe Lucot, Édouard Poncelet, Élise Fréart-Martinez, Nicolas Laurent, Julien Bigot, and Corinne Leconte
- Subjects
Surgery - Abstract
Resume La grossesse extra-uterine (GEU) est l’urgence gynecologique a laquelle il faut toujours penser chez une femme en âge de procreer en raison de sa morbimortalite. Il faut toujours la rechercher devant une symptomatologie evocatrice. Il faut egalement savoir la diagnostiquer devant une imagerie suspecte en l’absence d’anomalie clinique. L’examen clinique, le taux de BHCG et l’echographie pelvienne sont les examens indispensables pour faire le diagnostic de GEU, mais aussi pour decider de la prise en charge therapeutique la mieux adaptee a chaque patiente. Les signes echographiques de la GEU sont illustres. En cas de doute diagnostic, l’IRM permet de mieux caracteriser les masses annexielles ou de mieux preciser les localisations inhabituelles de GEU.
- Published
- 2009
- Full Text
- View/download PDF
47. Synthesis of a polypseudorotaxane, polyrotaxane, and polycatenane using ‘click’ chemistry
- Author
-
Patrice Woisel, Graeme Cooke, Gouher Rabani, Joël Lyskawa, Julien Bigot, Vincent M. Rotello, and Marc Bria
- Subjects
chemistry.chemical_classification ,Rotaxane ,Organic Chemistry ,Catenane ,Biochemistry ,Supramolecular polymers ,chemistry.chemical_compound ,chemistry ,Polycatenane ,Drug Discovery ,Polymer chemistry ,Click chemistry ,Side chain ,Cyclobis(paraquat-p-phenylene) ,Cyclophane - Abstract
The synthesis of a polypseudorotaxane, polyrotaxane, and polycatenane containing the electron-deficient cyclophane cyclobis(paraquat-p-phenylene) (CBPQT4+) subunit in the side chain is described. These interlocked supramolecular polymers have been prepared from an azide-functionalized polystyrene derivative and an acetylene-functionalized [2]rotaxane, [2]catenane and their parent tetracationic cyclophane via Cu(I)-catalyzed 1,3 dipolar cycloadditions (‘click chemistry’). The synthesis and characterization of the polymers and intermediates has been described using IR, 1H NMR, UV spectroscopies, and voltammetry. We have shown that the CBPQT4+ unit of the side chain polystyrene derivative has the ability to reversibly undergo complexation with a complementary dialkoxynaphthalene derivative.
- Published
- 2009
- Full Text
- View/download PDF
48. Grafting of copolymer styrene maleic anhydride on poly(ethylene terephthalate) film by chemical reaction and by plasma method
- Author
-
Xavier Coqueret, Julien Bigot, Muriel Bigan, and Brigitte Mutel
- Subjects
Materials science ,General Physics and Astronomy ,Infrared spectroscopy ,Surfaces and Interfaces ,General Chemistry ,Condensed Matter Physics ,Grafting ,Chemical reaction ,Surfaces, Coatings and Films ,chemistry.chemical_compound ,chemistry ,Styrene maleic anhydride ,Polymer chemistry ,Copolymer ,Polyethylene terephthalate ,Fourier transform infrared spectroscopy ,Triethylamine - Abstract
This work deals with the chemical grafting of a styrene maleic anhydride copolymer on the surface of a previously hydrolyzed polyethylene terephthalate (PET) film 12 μm thick via covalent bond. Two different ways are studied. The first one involves an activation of the hydrolyzed PET by the triethylamine before the grafting step. In the second one, the copolymer reacts with the 4-dimethylaminopyridine in order to form maleinyl pyridinium salt which reacts with alcohol function of the hydrolyzed PET. Characterization and quantification of the grafting are performed by Fourier transform infrared spectroscopy. Factorial experiment designs are used to optimize the process and to estimate experimental parameters effects. The opportunity to associate the chemical process to a cold remote nitrogen plasma one is also examined.
- Published
- 2008
- Full Text
- View/download PDF
49. A 5D gyrokinetic full-f global semi-lagrangian code for flux-driven ion turbulence simulations
- Author
-
Xavier Garbet, Fabien Rozar, Eric Sonnendrücker, Guilhem Dif-Pradalier, Julien Bigot, D. Esteve, J. Abiteboul, David Zarzoso, Virginie Grandgirard, C. Ehrlacher, C. Norscini, Nicolas Crouseilles, Michel Mehrenberger, Antoine Strugarek, Guillaume Latu, T. Cartier-Michaud, Yanick Sarazin, Philippe Ghendrih, C. Passeron, Institut de Recherche sur la Fusion par confinement Magnétique ( IRFM ), Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ), Max-Planck-Institut für Plasmaphysik [Garching] ( IPP ), Maison de la Simulation ( MDLS ), Université de Versailles Saint-Quentin-en-Yvelines ( UVSQ ) -Université Paris-Sud - Paris 11 ( UP11 ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Commissariat à l'énergie atomique et aux énergies alternatives ( CEA ) -Université Paris-Saclay-Centre National de la Recherche Scientifique ( CNRS ), Institut de Recherche Mathématique de Rennes ( IRMAR ), Université de Rennes 1 ( UR1 ), Université de Rennes ( UNIV-RENNES ) -Université de Rennes ( UNIV-RENNES ) -AGROCAMPUS OUEST-École normale supérieure - Rennes ( ENS Rennes ) -Institut National de Recherche en Informatique et en Automatique ( Inria ) -Institut National des Sciences Appliquées ( INSA ) -Université de Rennes 2 ( UR2 ), Université de Rennes ( UNIV-RENNES ) -Centre National de la Recherche Scientifique ( CNRS ), Institut de Recherche Mathématique Avancée ( IRMA ), Université de Strasbourg ( UNISTRA ) -Centre National de la Recherche Scientifique ( CNRS ), Université de Montréal, Physique des interactions ioniques et moléculaires ( PIIM ), Aix Marseille Université ( AMU ) -Centre National de la Recherche Scientifique ( CNRS ), This work was supported by ANR grant GYPSI ANR-10-BLAN-941 and G8-Exascale action NuFUSE project. The simulations were performed not only with national HPC resources of CCRT, CINES and IDRIS under GENCI (Grand Equipement National de Calcul Intensif) allocations but also with Helios/IFERC machine dedicated to Fusion at Rokkasho in Japan and with RACE (Partnership for Advanced Computing in Europe) Research infrastructure. This work, supported by the European Communities under the contract of Association between EURATOM and CEA, was carried out within the framework of the Eu-ropean Fusion Development Agreement. The views and opinions expressed herein do not necessarily reflect those of the European Commission. One of the author (D. Z.) is supported by the A*MIDEX project (no. 41 ANR-11-IDEX-0001-02) funded by the \Investissements d'Avenir' French Government program, managed by the French National Research Agency (ANR), ANR-10-BLAN-0941,GYPSI,Simulation GYrocinétique haute Performance Pour ITER ( 2010 ), ANR-11-IDEX-0001-02/11-IDEX-0001,Amidex,Amidex ( 2011 ), Institut de Recherche sur la Fusion par confinement Magnétique (IRFM), Commissariat à l'énergie atomique et aux énergies alternatives (CEA), Max-Planck-Institut für Plasmaphysik [Garching] (IPP), Maison de la Simulation (MDLS), Centre National de la Recherche Scientifique (CNRS)-Université Paris-Saclay-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Versailles Saint-Quentin-en-Yvelines (UVSQ), Institut de Recherche Mathématique de Rennes (IRMAR), AGROCAMPUS OUEST, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Université de Rennes 2 (UR2), Université de Rennes (UNIV-RENNES)-École normale supérieure - Rennes (ENS Rennes)-Centre National de la Recherche Scientifique (CNRS)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA), Institut de Recherche Mathématique Avancée (IRMA), Université de Strasbourg (UNISTRA)-Centre National de la Recherche Scientifique (CNRS), Université de Montréal (UdeM), Physique des interactions ioniques et moléculaires (PIIM), Centre National de la Recherche Scientifique (CNRS)-Aix Marseille Université (AMU), ANR-10-BLAN-0941,GYPSI,Simulation GYrocinétique haute Performance Pour ITER(2010), ANR-11-IDEX-0001,Amidex,INITIATIVE D'EXCELLENCE AIX MARSEILLE UNIVERSITE(2011), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-École normale supérieure - Rennes (ENS Rennes)-Université de Rennes 2 (UR2)-Centre National de la Recherche Scientifique (CNRS)-INSTITUT AGRO Agrocampus Ouest, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro), Aix Marseille Université (AMU)-Centre National de la Recherche Scientifique (CNRS), and ANR-11-LABX-0020,LEBESGUE,Centre de Mathématiques Henri Lebesgue : fondements, interactions, applications et Formation(2011)
- Subjects
Physics ,Conservation law ,Tokamak ,Turbulence ,[PHYS.MPHY]Physics [physics]/Mathematical Physics [math-ph] ,General Physics and Astronomy ,Flux ,high-performance computing ,Plasma ,semi-lagrangian method ,Supercomputer ,01 natural sciences ,010305 fluids & plasmas ,law.invention ,Ion ,Computational physics ,gyrokinetic global full-f flux-driven simulations ,Hardware and Architecture ,law ,Physics::Plasma Physics ,plasma turbulence ,0103 physical sciences ,Code (cryptography) ,[ PHYS.MPHY ] Physics [physics]/Mathematical Physics [math-ph] ,010306 general physics - Abstract
International audience; This paper addresses non-linear gyrokinetic simulations of ion temperature gradient (ITG) turbulence in tokamak plasmas. The electrostatic Gysela code is one of the few international 5D gyrokinetic codes able to perform global, full-f and flux-driven simulations. Its has also the numerical originality of being based on a semi-Lagrangian (SL) method. This reference paper for the Gysela code presents a complete description of its multi-ion species version including: (i) numerical scheme, (ii) high level of parallelism up to 500k cores and (iii) conservation law properties.
- Published
- 2016
- Full Text
- View/download PDF
50. From DSL to HPC Component-Based Runtime: A Multi-Stencil DSL Case Study
- Author
-
Christian Pérez, Hélène Coullon, Julien Bigot, Maison de la Simulation (MDLS), Université de Versailles Saint-Quentin-en-Yvelines (UVSQ)-Institut National de Recherche en Informatique et en Automatique (Inria)-Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Algorithms and Software Architectures for Distributed and HPC Platforms (AVALON), Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de l'Informatique du Parallélisme (LIP), École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-École normale supérieure de Lyon (ENS de Lyon)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Centre National de la Recherche Scientifique (CNRS), Grid5000, Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École normale supérieure - Lyon (ENS Lyon)-Centre National de la Recherche Scientifique (CNRS)-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), and Université de Lyon-École normale supérieure - Lyon (ENS Lyon)
- Subjects
Component Based Software engineering ,Domain-specific language ,[INFO.INFO-PL]Computer Science [cs]/Programming Languages [cs.PL] ,business.industry ,Computer science ,Stencil code ,Distributed computing ,DSL domain specific language ,Maintainability ,[INFO.INFO-SE]Computer Science [cs]/Software Engineering [cs.SE] ,Stencil ,[INFO.INFO-MO]Computer Science [cs]/Modeling and Simulation ,Stencil codes ,Software portability ,Digital subscriber line ,Programming productivity ,Component-based software engineering ,HPC High-Performance Computing ,[INFO.INFO-DC]Computer Science [cs]/Distributed, Parallel, and Cluster Computing [cs.DC] ,Software engineering ,business - Abstract
International audience; High performance architectures evolve continuously to be more powerful. Such architectures also usually become more difficult to use efficiently. As a scientist is not a low level and high performance programming expert, Domain Specific Languages (DSLs) are a promising solution to automatically and efficiently write high performance codes. However, if DSLs ease programming for scientists, maintainability and portability issues are transferred from scientists to DSL de- signers. This paper deals with an approach to improve main- tainability and programming productivity of DSLs through the generation of a component-based parallel runtime. To study it, the paper presents a DSL for multi-stencil pro- grams, that is evaluated on a real-case of shallow water equations.
- Published
- 2015
- Full Text
- View/download PDF
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.