Hadrien Croubois : Detecting Silent Data Corruption Using an Auxiliary Method and External Observer

Title: Detecting Silent Data Corruption Using an Auxiliary Method and External Observer

Speaker: Hadrien Croubois

Abstract: HPC platforms and application are becoming increasingly complex. Consequently, protecting results against all forms of corruption and ensuring trustworthiness are becoming more important. While previous work focuses on application-specific detectors, the dataflow manager in our current work in the Decaf project aims to have an efficient generic mechanism. We address those issues using new replication patterns that rely on the use of an auxiliary method and an external learning observer. In this talk, we present both the theoretical validation mechanisms and different use cases where our mechanism can be applied to detect silent data corruption.

2015-09-08_Hadrien

Labex MILYON

Laboratoire d’excellence en mathématiques et informatique fondamentale.

MILYON fédère les communautés mathématiques et informatique de Lyon autour de trois axes : la recherche d’excellence, notamment des domaines à l’interface des deux disciplines ou d’autres sciences ; la formation, avec l’appui à des filières innovantes tournées vers la recherche ; la société, à travers la médiation de la culture scientifique auprès du grand public et le transfert de technologie vers l’industrie.

Il regroupe plus de 350 chercheurs, et trois unités mixtes de recherche de l’Université de Lyon : l’Institut Camille Jordan, le Laboratoire de l’Informatique du Parallélisme et l’Unité de Mathématiques Pures et Appliquées.

Plus d’information sur le site de MILYON.

Start Date:

Duration: Until 2024

Avalon Members: