Wat is checkpointing in computationele architectuur?

Checkpointing in computationele architectuur is een techniek die wordt gebruikt om fouttolerantie in computersystemen mogelijk te maken. Het gaat om het periodiek opslaan van de huidige status van een programma of berekening op schijf of een ander niet-vluchtig opslagmedium. Hierdoor kan het programma de uitvoering hervatten vanaf het laatst opgeslagen checkpoint, in plaats van opnieuw te beginnen vanaf het begin, in het geval van een storing of onderbreking. Checkpointing wordt vaak gebruikt in high-performance computing en gedistribueerde systemen, waar langlopende berekeningen of simulaties vatbaar zijn voor hardware- of softwarefouten. Door een geschiedenis van checkpoints bij te houden, stelt het het systeem in staat om te herstellen waar het was gebleven, waardoor de hoeveelheid tijd die nodig is voor het opsporen van fouten aanzienlijk wordt verkort en de algehele systeemprestaties worden verbeterd.

Publicatie datum: