Vad är checkpointing i beräkningsarkitektur?

Checkpointing i beräkningsarkitektur är en teknik som används för att möjliggöra feltolerans i datorsystem. Det innebär att regelbundet spara det aktuella tillståndet för ett program eller en beräkning på disk eller annat icke-flyktigt lagringsmedium. Detta gör att programmet kan återuppta körningen från den senast sparade kontrollpunkten, snarare än att börja om från början, i händelse av ett fel eller avbrott. Checkpointing används ofta i högpresterande datorer och distribuerade system, där långvariga beräkningar eller simuleringar är känsliga för hårdvaru- eller mjukvarufel. Genom att upprätthålla en historik över kontrollpunkter gör det det möjligt för systemet att återhämta sig från där det slutade, vilket kraftigt minskar den tid som krävs för att felsöka och förbättra systemets övergripande prestanda.

Publiceringsdatum: