Nuovo
  • /
  • Blog
  • /
  • Tecnico
  • /
  • Perché i tuoi backup potrebbero fallire proprio quando ne hai davvero bisogno

Perché i tuoi backup potrebbero fallire proprio quando ne hai davvero bisogno

5 minuti
Tecnico
Przemyslaw Szanowski fotoPS
Przemyslaw Szanowski

Content Writer

Andy French fotoAF
Andy French

Director of Product Marketing


Un trasferimento dati riuscito viene spesso scambiato per un ripristino riuscito, ma si tratta di due metriche molto diverse quando si parla di protezione dei dati.  

Un guasto del backup dei dati può essere nascosto dietro una spunta verde di "successo" nella console, rivelandosi solo quando un’organizzazione tenta di ripristinare servizi critici durante un’interruzione.  

Questo Q&A analizza le ragioni tecniche per cui i backup falliscono e come passare da una mentalità "imposta e dimentica" a un’architettura di backup realmente resiliente. 

Punti chiave 

  • Una spunta verde di "successo" in una console di backup conferma solo un trasferimento dati al momento del backup e non garantisce che il punto di ripristino risultante sia effettivamente avviabile o non corrotto quando serve. 

  • I protocolli di storage legacy come Server Message Block (SMB) e Network File System (NFS) sono intrinsecamente vulnerabili, offrono un percorso facile al ransomware e rendono necessario il passaggio a storage nativo S3, archivio immutabile

  • Eliminare i guasti di backup richiede una combinazione della regola 3-2-1-1-0, controlli di integrità automatizzati e un’architettura di storage correttamente segmentata rispetto all’ambiente di produzione. 

Quali sono le cause più comuni di guasto del backup? 

Quando si affronta la domanda "Perché il mio backup continua a fallire?", la risposta di solito si riduce ad alcuni colpevoli ricorrenti.  

I limiti hardware spesso guidano l’elenco: un target di storage semplicemente non riesce a tenere il passo con le velocità di ingest dei dati oppure soffre di "bit rot"—la corruzione silenziosa dei dati nel tempo che rende un file illeggibile.  

I conflitti software sono un altro fattore importante, soprattutto quando i writer di Volume Shadow Copy (VSS) non riescono a "quiescere" o congelare correttamente un database molto attivo, lasciando uno snapshot incoerente e sostanzialmente inutile. 

Anche i colli di bottiglia di rete causano molta frizione; se il volume dei dati cresce più rapidamente di quanto la rete possa gestire, i job di backup possono sforare le finestre pianificate. Questo porta a sovrapposizioni dei job che alla fine causano il crash del sistema.  

Infine, il semplice errore umano—come un account di servizio configurato in modo errato o dimenticare di aggiungere una VM appena creata alla policy di protezione—rimane una delle cause di guasto del backup più persistenti in qualsiasi ambiente IT. 

Tuttavia, anche se il backup ha esito positivo, può comunque essere manipolato dal ransomware se non viene scritto su storage sicuro e assolutamente immutabile. 

Cosa devo fare se il mio backup fallisce? 

Se il report del mattino indica un guasto del backup, il primo passo è isolare l’ambito del problema.  

Una risposta comune allo scenario "backup fallito, cosa fare" consiste nel verificare immediatamente la capacità di storage, poiché i repository pieni sono la causa più frequente di terminazione dei job.  

Se lo spazio è disponibile, il passo tecnico successivo è rivedere i log di errore specifici nel software di backup per determinare se il problema è legato a negazioni di autorizzazione o a timeout di connettività. 

Capire perché un backup è fallito spesso richiede di verificare eventuali modifiche a livello di sistema, come rotazioni delle password o aggiornamenti del firewall, che potrebbero aver bloccato l’accesso del server di backup.  

In molti casi, un semplice riavvio dei servizi di backup può risolvere anomalie temporanee, ma un guasto persistente richiede un’indagine più approfondita sullo stato di salute dell’infrastruttura. 

Come posso risolvere i guasti di backup che continuano a verificarsi? 

Quando un backup continua a fallire nonostante le correzioni iniziali, è necessario un processo diagnostico più rigoroso.  

Per imparare in modo efficace come risolvere i guasti di backup, è meglio seguire un percorso tecnico strutturato: 

  1. Verifica lo stato dei writer VSS: esegui il comando ‘vssadmin list writers’ sul server sorgente per identificare eventuali writer in stato di errore o instabile. 
  2. Verifica il percorso di rete: esegui un ping persistente o un traceroute tra il server di backup e il repository durante la finestra di backup per individuare perdita di pacchetti o latenza elevata. 
  3. Convalida le autorizzazioni del servizio: assicurati che l’account del servizio di backup disponga in modo persistente dei diritti "Accedi come servizio" e che non sia stato bloccato da una policy di dominio. 
  4. Monitora l’I/O Storage: analizza le lunghezze delle code disco sull’appliance di storage per verificare se l’hardware è sovraccaricato dalla velocità di ingest, condizione che può portare il software di backup a mandare in timeout il job. 

Qual è il rischio di un guasto del backup per le aziende? 

Il rischio di guasto del backup è, in sostanza, il rischio di una chiusura definitiva dell’attività. 

Senza un punto di ripristino affidabile, un’organizzazione potrebbe affrontare una perdita totale dei dati, potenziali sanzioni enormi ai sensi di NIS2 o GDPR e la perdita di fiducia dei clienti nel lungo periodo. 

In uno scenario ransomware, un backup fallito o corrotto elimina qualsiasi leva che un’azienda avrebbe potuto avere. Se l’ambiente di produzione è bloccato e le copie di ripristino sono compromesse, l’unica opzione rimanente potrebbe essere il pagamento di un riscatto ad alto rischio che non offre alcuna garanzia reale di recuperare i dati.  

È un promemoria netto del fatto che la stabilità dell’infrastruttura di ripristino è ancora più importante dei firewall che proteggono la rete di produzione. 

Come posso verificare lo stato di salute dei miei backup e testarli in sicurezza? 

Un controllo approfondito dello stato di salute dei backup va ben oltre un semplice sguardo a un log di stato.  

Implica confermare che i dati siano leggibili e che le applicazioni all’interno del backup siano coerenti e pronte all’avvio.  

Di solito questo si fa montando i file di backup in un ambiente "sandbox" isolato per eseguire un heartbeat check o avviare un semplice script di verifica. 

La maggior parte degli ambienti moderni oggi si affida a strumenti di test automatizzati per avviare VM direttamente dallo storage di backup, consentendo test completi senza impattare i sistemi di produzione in esercizio.  

Per chi desidera maggiori dettagli su come testare i backup in un ambiente Veeam, consigliamo questa guida sul test di disaster recovery con Veeam e Object First

Come posso costruire una strategia di backup stabile e affidabile? 

Per una strategia di backup dei dati di lungo periodo, è meglio andare oltre la semplice copia dei file e adottare un framework strutturato come la regola di backup 3-2-1-1-0.  

Questo approccio suggerisce di creare più livelli di protezione mantenendo tre copie dei dati su due diversi tipi di supporto, con almeno una copia archiviata off-site.  

Per restare avanti rispetto al ransomware, l’"1" e lo "0" sono i veri elementi di svolta: richiedono almeno una copia immutabile e zero errori confermati da una verifica automatizzata continua. 

Un ambiente davvero stabile si basa anche sulla separazione logica dei dati di produzione, del software di backup e dei backup stessi.  

Mantenere la frequenza di backup allineata alla crescita reale dei dati aiuta a prevenire gap enormi durante un ripristino, mentre un regolare "audit della strategia" garantisce che le difese evolvano con la stessa rapidità del panorama delle minacce.  

Ancorando l’intero processo all’Immutabilità Assoluta, puoi garantire che nessuno—amministratore o attaccante—possa modificare o eliminare i tuoi backup. Quindi, anche se il resto della rete viene compromesso, il tuo percorso di ripristino rimane intatto. 

Come posso prevenire i guasti di backup in futuro? 

Prevenire problemi futuri inizia con l’abbandono delle configurazioni legacy "fragili".  

Molti backup tradizionali si basano su protocolli come SMB o NFS, che non sono mai stati realmente progettati per le esigenze ad alta pressione della moderna sicurezza dei dati; sono inclini a perdere connessioni e, peggio ancora, sono un bersaglio preferito dal ransomware.  

Modernizzare l’architettura passando a storage compatibile S3 offre un livello di trasporto molto più stabile e consente di incorporare l’immutabilità direttamente nei dati stessi. 

Oltre all’hardware, dovresti trattare lo stato di salute dei backup come un servizio di produzione. Impostare monitoraggio in tempo reale e avvisi proattivi garantisce che tu venga avvisato nel momento esatto in cui un job inciampa, invece di scoprirlo settimane dopo durante un tentativo di ripristino.  

Infine, resta al passo con la manutenzione "noiosa" ma vitale: aggiorna il firmware per correggere le vulnerabilità e rivedi regolarmente le liste di esclusione per assicurarti che nessun nuovo dato critico sia stato lasciato accidentalmente non protetto man mano che l’ambiente cresce. 

Come Object First previene il verificarsi di guasti dei dati  

La maggior parte dei backup fallisce a livello di storage. Quando il ransomware colpisce o i sistemi vanno offline, lo storage tradizionale spesso diventa l’anello più debole, lasciando i punti di ripristino esposti o corrotti.  

Object First ti prepara a un ripristino rapido offrendo uno storage di backup on-premises sicuro, semplice e potente con Immutabilità Assoluta per ambienti Veeam.  

È stato progettato attorno ai più recenti principi Zero Trust Data Resilience (ZTDR), che seguono una mentalità "Assume Breach" e accettano che individui, dispositivi e servizi che tentano di accedere alle risorse aziendali siano compromessi e non debbano essere considerati affidabili.  

Scarica il white paper e scopri perché Object First è lo storage migliore per Veeam

 

In questa serie

  • Article preview image
    9 migliori pratiche di backup dei dati
    minuti da leggere
    Leggi il Blog
  • Article preview image
    Proteggere i backup dall’avvelenamento dei dati
    5 minuti da leggere
    Leggi il Blog