Mindre misstag, stor katastrof - GitLab går offline för en dag
GitLab, en start som är ett alternativ till den mycket populära GitHub, har nyligen haft en ganska hård dag nyligen som en mänskligt fel orsakade hela webbplatsen att vara nere för en hel dag.
GitLabs problem började först när Webbplatsen upplevde laddningstid och stabilitetsproblem. Webbplatsen togs offline för att rätta till problemen. Under underhållet, någon oavsiktligt gjorde misstaget att oavsiktligt radera en katalog innehållande 300 GB levande produktionsdata.
Lyckligtvis för GitLab, innehållet som bara raderades drabbade problem och sammanslagna förfrågningar. Förvar och wikis påverkades inte på något sätt av detta misstag, vilket innebar att skada som orsakats av detta misstag var inte lika svår som det kunde ha varit
Med katalogen raderad, vänder GitLab-personalen omedelbart mot sin säkerhetskopia. Tyvärr för dem gick GitLab in i ännu ett problem. Enligt Google Doc-filen som ständigt uppdaterades som GitLab-kampanjer för att komma tillbaka online, alla 5 säkerhetskopiering / replikering tekniker som användningen av webbplatsen misslyckades med att fungera på ett tillförlitligt sätt, och i vissa fall var Ställ aldrig upp i första hand.
Hämtar dessa förlorade filer från molnet är inte ett alternativ för GitLab, antingen som uppstarten bestämdes i slutet av förra året till dumpa molnet för att bygga och driva egna Ceph-kluster istället. Det är naturligtvis nu, att GitLab nu reconsiderar sin inställning till det aktuella ämnet.
@TheRegister @gitlab kommer att arbeta för att göra ansökan mer prestanda och utforska alternativa cloud hosting-leverantörer.
- Connor Shea (@connorjshea) 1 februari 2017
Trots den tumultuous dagen som GitLab har haft, är webbplatsen nu igång som vanligt. Medan webbplatsen rapporterade att vissa data försvann under ett sex timmars fönster, Git förvaringar lämnades oskadd genom hela prövningen. En fullständig händelselogg av hela evenemanget kan ses här.
Medan många lektioner kan läras av GitLabs lilla misstag (främst hubris) är GitLabs metod att hantera krisen ganska beundransvärt som uppstarten var tydlig och transparent med sina användare. Här är att hoppas att GitLab lär sig av detta misstag. Annars skulle användarbasen förmodligen vara mindre förlåtande om historien upprepar sig.
Källa: Registeret