Skocz do zawartości
Zaloguj się, aby obserwować  
c_tom

awarie / pady dysków

Polecane posty

Witam,

Mam takie pytanie do adminów-praktyków - jak często spotykacie się z awariami / padami całych dysków?

Proszę jeszcze o info z jakimi dyskami najlepiej wybierać dedyki ?

 

Pozdrawiam,

Tomasz

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Mam takie pytanie do adminów-praktyków - jak często spotykacie się z awariami / padami całych dysków?

 

Dobre pytanie, sam jestem ciekaw.

 

I moje pytanie? Czy w wypadku awari 1 dysku w dedyku z Soft Raid w OVH ( http://www.ovh.pl/prywatne/produkty/superplan2008raid.xml ) wymiana dysku jest wg poniższego schematu?

 

-system (chyba SMART) wykrywa awarię 1 dysku

-idzie info do technika

-w ciągu 4h technik wymienia wadliwy dysk

-włączenie serwera i automatyczne przegranie danych ze sprawnego dysku

-o całej operacji ja jako wlasciciel dedyka dowiaduję się po wszystkim

 

Czy w OVH naprawdę może to odbyć się tak "bezboleśnie"?

 

PS. Pytanie moje jest może trochę naiwne ale zastanawia mnie od dluzeszgo czasu.

 

Ed

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Czy w OVH naprawdę może to odbyć się tak "bezboleśnie"?
Z tego co widzę po skryptach systemu monitoringu RTM, czyli tego, który OVHinstaluje per default na każdej maszynie - są pobierane informacjedt. stanu programowych macierzy RAID i przekazywane do nich.Pytanie tylko co oni z tymi informacjami robią i czy faktycznie te danesą jakoś parsowane automatycznie i przekazywane administratoromw przypadku awarii. Niestety na to nikt tu na forum nie odpowie.Zawsze istnieje możliwość monitorowania macierzy na własną rękęi podjęcie reakcji... polegającej na wysłaniu do OVH maila.Wpierw trzeba zobaczyć jakie mamy macierze,można to zrobić wydając polecenie mount lub cat /proc/mdstat.Potem należy dla każdej z nich z osobna wydać polecenie,tutaj przykład dla macierzy md1:
mdadm --monitor --mail=ty@domena.pl --delay=1800 /dev/md1

W przypadku degradacji macierzy dostaniemy ładnego maila.( o ile na serwerze mamy jakiekolwiek działające MTA oczywiście )

jak często spotykacie się z awariami / padami całych dysków?
niestety, nie ma na to algorytmu
Proszę jeszcze o info z jakimi dyskami najlepiej wybierać dedyki ?
SAS :blink:

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Z tego co widzę po skryptach systemu monitoringu RTM, czyli tego, który OVHinstaluje per default na każdej maszynie - są pobierane informacjedt. stanu programowych macierzy RAID i przekazywane do nich.Pytanie tylko co oni z tymi informacjami robią i czy faktycznie te danesą jakoś parsowane automatycznie i przekazywane administratoromw przypadku awarii. Niestety na to nikt tu na forum nie odpowie.

 

Poczekam do pierwszej awarii i zobaczę na ile ich reakcja bedzie zgodna z zapewnieniami :blink:

 

Ed

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Ja jak na kimsufi (zgodnie z ofertą - 8godz. do reakcji) wyłączyłem sobie pingowanie, to po chwili dostałem maila "technicy wykryli usterkę, zostanie usunięta w 30minut". Była to sobota... No jesli to prawda, to po prostu żyć nie umierać :blink:

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Ja jak na kimsufi (zgodnie z ofertą - 8godz. do reakcji) wyłączyłem sobie pingowanie, to po chwili dostałem maila "technicy wykryli usterkę, zostanie usunięta w 30minut". Była to sobota... No jesli to prawda, to po prostu żyć nie umierać :blink:

 

na moim serwerze w czasie konfiguracji również dostawałem takie emaile, ale jestem ciekaw jak wygląda reakcja na nie. Czy faktycznie technicy się zabierają za naprawę w ciągu 4 godzin czy później?

 

Ed

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

W przypadku naszych serwerów w OVH, gdy na samym początku były robione testowe firewalle i wyłączaliśmy pingi to przychodził mail a naprawa technika trwała max 40minut :blink:

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Sas mi ani jeden nie padł, scsi 2 mi padły, sata padł jeden. W czasie kilku lat. Większość nie pada. To były sporadyczne przypadki.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
W przypadku naszych serwerów w OVH, gdy na samym początku były robione testowe firewalle i wyłączaliśmy pingi to przychodził mail a naprawa technika trwała max 40minut ;)

 

co obejmowała interwencja technika?

 

Ed

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Bądź aktywny! Zaloguj się lub utwórz konto

Tylko zarejestrowani użytkownicy mogą komentować zawartość tej strony

Utwórz konto

Zarejestruj nowe konto, to proste!

Zarejestruj nowe konto

Zaloguj się

Posiadasz własne konto? Użyj go!

Zaloguj się

Zaloguj się, aby obserwować  

×