Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 12, 2013 (edytowany) Witam, Mam sytuacje na jednym z serwerów w OVH: Macierz dyskowa 500 gb , /dev/md1 /dev/md2 O ile /dev/md1 jest oki[prawie oki] ( _U ) to cała macierz /dev/md2 znikneła nie potrafie tego przywrócić. Może trzeba dokonfigurować to w pliku mdadm ? Proszę o sugestie. // Na pewno nie chciałbym utracić danych które są na dysku. ( macierzy ) - tymczasowo podpiałem fizycznie /home z konkretnego dysku omijając macierz. Edytowano Styczeń 12, 2013 przez Dawid Sobieraj (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Pan Kot 1535 Zgłoś post Napisano Styczeń 12, 2013 Czy system w ogóle wykrywa dysk "fizycznie"? Może pomóc reboot w trybie RESCUE i sprawdzenie z poziomu http://1.2.3.4/:81 co jest nie tak i czy w ogóle dysk jest wykrywalny przez sprzęt (1.2.3.4 to IP dedyka). Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 12, 2013 (edytowany) Tak, wykrywa dysk fizycznie. On istnieje, tylko nie wykrywa mi macierzy. ( konkretniej /dev/md2 na której podmontowany był /home ). / Plik /etc/mdadm/mdadm.conf ARRAY /dev/md1 level=raid1 num-devices=2 UUID=58ce8002:e4fff179:a4d2adc2:26fd5302 ARRAY /dev/md2 level=raid1 num-devices=2 UUID=80cec190:80e311db:a4d2adc2:26fd5302 Jednak po cat /proc/mdadm stat mam tylko /dev/md1 Edytowano Styczeń 12, 2013 przez Dawid Sobieraj (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Pan Kot 1535 Zgłoś post Napisano Styczeń 12, 2013 Prawdopodobnie dysk jakimś cudem odmówił posłuszeństwa, prawdopodobnie coś się posypało. Masz dwie drogi do wyboru - albo wbudowaną aplikację OVH w trybie RESCUE (jeden klik i zrobi to za Ciebie) albo własnoręczne doszukiwanie się chociażby smartem i mdadm'em co jest nie tak. Logi mogą pomóc (/var/log/syslog + /var/log/kern.log). Udostępnij ten post Link to postu Udostępnij na innych stronach
abad0n 8 Zgłoś post Napisano Styczeń 12, 2013 (edytowany) Spróbuj mdadm --assemble --scan lub złóż tą macierz ręcznie mdadm --assemble /dev/md2 /dev/sdx /sdy. Edytowano Styczeń 12, 2013 przez abad0n (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 12, 2013 (edytowany) Prawdopodobnie dysk jakimś cudem odmówił posłuszeństwa, prawdopodobnie coś się posypało. Masz dwie drogi do wyboru - albo wbudowaną aplikację OVH w trybie RESCUE (jeden klik i zrobi to za Ciebie) albo własnoręczne doszukiwanie się chociażby smartem i mdadm'em co jest nie tak. Logi mogą pomóc (/var/log/syslog + /var/log/kern.log). Możesz sprecyzować jednym kliknięciem ? / mdadm --assemble --scan mdadm: No suitable drives found for /dev/md2 Pozdrawiam. Edytowano Styczeń 12, 2013 przez Dawid Sobieraj (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Pan Kot 1535 Zgłoś post Napisano Styczeń 12, 2013 http://pomoc.ovh.pl/TrybRescue Oczywiście magicznie nie naprawi za Ciebie errorów, ale może nakierować w czym tkwi problem. Udostępnij ten post Link to postu Udostępnij na innych stronach
Miłosz 2311 Zgłoś post Napisano Styczeń 13, 2013 A smart tych dysków jak wygląda? Może już są w zaawansowanym stadium rozpadu? Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 13, 2013 Prawdopodobnie dwa do wymiany, widać te dyski w systemie czy się odpięły ? Na pewno nie chciałbym utracić danych które są na dysku. ( macierzy ) - tymczasowo podpiałem fizycznie /home z konkretnego dysku omijając macierz. Zrób kopie jeżeli się uda, sprawdź smarty, wymień wadliwy dysk/dyski. Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 13, 2013 Dziękuje za odpowiedź -> Smart jest ok ( o dziwo ), tylko co spowodowało problem ? C odo trybu rescue - wchodziłem i mogłem przeprowadzić tylko testy które zakończyły się powodzeniem - nie mam możliwości reinicjalizacji macierzy. Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 13, 2013 Jeżeli smart jest ok, to zostaje dostać się do logów kernela i sprawdzić kabelek/kontroler sata. Danych pewnie nie straciłeś, aczkolwiek ostrożnie teraz z pracami przy macierzy raid. Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 13, 2013 (edytowany) Nie straciłem jednak martwie sie samą synchronizacją. Czy podczas synchronizowania macierzy nie utracę danych ? - Jeśli dobrze to rozumiem to jednak jest możliwość ich utraty. Dysk /dev/sda jest oki - jego montuje. Dysk /dev/sdb jest rozsypany ( dostęp do partycji /dev/sdb1 - do reszty nie ). Może warto : -> Przekopiować /dev/sda na /dev/sdb ( partycje, dane ) a później dokonać synchronizacji ? // Z tego co widać, lekko olewają kimsufi - zależało mi na dedyku bo nie mam przyjemnych doswiadczeń z VPS. A tutaj mam dużą kontrole - duży problem. Rozpoczynam kopiowanie całego /home Posiadam tam licencje DA - czy w przypadku ewentualnego utracenia /home , samo wrzucenie zsynchronizuje mi DA ? Wykonanie Backupu nie pomaga - wywala błędy. ( Nie mogę spakować, nie mogę odczytać ... ) - Jednak mogę przez winscp wszystko zaciągnąć. Edytowano Styczeń 13, 2013 przez Dawid Sobieraj (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 13, 2013 (edytowany) Jeżeli tam namieszane i montujesz dyski poza macierzą tu utwórz ją od nowa w rescue: Zrób sobie kopie danych z SDA gdzieś na zewnątrz ( choć to dodatkowe zabezpieczenie ). Wyczyść SDB i utwórz pustą macierz dyskową. Zgraj dane z SDA na SDB. Uruchom system z tej macierzy Raid, pokaże się że jest uszkodzona i przygotuj/dodaj do niej dysk SDA. --- Czyl jednak są uszkodzone dyski/kontroler, więc zacznij pracę od kopi danych i wymiany komponentu. Edytowano Styczeń 13, 2013 przez patrys (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 13, 2013 Póki co przenosze pliki - przenosze całość na inny serwer i rozpoczne "zabawę". Kwestia taka, że oni chcą żebym im napisał który dysk jest uszkodzony... Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 13, 2013 pokaż smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen' smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen' Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 13, 2013 (edytowany) pokaż smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen' smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen' smartctl -a /dev/sda | egrep 'Mod|Ser|Rea|Pen' Device Model: ST500DM002-1BD142 Serial Number: Z3T747P3 1 Raw_Read_Error_Rate 0x000f 108 099 006 Pre-fail Always - 65528 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1307983868 smartctl -a /dev/sdb | egrep 'Mod|Ser|Rea|Pen' Device Model: ST500DM002-1BD142 Serial Number: Z3T731X7 1 Raw_Read_Error_Rate 0x000f 111 099 006 Pre-fail Always - 32317912 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 1758997049 // Widzę problem, niestety. Dziękuje. Edytowano Styczeń 13, 2013 przez Dawid Sobieraj (zobacz historię edycji) Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 13, 2013 A pokaże jeszcze smartctl -a /dev/sda| grep Com i smartctl -a /dev/sdb| grep Com Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 13, 2013 A pokaże jeszcze smartctl -a /dev/sda| grep Com i smartctl -a /dev/sdb| grep Com smartctl -a /dev/sda| grep Com 188 Command_Timeout 0x0032 100 098 000 Old_age Always - 4295032838 # 1 Short offline Completed without error 00% 811 - # 2 Short offline Completed without error 00% 806 - # 3 Short offline Completed without error 00% 806 - # 4 Short offline Completed without error 00% 11 - # 5 Short offline Completed without error 00% 6 - # 6 Short offline Completed without error 00% 6 - # 7 Short offline Completed without error 00% 0 - smartctl -a /dev/sdb| grep Com 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 150326149157 # 1 Short offline Completed without error 00% 811 - # 2 Short offline Completed without error 00% 806 - # 3 Short offline Completed without error 00% 806 - # 4 Short offline Completed without error 00% 11 - # 5 Short offline Completed without error 00% 6 - # 6 Short offline Completed without error 00% 6 - # 7 Short offline Completed without error 00% 0 - Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 17, 2013 To jest spory problem, do sprawdzenia kontroler dyskowy i połączenie do niego. Są jakieś błędy w dmesg ? Jak tak proszę przeklej je tu. Udostępnij ten post Link to postu Udostępnij na innych stronach
Dawid Sobieraj 1 Zgłoś post Napisano Styczeń 17, 2013 Wiesz co temat zamknąłem - wynająłem nowy serwer dedykowany - oczko wyżej, a z obecnego zostanie mi przeliczony czas. Udostępnij ten post Link to postu Udostępnij na innych stronach
Gość patrys Zgłoś post Napisano Styczeń 17, 2013 W OVH to jedno z najlepszych rozwiązań w tym przypadku Udostępnij ten post Link to postu Udostępnij na innych stronach