Skocz do zawartości

Polecane posty

EDIT

------------------------------

 

Po 6h serwer jest już znowu online.

-----------------------------

 

Linuxpl.com serwer s72, niedostępny od ponad 5h, od helpdesku (poprzez chat) linuxpl.com: "awaria już prawie naprawiona":

tracert desmodium.pl
  1     *        *        *     Request timed out.
  2     *        *        *     Request timed out.
  3    14 ms    16 ms    14 ms  172.17.176.21
  4    18 ms    19 ms    19 ms  172.17.28.22
  5    44 ms    25 ms    18 ms  172.17.28.22
  6    42 ms    42 ms    42 ms  amsix-gw.hetzner.de [80.249.209.55]
  7    48 ms    46 ms    47 ms  core1.hetzner.de [213.239.203.157]
  8    48 ms    50 ms    48 ms  core22.hetzner.de [213.239.245.178]
  9    51 ms    49 ms    50 ms  juniper2.rz13.hetzner.de [213.239.245.122]
 10     *        *        *     Request timed out.
 11     *        *        *     Request timed out.
 12     *        *        *     Request timed out.
 13     *        *        *     Request timed out.
 14     *        *        *     Request timed out.
 15     *        *        *     Request timed out.
 16     *        *        *     Request timed out.
 17     *        *        *     Request timed out.
 18     *        *        *     Request timed out.
 19     *        *        *     Request timed out.
 20     *        *        *     Request timed out.
 21     *        *        *     Request timed out.
 22     *        *        *     Request timed out.
 23     *        *        *     Request timed out.
 24     *        *        *     Request timed out.
 25     *        *        *     Request timed out.
 26     *        *        *     Request timed out.
 27     *        *        *     Request timed out.
 28     *        *        *     Request timed out.
 29     *        *        *     Request timed out.
 30     *        *        *     Request timed out.
Od tracert netii:
traceroute to 88.198.10.70 (88.198.10.70), 30 hops max, 60 byte packets
1 78.10.161.1 (78.10.161.1) 1.024 ms 0.991 ms 0.956 ms
2 StarH001rt06-ToruH001rt05.inetia.pl (83.238.249.65) 9.317 ms 9.287 ms 9.299 ms
3 WarsB010RT02-WarsC001RT06.inetia.pl (83.238.250.129) 9.688 ms 9.711 ms 83.238.248.53 (83.238.248.53) 8.518 ms
4 xe-0-0-7-0.ber10.core-backbone.com (193.178.185.44) 12.680 ms 12.808 ms 13.001 ms
5 ae14-2002.fra10.core-backbone.com (81.95.2.198) 25.198 ms 25.052 ms 25.069 ms
6 core-backbone-100g-fra.hetzner.de (80.255.15.122) 31.403 ms 25.086 ms 24.777 ms
7 core4.hetzner.de (213.239.245.2) 25.091 ms core1.hetzner.de (213.239.245.9) 24.937 ms 24.917 ms
8 core22.hetzner.de (213.239.245.178) 29.486 ms core21.hetzner.de (213.239.245.13) 29.526 ms core22.hetzner.de (213.239.245.17) 29.358 ms
9 juniper2.rz13.hetzner.de (213.239.245.122) 27.135 ms juniper1.rz13.hetzner.de (213.239.245.82) 29.758 ms 29.763 ms
10 * * *
11 * * *
12 * * *
13 * * *
14 * * *
15 * * *
16 * * *
17 * * *
18 * * *
19 * * *
20 * * *
21 * * *
22 * * *
23 * * *
24 * * *
25 * * *
26 * * *
27 * * *
28 * * *
29 * * *
30 * * *
Edytowano przez maszynka (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Jakaś grubsza sprawa.... konta www klientów lezą :/

traceroute to 178.63.102.95 (178.63.102.95), 30 hops max, 60 byte packets
 1  praha-4d-c1-vl55.masterinter.net (77.93.199.253)  6.280 ms  6.323 ms  6.408 ms
 2  vl1391.cr2.c16.127.cecolo.prg.masterinter.net (83.167.254.142)  1.954 ms  1.959 ms  1.945 ms
 3  * * *
 4  ae6-2011.nbg40.core-backbone.com (80.255.14.246)  8.335 ms  8.347 ms  8.326 ms
 5  core-backbone-100g-nbg.hetzner.de (81.95.15.6)  123.700 ms  123.709 ms  123.696 ms
 6  core12.nbg1.hetzner.com (213.239.229.165)  123.444 ms  123.472 ms  123.470 ms
 7  core21.fsn1.hetzner.com (213.239.245.222)  128.620 ms core22.fsn1.hetzner.com (213.239.245.213)  125.226 ms  125.249 ms
 8  ex9k2.rz12.hetzner.de (213.239.229.246)  10.392 ms  10.404 ms  10.394 ms
 9  * * *
10  * * *
11  * * *
12  * * *
13  * * *
14  * * *
15  * * *
16  * * *
17  * * *
18  * * *
19  * * *
20  * * *
21  * * *
22  * * *
23  * * *
24  * * *
25  * * *
26  * * *
27  * * *
28  * * *
29  * * *
30  * * *

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość pioklo

Nie ma zadnej grubszej sprawy :)

5 minutowa awaria czesci podsieci juz jest ok

 

Piotr

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

s98 leży od wczoraj 18:48

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

Informacje odnośnie awarii serwera s98.vdl.pl

23.05.2017, godzina 00:58

W dniu 22.05 po godzinie 19 doszło do poważnej awarii macierzy RAID10, która utrzymuje dane
stron www i poczty Klientów. W jednym czasie uszkodzone zostały dwa dyski i macierz została
rozsynchronizowana. Obecnie trwają prace nad możliwościa przywrócenia macierzy do działania.
Jest to dosć czasochłonny proces i jeżeli się uda, dane bedą dostępne. Istnieje jednak możliwość
utraty danych, będziemy wtedy przywracali kopie zapasowe z zewnętrznych serwerów.

Nie jest jeszcze znany dokładny czas naprawy serwera, ale napewno potrwa kilka-kilkanaście godzin.
Macierz z bazami danych i ustawieniami jest bezpieczna i nienaruszona.


23.05.2017, godzina 7:00

Niestety nie udało się uruchomić macierzy RAID, ponieważ podczas resynchronizacji danych
doszło do uszkodzenia kolejnego dysku. Sprawdzimy jeszcze jedną możliwość i jeżeli sie
nie uda, zaczniemy przywracać dane z kopii na całkiem nową macierz stworzoną z nowych dysków.


23.05.2017, godzina 8:45

Uruchomiliśmy procedurę przywracania danych z kopii zapasowych. Kopie plików posiadamy z 16-22 maja.
Będziemy mailowo informować każdego Klienta o przywróceniu jego danych.

Po zakończeniu awarii będziemy informować o przyznanych gratyfikacjach do każdego konta na tym serwerze.
Przepraszamy za niedostępność serwera.

 

łączna długość tej awarii to już 19h ... rekordu jeszcze nie ma jeśli chodzi o linuxpl ale są szanse.

 

 

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość

s98 leży od wczoraj 18:48

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

łączna długość tej awarii to już 19h ... rekordu jeszcze nie ma jeśli chodzi o linuxpl ale są szanse.

 

 

 

W przypadku tego typu awarii czynnik ludzki ma mniejsze znaczenie niż na przykład to w jaki sposób sobie sprzęt radzi. Z tego co wkleiłeś wynika, że dane będą przywracane z kopii. Jest to zawsze proces czasochłonny.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

 

konsultanci są po melisie i generalnie nic konkretnego nie podają, jedyne co udało mi się uzyskać to

 

 

A jakie jeszcze chciałbyś konkrety? Nr seryjne zepsutych dysków? Padły dwa dyski w RAID. Próbowali ją uruchomić. Nie udało się, bo padł kolejny. Spróbowali jeszcze jeden sposób (nie wiem co oni jeszcze próbowali wycisnąć z RAID z trzema padniętymi dyskami), nie udało się. Utworzyli nową macierz i odzyskują dane kont z backupów. Będą emailowo informować każdego klienta o odzyskaniu danych. Na koniec zaproponują gratyfikację dla każdego konta. Przepraszają.

 

Awaria nieprzyjemna sprawa, ale chciałbym żeby każda firma potrafiła po każdym etapie prac wydać komunikat. Następnie bez zbędnej grzebaniny zacząć odzyskiwać dane z backupu (i z tym różnie bywa w innych hostingach), o czym będą informować klienta.

 

Jedyny minus to że mogli zacząć odzyskiwać dane z backupów na nową macierz zaraz po awarii. Jeśli odbudowa RAID by się powiodła to nie skorzystać, a jeśli by się nie powiodła to mieliby gotową macierz z odzyskanymi danymi. A tak kolejne godziny czekania.

Edytowano przez nnd_newbie (zobacz historię edycji)

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

 

A jakie jeszcze chciałbyś konkrety? Nr seryjne zepsutych dysków?

 

Sarkazm nie jest potrzebny, merytorycznie nic nie wnosi a sugeruje brak argumentów.

 

To co podałem otrzymałem 5 minut przed wysłaniem na wht. Oczekiwałbym:

- na początku awarii rzetelne info co się dzieje,

- plan co będzie robione,

- info o postępach i ew. zmianach planu,

 

maile które otrzymałem godzinę po wystąpieniu awarii zawierały się w jednym zdaniu:

Serwer ma awarię nie możemy podać czasu jej usunięcia.

Pierwsze konkretne info udało się wydusić dziś rano.

Dla mnie to słabe.

Żeby była jasność - nie mam do nikogo pretensji że serwer leży od X godzin bo padła macierz - wcale nie zazdroszczę tym chłopakom, ale wątek jest o tym jak zachowują się firmy w trakcie padu i tu to opisałem. Nie oczekuję złotych gór czy pisma na papierze czerpanym przyniesionego na czerwonej poduszce tylko konkretnego info żebym wiedział na czym stoję.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość pioklo

Żeby była jasność - nie mam do nikogo pretensji że serwer leży od X godzin bo padła macierz - wcale nie zazdroszczę tym chłopakom, ale wątek jest o tym jak zachowują się firmy w trakcie padu i tu to opisałem. Nie oczekuję złotych gór czy pisma na papierze czerpanym przyniesionego na czerwonej poduszce tylko konkretnego info żebym wiedział na czym stoję.

 

Witam

Na początku awarii nie jest od razu wiadomo co należy robić i jaki jest plan działania.

Trzeba zdiagnozować problem ,ustalić czy da się w prosty i szybki sposób przywrócić wszystko

.Tak więc ten początkowy czas to są same niewiadome a Klienci oczekują od razu

podania ETA i konkretnych rzeczy .Wtedy admini mogą przekazywać sprzeczne informacje, aż ustali się

jeden tor działania.

 

Obecnie jest już prawie 70% danych przywróconych z aktualnych kopii. Każdy admin pracuję u nas dziś ciężko aby informować Klientów co się dzieje. Możemy tylko przeprosić za tą awarie ale też oczywiście przydzielimy odpowiednie gratyfikacje każdemu Klientowi po ukończeniu przywracania danych.

 

Piotr

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

 

Tak więc ten początkowy czas to są same niewiadome a Klienci oczekują od razu

podania ETA i konkretnych rzeczy.

 

Piotrze,

napisałem w poście powyżej że pierwsze zgłoszenie poszło po 1h od komunikatu z mojego monita że website-down, bardzo proszę nie uogólniaj i nie przeinaczaj. Po równej godzinie zgłosiłem na admin@ że jest problem z maszyną. Wiem, że jak pierdyknie to potrzebna jest chwila żeby się ogarnąć, ale po godzinie warto już mieć diagnozę, plan i scenariusz dla klientów. Napisałem to w dobrej wierze a nie po to żeby się przyczepić, możesz skorzystać z mojej sugestii albo ją zignorować i olać.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Minął tydzień od awarii:

- brak informacji o podsumowaniu awarii (nie wiem z jakich dni które backupy są podniesione), u mnie maile są z 8-9 maja, część plików z 18 maja, sam muszę dochodzić co jest od czego,

- brak informacji o przyznanej rekompensacie,

- usunięty z serwera link do awarii s98,

 

ogólnie sprawa zamieciona, a w zasadzie to nie było sprawy

 

 

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość pioklo

 

ogólnie sprawa zamieciona, a w zasadzie to nie było sprawy

 

 

 

 

Jest sprawa. Informacje o rekompensacie wyslemy w tym tygodniu .O niczym nie zapomnielismy ale chcemy najpierw dopracowac do konca poprawe tej awarii.

 

Piotr

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

 

Informacje o rekompensacie wyslemy w tym tygodniu .O niczym nie zapomnielismy ale chcemy najpierw dopracowac do konca poprawe tej awarii.

 

minął tydzień który wskazałeś, żaden mail nie dotarł, kibicuję dalej

Udostępnij ten post


Link to postu
Udostępnij na innych stronach
Gość pioklo

 

minął tydzień który wskazałeś, żaden mail nie dotarł, kibicuję dalej

 

Nie masz się co martwić o rekompensatę ,ona nie ucieknie i będzie przydzielona są już decyzje i mailing będzie wysłany.

 

Piotr

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

 

Nie masz się co martwić o rekompensatę ,ona nie ucieknie i będzie przydzielona są już decyzje i mailing będzie wysłany.

 

Piotr

 

widać ile są warte zapewnienia, poczekałem 3 miesiące + kilka dni i:

- żadnego mailingu nie było,

- żadnej rekompensaty nie widzę w panelu serwera,

 

żenua

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Witam.

Od wczoraj (28.05.2019) od około godziny 13 nie działa hosting na linuxpl.com. W moim przypadku jest to serwer VPS. Logowanie do panelu VM kończy się komunikatem "Alert: Could not Connect to the server(...)".

Czat na stronie linuxpl.com wyłączony (wczoraj jeszcze był), nie przychodzą też potwierdzenia zarejestrowania ticketu po wysłaniu maila na admin@linuxpl.com (zazwyczaj przychodziły z automatu po kilku sekundach).

Firma stoi, klienci uciekają, dostępu do maili i CRM brak. Trochę zaczynam się niepokoić tak długim downtime'em.

Czy ktoś z obecnych tutaj ma może jakieś szersze informacje na ten temat (od supportu niewiele się mogę dowiedzieć, niestety)?
 

Dziękuję za jakiekolwiek informacje.
Pozdrawiam.

Udostępnij ten post


Link to postu
Udostępnij na innych stronach

Bądź aktywny! Zaloguj się lub utwórz konto

Tylko zarejestrowani użytkownicy mogą komentować zawartość tej strony

Utwórz konto

Zarejestruj nowe konto, to proste!

Zarejestruj nowe konto

Zaloguj się

Posiadasz własne konto? Użyj go!

Zaloguj się


×