@etoppl
Dziękujemy za pytanie, ale zamiast odpowiadać na forum, woleliśmy zakasać rękawy i jak najszybciej przywrócić prawidłowe działanie usług.
W tej chwili wszystko działa OK, pora więc na krótkie wyjaśnienie.
Dziś, kilka minut po północy, odnotowaliśmy problemy z działaniem core’owych switchy, a dokładniej mówiąc rozsypała się synchronizacja między nimi. Skutek to utrata pakietów, która wyniosła 10-70%. Switche zostały wymienione na nowe, jednak nie rozwiązało to problemu. Od tego momentu prowadziliśmy prace równolegle przez dwa zespoły administratorów: jeden starał się przywrócić działanie obecnej infrastruktury, drugi rozpoczął konfigurację niezależnego core’a sieci. Mimo współpracy z producentem switchy nie udało się rozwiązać problemu w ich komunikacji, dlatego niezwłocznie po zakończeniu prac nad nową infrastrukturą rozpoczęliśmy przełączenie kolejnych segmentów sieci na nową infrastrukturę core'ową. Od ok. godz. 12 sytuacja jest unormowana i usługi działają poprawnie, co potwierdza zarówno monitoring, jak i komunikaty od Klientów.
Raz jeszcze przepraszamy za niedogodności.