У понеділок 22 червня 2020 року інтернет-провайдер Ланет повідомив про збої в роботі мережі. Деякі користувачі не мали доступу до Інтернету. Проблему доволі швидко виправили. Компанія розказала, що саме стало причиною проблеми.
О 9:53 на ділянці мережі центрального ядра Мережі Ланет вийшла з ладу лінійна мережева карта на 32-а 10-гігабітних порти, що призвело до аварійної ситуації, внаслідок якої частина абонентів спостерігала труднощі в доступі до Інтернету, а працівники – в користуванні внутрішніми сервісами компанії. Внаслідок аварії о 9:58 у деяких користувачів Мережі Ланет розпочались проблеми з інтернет-доступом. О 10:10 проблема поширилась та тривала до 11:02.
Відновивши роботу сервісів та проаналізувавши ситуацію, компанія відстежила всю послідовність подій під час цього інциденту.
Що відбувалось під час аварії?
9:53 — вийшла з ладу лінійна мережева карта на 32-а 10-гігабітних порти;
9:54 — внаслідок деградації трафіку почалися збої в роботі внутрішніх сервісів, у той же час спеціалісти зафіксували аварійну ситуацію. Оскільки ключова послуга з надання доступу до Інтернету користувачам продовжувала працювати, на початковому етапі реагування спеціалісти сконцентрувались на вирішенні проблеми без глобальних втручань у роботу всієї системи;
10:10 — посилення наслідків призвело до збоїв у доступі до Інтернету в користувачів, а ситуація набула масового характеру;
10:12 — інженери приступили до переналаштування обладнання та часткового перенесення сервісів на робочі модулі мережевого ядра для відновлення надання основної послуги Інтернет. Завдяки закладеному резерву, це вдалося провести оперативно на доступній конфігурації;
10:35 — розпочалося відновлення ключових внутрішніх сервісів, що відповідають за надання доступу до мережі Інтернет абонентам;
11:02 — відновлено доступ до Інтернету для абонентів;
11:10 — розпочато переналаштування ядра мережі та встановлення резервного модуля з метою переключення та відновлення решти сервісів, зокрема телефонії;
11:57 — встановлено додаткові елементи обладнання та відновлено роботу усіх внутрішніх сервісів.
Кабельне телебачення продовжувало працювати без збоїв, а роботу з подолання наслідків ситуації вели першопріоритетно щодо основної послуги: доступу до мережі Інтернет для частини абонентів. Повернення в робочий стан внутрішніх сервісів Мережі Ланет відбувалось під час другого етапу. Внаслідок чого телефонний зв’язок з гарячою лінією з’явився після відновлення інтернет-доступу.
Аналізуючи перебіг подій та кроки для подолання наслідків аварії, компанія шукає варіанти модифікації інфраструктури та розглядає можливості для перерозподілу мережевого навантаження задля попередження таких ситуацій в майбутньому.
«Ми отримали багато повідомлень від наших користувачів у соцмережах, завдяки чому змогли швидко відреагувати на аварію та виявити її масштаби. Приносимо вибачення за незручності, які довелось відчути частині наших абонентів у зв’язку з ситуацією. А також дякуємо кожному за розуміння, підтримку та за зворотний зв’язок, який допомагає нам зрозуміти значення всіх здійснених нами кроків».
Ланет