Причиной коллапса стали проблемы с энергоснабжением в одном из дата-центров IT-гиганта
30 марта 2025 года пользователи по всей стране столкнулись с неожиданными трудностями при попытке воспользоваться сервисами Яндекса. Многие не могли прослушать музыку, проверить почту или оплатить покупки – технологический сбой затронул значительную часть цифровой экосистемы компании. Причиной проблем стала серьезная авария в дата-центре, расположенном в зоне ru-central1-b.
Первыми о неполадках сообщили пользователи Яндекс Музыки – один из самых популярных стриминговых сервисов в России внезапно перестал работать для тысяч меломанов. Согласно данным независимого сервиса Downdetector, который отслеживает работу популярных веб-ресурсов, к 13:30 по московскому времени количество жалоб превысило 2,3 тысячи.
«Я была в середине любимого альбома, когда музыка просто прервалась. Сначала думала, что проблема с моим интернетом, но потом увидела, что и другие сервисы Яндекса не работают», – рассказывает Анна, студентка из Москвы.
Вскоре после этого начали поступать сообщения о сбоях в работе поискового сервиса и платежной системы Яндекс Пэй, хотя в значительно меньшем объеме – около 180 и 400 обращений соответственно. Это говорит о том, что проблема затронула не все сервисы компании в равной степени.
Команда Yandex Cloud, облачного подразделения компании, оперативно отреагировала на ситуацию. Уже в 12:47 по московскому времени было начато расследование причин сбоя. К 13:06 специалисты установили, что зона ru-central1-b полностью вышла из строя из-за серьезных проблем с энергоснабжением. Чтобы предотвратить каскадный эффект и минимизировать потенциальный ущерб, инженеры Яндекса закрыли балансировку трафика в проблемную зону.
В 13:36 команда Yandex Cloud выпустила официальное заявление, в котором подтвердила, что авария связана с системой электропитания дата-центра. При этом технические специалисты продолжали выяснять конкретные причины отключения.
Ситуация оказалась серьезнее, чем предполагалось изначально. По состоянию на 14:42 проблемная зона оставалась полностью обесточенной. Энергоснабжение со стороны внешней подстанции отсутствовало полностью, что делало невозможным быстрое восстановление работы серверов. Представители Яндекса сообщили, что ведут переговоры с поставщиком электроэнергии и ожидают скорейшего возобновления подачи питания.
В сложившейся ситуации компания рекомендовала своим бизнес-клиентам, использующим облачные решения Yandex Cloud, срочно перенести рабочие нагрузки в другие доступные зоны. Команда поддержки была мобилизована для помощи в миграции managed-сервисов, чтобы минимизировать простои и потери данных.
Особенно тревожной оказалась информация о недоступности критически важных сервисов безопасности. Известный специалист по информационной безопасности Алексей Лукацкий сообщил, что авария затронула практически все сервисы, связанные с защитой данных и систем: Identity and Access Management, DDoS Protection, Key Management Service, Certificate Manager, AuditTrails, SmartCaptcha, Smart Web Security и Security Deck.
Луч надежды появился в 15:30, когда начались работы по восстановлению электропитания в пострадавшем дата-центре. Специалисты Яндекса представили поэтапный план возвращения системы в рабочее состояние:
- Восстановление базовой инфраструктуры;
- Возобновление работы сервиса Compute;
- Возврат зоны ru-central1-b под управление балансировщиков нагрузки NLB и ALB.
По оценкам технической команды, полное восстановление работоспособности должно было занять около часа после возобновления энергоснабжения.
Этот инцидент наглядно демонстрирует уязвимость даже самых крупных и технологически продвинутых IT-компаний перед лицом базовых инфраструктурных проблем. Несмотря на наличие резервных систем и распределенной архитектуры, сбой в энергоснабжении одного дата-центра привел к каскадному эффекту, затронувшему миллионы пользователей.
«Такие инциденты – серьезное напоминание о том, насколько важна надежная физическая инфраструктура для цифрового мира», – отмечает Михаил, IT-аналитик с десятилетним опытом работы в отрасли. «Облачные технологии дают огромные преимущества, но при этом создают и новые типы рисков, требующие комплексного подхода к обеспечению отказоустойчивости».
Для рядовых пользователей этот сбой стал напоминанием о том, насколько сильно современный человек зависит от цифровых сервисов. Многие не могли прослушать музыку, проверить маршрут или совершить платеж – действия, ставшие неотъемлемой частью повседневной жизни.
Этот случай, вероятно, заставит Яндекс пересмотреть свои стратегии резервирования и обеспечения непрерывности бизнеса. Возможно, в будущем компания усилит независимость своих дата-центров и введет дополнительные меры по минимизации влияния локальных аварий на глобальную работу сервисов.
Следите за обновлениями о работе сервисов Яндекса и других новостями технологического мира на нашем телеграм-канале Digital Report https://t.me/DigitalRep
- Первые обзоры Nintendo Switch 2 появились в сети: блогеры делятся впечатлениями - 05/04/2025 00:16
- Скончался Паша Техник: легенда андеграунда и противоречивая фигура российской рэп-сцены - 04/04/2025 22:26
- Nintendo экстренно откладывает предзаказы Switch 2 в США из-за пошлин Трампа - 04/04/2025 21:34