VIDEOCHAT  ::   FAQ  ::   Поиск  ::   Регистрация  ::   Вход

Сначала AWS, через неделю - MS Azure, потом CloudFlare

Информация о разработках, технологиях, VoIP клиентах, серверах, библиотеках и всему что связано с темой форума

Модераторы: ded, april22, Zavr2008

Ответить
ded
Сообщения: 15713
Зарегистрирован: 26 авг 2010, 19:00

Сначала AWS, через неделю - MS Azure, потом CloudFlare

Сообщение ded »

Облачная платформа Azure столкнулась с серьезными проблемами всего за несколько часов до публикации квартального финансового отчета Microsoft. Сбой затронул не только игровые сервисы компании, но и критически важную инфраструктуру по всему миру.

Проблемы начались примерно в 16:00 UTC, когда пользователи и сервисы Microsoft, использующие Azure Front Door, столкнулись с задержками, таймаутами и ошибками. Первыми на проблему обратили внимание разработчики из Obsidian, сообщившие, что The Outer Worlds 2 может быть временно недоступна на платформах Xbox из-за продолжающегося сбоя Azure. Веб-сайт Minecraft также столкнулся с перебоями в работе, демонстрируя крайне низкую скорость загрузки.

Впрочем, масштаб проблемы оказался значительно серьезнее, чем просто невозможность скачать игру из цифрового магазина. Согласно данным MSNBC, Azure контролирует 23% рынка облачной инфраструктуры, уступая только AWS с ее 32%. Это делает сбой критической проблемой для бизнеса по всему миру. Среди пострадавших оказался лондонский аэропорт Хитроу и крупнейший банковский холдинг NatWest.

На официальной странице Azure Microsoft подтвердила, что причиной стало "непреднамеренное изменение конфигурации". Компания отметила, что принимает несколько параллельных мер: во-первых, блокирует все изменения в сервисах AFD, включая пользовательские настройки конфигурации. Одновременно с этим команда откатывает конфигурацию AFD к последнему стабильному состоянию, стараясь предотвратить повторное появление проблемной конфигурации после восстановления.

В своем заявлении Microsoft уточнила, что "изменение конфигурации части инфраструктуры Azure" считается виновником инцидента. Ситуация напоминает недавний масштабный сбой AWS, который также произошел из-за ошибки в программном обеспечении. Компания работает над несколькими стратегиями устранения проблемы, включая перенаправление трафика от затронутой инфраструктуры и блокировку проблемного изменения.

Этот инцидент в очередной раз демонстрирует уязвимость современной цифровой инфраструктуры, когда значительная часть интернет-сервисов и бизнес-приложений зависит от нескольких крупных облачных платформ.

https://shazoo.ru/2025/10/30/174905/spu ... vsemu-miru

29 октября 2025 года в 16:00 UTC в платформе Microsoft Azure произошел глобальный сбой, который повлек за собой недоступность сервиса в течение 3-4 часов. Инцидент повлиял на Azure Portal, Microsoft 365, Xbox Live и многие другие приложения. Это второй крупный сбой Azure Front Door в октябре 2025 года.

Что такое Azure Front Door?
Azure Front Door (AFD) - это глобальная сеть уровня Layer-7, обеспечивающая критически важные функции для всей экосистемы Microsoft Cloud: TLS-терминацию для защищенных соединений, глобальную балансировку нагрузки между регионами, интеграцию Web Application Firewall для защиты от атак, маршрутизацию запросов для миллионов клиентских приложений, функциональность CDN для оптимизации доставки контента. AFD развернута в сотнях точек присутствия (Points of Presence) по всему миру и служит единой точкой входа для большинства сервисов Microsoft.

Что именно произошло?
Microsoft официально подтвердила, что первопричиной инцидента стало непреднамеренное изменение конфигурации Azure Front Door.

Ошибочная конфигурация запустила цепную реакцию сбоев на нескольких уровнях инфраструктуры.

DNS-слой: конфигурационная ошибка вызвала масштабные сбои DNS resolution. Запросы к эндпоинтам Azure начали возвращать таймауты или некорректные ответы.

Routing и TLS: ошибка маршрутизации привела к потере capacity на edge-узлах. TLS handshakes перестали работать на границе сети, генерируя HTTP 502/504 ошибки даже при работоспособных backend-сервисах.

Аутентификация: критичная зависимость Microsoft Entra ID (бывший Azure AD) от AFD привела к тому, что эндпоинты аутентификации стали недостижимы. Это заблокировало выдачу и валидацию токенов, что каскадно повлияло на все зависимые от аутентификации сервисы.

Ключевая архитектурная уязвимость заключалась в том, что централизованная edge-инфраструктура (AFD) в сочетании с централизованным провайдером идентификации (Entra ID) создали единую точку отказа (Single Point of Failure, SPOF) для всей экосистемы Microsoft Cloud. Когда конфигурационные изменения были применены глобально к AFD без staged rollout (поэтапного развертывания), ошибка распространилась на все географические регионы в течение нескольких минут.

https://habr.com/ru/articles/961432/
ded
Сообщения: 15713
Зарегистрирован: 26 авг 2010, 19:00

Re: Сначала AWS, через неделю - MS Azure

Сообщение ded »

А вчера и ещё один монстр - CloudFlare!

В американской компании Cloudflare (предоставляет услуги CDN, защиты от DDoS-атак и безопасный доступ к ресурсам и серверам DNS) раскрыли причину почти пятичасового глобального сбоя в работе своих сервисов. Проблема не в DNS, и не было внешней атаки. Оказалось, что это была ошибка в файле конфигурации системы защиты от ботов, который перед началом инцидента был обновлён инженерами Cloudflare в плановом порядке.

Технический директор Cloudflare Дэн Кнехт пояснил, что сервис «подвёл» своих клиентов и весь Интернет, добавив, что «скрытая ошибка в сервисе, лежащем в основе нашей возможности противодействия ботам, начала давать сбои после внесения нами планового изменения конфигурации... Это не было атакой».

После планового изменения конфигурации возникла скрытая ошибка в сервисе, лежащем в основе системы противодействия ботам, который начал давать сбои. В пресс-службе компании добавили, что сбой возник из-за того, что размер файла конфигурации превысил ожидаемый. Именно эта ситуация привела к сбою в работе программного обеспечения, обрабатывающего трафик ряда сервисов Cloudflare, а также к масштабному ухудшению работы клиентской сети и других сервисов компании.

«Настоящим виновником было обновление прав доступа к базе данных ClickHouse. Это небольшое изменение привело к неожиданному удвоению размера файла функции управления ботами. Этот файл отправляется по глобальной сети Cloudflare каждые несколько минут. Когда системы получили версию с увеличенным размером, строгий внутренний лимит внутри основного прокси‑сервера спровоцировал панику. Эта паника и привела к масштабному шторму 5xx, который наблюдали клиенты», — рассказали в Cloudflare в postmortem по этому инциденту.

https://habr.com/ru/news/967836/
Вложения
295ffdbbf7f1424884dd96b912da823b.png
1763478316948.jpeg
1763478316948.jpeg (47.87 КБ) 195 просмотров
Аватара пользователя
Zavr2008
Сообщения: 2266
Зарегистрирован: 27 янв 2011, 00:35
Контактная информация:

Re: Сначала AWS, через неделю - MS Azure, потом CloudFlare

Сообщение Zavr2008 »

Дальше 3CX?))
Российские E1 шлюзы Alvis. Модернизация УПАТС с E1, настройка Asterisk/FreePBX, подключение CRM
Ответить
© 2008 — 2025 Asterisk.ru
Digium, Asterisk and AsteriskNOW are registered trademarks of Digium, Inc.
Design and development by PostMet-Netzwerk GmbH