От мониторинга до лидерства: как обеспечивалась «Безаварийная cеть» на просторах от Урала до Дальнего Востока

Сегодня в гостях у ICT Magazine – Ольга САКАЕВА. Ее 9 лет работы в Центре управления сетями Huawei в Уфе – это история погружения в сердцевину российской телеком-инфраструктуры. Центр, закрывшийся в 2022 году, был не просто рабочим местом, а стратегическим хабом, отвечавшим за стабильность связи для миллионов людей и тысяч бизнесов в пяти гигантских федеральных округах. От Калининграда до Владивостока – мобильные сети, транспортные каналы, элементы фиксированной связи – все это проходило через мониторы и аналитический взгляд Ольги и ее коллег. Пройдя путь от инженера мониторинга до руководителя смены, Ольга не просто видела данные – она чувствовала пульс сети, предвидела сбои и находила решения под давлением. Ее рассказ – это взгляд изнутри на то, как обеспечивается надежность связи в масштабах, сравнимых с континентом, и почему такой опыт бесценен в современном мире.

Ольга САКАЕВА, инженер
– Ольга, Центр в Уфе, где вы работали, контролировал сети на невероятной территории – пяти федеральных округах. Не могли бы вы описать, что именно проходило через ваши мониторы? Какие операторы и типы сетей зависели от вашей работы?
– Знаете, когда я приходила на смену, особенно ночную, и видела эти бесконечные ряды экранов в полумраке зала – это всегда немного захватывало дух. Представьте себе карту России, растянутую от Северо-Запада до самого Дальнего Востока. Теперь наложите на нее паутину мобильных вышек, транспортных магистралей, узлов связи. Вот эта живая, постоянно пульсирующая цифровая кровеносная система страны – она была прямо перед нами. Основная наша забота – это, конечно, “воздух”. Сети сотовой связи, в основном Билайна, для которого Huawei была ключевым партнером по оборудованию в этих регионах. 2G, 3G, 4G, а позже и первые островки 5G – все это требовало постоянного внимания. Но не только. Через наши системы мы видели и здоровье транспортных сетей – тех самых “артерий”, что связывают города и регионы между собой, обеспечивая передачу данных. И даже элементы фиксированной связи, где они были интегрированы в общую инфраструктуру оператора. Для Билайна мы были чем-то вроде главного диспетчерского пункта: первыми видели проблему, первыми били тревогу, координировали “спасение” и анализировали, как не допустить повторения. Это была огромная ответственность – понимать, что от твоих действий здесь, в Уфе, зависит, сможет ли кто-то позвонить в Норильске или провести платеж в Калининграде.
– Территория необъятная, часовые пояса разные. Каково это – обеспечивать бесперебойность на таком “пятачке”? Какие вызовы запомнились больше всего?
– (Смеется) “Пятачок” – это точно про нас. Главный вызов, пожалуй, был в этом самом масштабе и его неоднородности. Представьте: пока на Дальнем Востоке глубокая ночь и сеть в относительном покое, в Сибири утро, начинается час пик, а на Урале уже вовсю кипит рабочий день. Проблема на одном конце этой цепи – скажем, перегрузка из-за какого-то события во Владивостоке – могла эхом отозваться по всей сети. Требовалось невероятное чувство ритма и слаженности смен. А еще – умение тонуть в потоке данных. Системы сыпали тысячами алертов и показателей. Надо было не просто заметить красную лампочку, а понять, что за ней стоит: мелкий глюк или начало лавины, способной обрушить связь в целом городе? И работа с разными “характерами” систем – Huawei M2000/U2000, Ericsson, Alcatel. Каждая со своей логикой, своими “причудами”. И за каждой – свои команды поддержки вендоров, с которыми надо было говорить на одном языке. Но самый сложный пазл – это координация. Когда случался серьезный сбой, наша задача была собрать воедино картину, понять, где именно “болит” (а это могло быть за тысячи километров!), и скоординировать действия местных инженеров “Билайна”, аварийных бригад подрядчиков, возможно, мчащихся по снегу или грязи, и специалистов самого вендора. Мы были тем самым “мозговым центром”, который должен был дать точный диагноз и четкий план лечения сети.
– Вы много говорите о мониторинге, но ключевым был и анализ для улучшений. Можете рассказать о каком-то конкретном случае, когда ваша работа привела к реальному улучшению для абонентов?
– О, таких случаев было много, но один особенно запомнился. Это был крупный промышленный город на Урале. Мы заметили на графиках KPI странный “горб” – аномально высокий процент сбоев при переключении абонента между сотами – хендоверах. Для пользователя это выливалось в противные обрывы звонков, особенно когда он двигался по городу. Абоненты звонили в поддержку, жаловались. Мы начали копать. Анализировали данные по минутам, смотрели карты покрытия, параметры соседних вышек. Выяснилось, что из-за плотной новой застройки в одном районе сложилась патовая ситуация: базовые станции “не видели” друг друга как надо, параметры срабатывания переключений были выставлены неоптимально для новых условий. Это как если бы светофоры на перекрестке работали по старым настройкам, не учитывая новый поток машин. Мы провели тонкую настройку этих параметров в системе управления, согласовали все изменения с нашими коллегами из “Билайна”. И знаете, результат был ощутимым: график “горба” пополз вниз. За пару недель сбои при хендоверах в том кластере упали примерно на 15%. Это не просто сухая цифра – это значит, что тысячи людей перестали сталкиваться с раздражающими обрывами, а нагрузка на службу поддержки оператора снизилась. Такая постоянная, кропотливая работа по “полировке” сети по результатам анализа KPI – это был наш ежедневный вклад в то самое “качество связи”, которое чувствует абонент.
– В 2019 году вы возглавили команду инженеров. Как изменился ваш мир? Что стало самым сложным в роли лидера, особенно когда горело?
– Переход на роль тимлида был, честно говоря, как выход в открытый космос. Раньше я могла глубоко погрузиться в одну сложную проблему, копаться в данных, искать корень. Теперь же фокус сместился. Я стала отвечать не только за свое понимание сети, но и за работу и результат всей команды из девяти человек. Моя задача – видеть общую картину на смене: куда направить усилия, как распределить инциденты, чтобы не перегрузить кого-то одного, убедиться, что ни одна серьезная тревога не упущена. Появилась куча “бумажной” (точнее, цифровой) работы: консолидация отчетов о работе сети и команды для руководства и оператора, анализ наших внутренних KPI – насколько быстро реагируем, насколько качественно разбираем причины. Но самое важное и самое сложное – это люди. Понимать сильные стороны каждого, помогать развиваться, давать обратную связь. И, конечно, кризисные моменты. Когда одновременно “горят” несколько серьезных инцидентов, телефон разрывается, чаты мелькают – вот тогда проверяется лидер. Нужно сохранять ледяное спокойствие (или его видимость!), быстро оценить масштаб каждой проблемы, понять, кого из инженеров на какую задачу бросить, как привлечь подрядчиков или вендоров, кому и какую информацию передать “наверх” оператору или своему руководству. Это как дирижировать очень нервным оркестром во время урагана. Главное – четкость, структура в голове и абсолютная ясность в коммуникации. Паника здесь – худший советчик.
– Как поддерживаете мотивацию команды и слаженную работу в напряженной обстановке?
– Для меня лидерство — это не только управление задачами, но и поддержка. Я всегда стараюсь быть доступной для каждого инженера, помогаю решать возникающие проблемы. Когда команда работает под давлением, важно, чтобы каждый чувствовал свою ценность. Я часто говорю: ‘Мы не просто решаем задачи, мы восстанавливаем стабильность для миллионов людей’. Это мотивирует и сплачивает.”
– Вы упомянули о внедрении автоматизации отчетов и превентивного анализа. Как родились эти идеи и что они дали на практике?
– Идеи эти выросли из рутины и боли. Помню, как мы тратили часы каждую смену на то, чтобы вручную собрать кучу данных из разных систем – M2000, U2000, других – и слепить из них вменяемые отчеты о состоянии сети, о проделанной работе. Это был адский труд, отнимавший силы, которые лучше бы потратить на реальные проблемы. Мне это просто резало душу. Я предложила: “Давайте попробуем это автоматизировать!”. Собрала команду, мы сели с коллегами, в том числе из смежных IT-отделов, и начали придумывать. Создали шаблоны в Excel, написали небольшие скрипты, которые научились сами вытягивать нужные цифры и показатели из систем и сводить их в понятные таблицы и графики. Результат превзошел ожидания: мы буквально вернули себе около 30% времени смены! Представьте – целая треть рабочего дня, которую раньше съедала рутина, теперь шла на что-то полезное: на более глубокий разбор сложного сбоя, на поиск скрытых проблем, на ту самую оптимизацию. Это был глоток воздуха.
Вторая идея – превентивный анализ – родилась из усталости от режима “пожарных”. Мы постоянно тушили возгорания. И я подумала: а что, если попытаться предвидеть, где может начаться пожар? Мы начали систематически копаться в исторических данных: смотреть не только на сегодняшние алерты, но и на тренды KPI и ошибок за недели и месяцы. Искать закономерности, слабые места. Например, заметили, что на оборудовании определенной модели в каком-то регионе постепенно, почти незаметно, растет количество мелких ошибок. Раньше бы махнули рукой – не критично.
Теперь мы били тревогу заранее: “Смотрите, здесь тренд негативный! Давайте проверим глубже, пока не грянуло по-крупному!”. Инициировали диагностику, замену модуля, обновление ПО – до того, как тысячи абонентов остались без связи. Эта смена парадигмы – с реактивной на упреждающую – дала осязаемый результат: количество серьезных, массовых сбоев на наших сетях стало снижаться. Год к году мы фиксировали уменьшение примерно на 10-15%. Это было прямым вкладом в нашу главную миссию – безаварийную работу сети.
– Обучение и наставничество – вы вкладывали в это много сил. Почему это было для вас важно?
– Телекоммуникации – это океан, который не стоит на месте. Новые технологии (вроде 5G), новое оборудование, обновления ПО – все это появляется постоянно. Чтобы наша команда оставалась на острие, чтобы мы могли эффективно решать задачи Центра, непрерывное обучение было не блажью, а вопросом выживания и качества. Я сама прошла путь от новичка, растерянно смотрящего на мигающие экраны, до тимлида. Я знала, как важны понятные ориентиры. Поэтому я много времени уделяла созданию внутренних “шпаргалок” – подробных инструкций по работе с разными системами, алгоритмам решения типовых, но сложных проблем, гайдов по взаимодействию с партнерами. Разрабатывала программы для новичков, чтобы они не тонули, а быстро вливались и начинали приносить пользу. Мы регулярно собирались на разборы полетов после крупных инцидентов – не для поиска виноватых, а чтобы понять и научиться. Это создавало атмосферу взаимопомощи и роста. Стандартизировались знания и подходы, инженеры начинали работать быстрее и увереннее, появлялись свои “звезды” – эксперты по конкретным системам или проблемам. Команда становилась не просто группой людей, а слаженным механизмом, где каждый понимал свою роль и мог поддержать другого. Это, пожалуй, одно из самых ценных достижений.
– Осознание масштаба – миллионы людей, бизнесы, целые города, зависящие от стабильности сети, которую вы контролируете… Как это чувство влияло на вас?
– Это чувство… Оно было всегда. Как фон. Иногда приглушенное рутиной, иногда обостряющееся до остроты во время крупных аварий или природных катаклизмов. Мы прекрасно понимали, что за сухими цифрами KPI и мигающими иконками на экране – реальная жизнь огромного региона. Что от стабильности нашей сети зависит:
- Связь людей: Возможность позвонить родителям, детям, друзьям; набрать 112 в экстренной ситуации.
- Работа бизнеса: Банкоматы, терминалы оплаты в магазинах, логистические цепочки, удаленная работа тысяч людей.
- Функционирование важных сервисов: Координация транспорта, работа систем безопасности (да, косвенно, но связь – их основа).
Фраза “безаварийная работа сети” из отчета KPI для нас была не абстракцией. Это был конкретный, осязаемый результат нашего труда, нашей дисциплины, нашей экспертизы и слаженности команды. Каждый предотвращенный сбой благодаря нашему превентивному анализу, каждый быстро устраненный инцидент, каждая успешная оптимизация – это был реальный вклад в то, чтобы жизнь в этих пяти огромных округах шла своим чередом, без неожиданных цифровых “провалов”. Это давало колоссальное чувство профессиональной гордости и огромной ответственности. Мы были не просто операторами, мы были стражами этой невидимой, но жизненно важной инфраструктуры.
– Ваша специализация уникальна: инженер связи на стыке телекома и IT, с фокусом на оптику и современные протоколы, да еще и с опытом управления в таких масштабах. Почему вы считаете, что этот опыт сейчас особенно востребован в мире?
– Мой опыт уникален комбинацией масштабности и глубины. Я умею работать с самыми сложными сетями и технологиями, от 2G до 5G, и владею знанием работы с разными системами управления. Лидерство под давлением — еще один важный аспект моего опыта, который позволяет эффективно управлять командами и предсказывать проблемы. В мире, где сети становятся всё более сложными, такой опыт крайне востребован.
Сегодня мир зависит от высоконадежных сетей: 5G, IoT, облачные сервисы, умные города, критическая инфраструктура. Страны, нуждаются в специалистах, которые не только устраняют сбои, но и предсказывают их, что позволяет немедленно приносить пользу в защите цифровой инфраструктуры.
– Ольга, благодарим вас за невероятно искренний и глубокий рассказ! Ваш опыт – настоящий клад для индустрии. Желаем вам воплотить ваши знания и энергию в новых глобальных вызовах!
– Спасибо большое! Было приятно поделиться.