Руководство по модернизации серверов в финансовой отрасли


Время публикации:

2021-11-12

Обновление серверов в финансовой отрасли должно учитывать повышение производительности, стабильность системы, безопасность данных и требования к соблюдению нормативных требований, а также обеспечивать возможность масштабирования в связи с ростом бизнеса. Ниже представлен анализ с учетом четырех аспектов: необходимости обновления, основных решений, этапов реализации и важных моментов, на которые следует обратить внимание.

- Развернуть инструменты мониторинга (например, Prometheus + Grafana) для оперативного оповещения об аномалиях.

 

1. Необходимость модернизации

1. Производственная узкая точка

Финансовые операции (такие как высокочастотная торговля, анализ больших данных) чрезвычайно требовательны к вычислительной мощности серверов, объёму памяти и скорости хранения. Устаревшие серверы (например, устройства старше 5 лет) из-за износа оборудования могут вызывать задержки обработки, что ухудшает пользовательский опыт.

 

2. Риски безопасности

Старые системы легко становятся мишенью кибератак и, возможно, не поддерживают новейшие протоколы безопасности (например, TLS 1.3). Обновление позволит усилить шифрование данных, контроль доступа и возможности аварийного восстановления.

 

3. Требования к соблюдению

Финансовая отрасль подлежит строгому регулированию (например, стандарты информационной безопасности 2.0, GDPR) и должна регулярно обновлять системы для соблюдения требований к защите данных, аудиторскому отслеживанию и другим аспектам.

 

4. Потребности в расширении бизнеса

Распределённая архитектура и модернизация с использованием микросервисов требуют поддержки серверами контейнеризации (например, Kubernetes) и инструментов автоматизированной эксплуатации, тогда как устаревшее оборудование трудно адаптировать.

 

2. Основное решение для модернизации

Вариант 1: Апгрейд оборудования

- Сценарии применения: недостаточная производительность сервера при совместимой архитектуре.

- Основные моменты работы:

- Процессор: обновление до многоядерного CPU (например, серии Intel Xeon Scalable) для повышения возможностей параллельной обработки.

- Память: увеличение объёма памяти DDR4/DDR5, оптимизация эффективности кэширования базы данных.

- Хранение: замена HDD на SSD или развертывание NVMe SSD для снижения задержки ввода-вывода.

- Сеть: обновление до сетевых карт 10G/25G, поддерживающих сценарии торговли с низкой задержкой.

- Пример: один банк сократил время отклика транзакций в своей основной системе на 40%, перейдя на хранение данных с использованием NVMe SSD.

 

Вариант 2: Оптимизация программного обеспечения

- Применяемая ситуация: аппаратные ресурсы достаточны, но система работает неэффективно.

- Основные моменты работы:

- Операционная система: обновитесь до последней стабильной версии (например, RHEL 8/CentOS 8) для устранения уязвимостей безопасности.

- База данных: настройте параметры (например, размер пула буферов, количество соединений в пул), используйте разделённые таблицы для оптимизации запросов.

- Middleware: замена устаревших прикладных серверов (например, WebLogic 10g → 14c), поддержка протокола HTTP/2.

- Пример: некая брокерская компания за счёт оптимизации параметров базы данных сократила время итогового расчёта с 2 часов до 40 минут.

 

Вариант 3: Архитектурная реорганизация

- Применяемые сценарии: бизнес, требующий поддержки высокой параллельности и эластичного масштабирования.

- Основные моменты работы:

- Распределённая архитектура: использует микросервисный дизайн, разделяя монолитное приложение на независимые сервисы (например, сервисы учетных записей и транзакций).

- Контейнерная развертка: использование Docker + Kubernetes для динамической распределения ресурсов и повышения их эффективности.

- Гибридная облачная архитектура: перенос некорпоративных бизнес-процессов (например, маркетинговой системы) в публичное облако для снижения совокупной стоимости владения.

- Пример: крупный банк за счёт модернизации на основе микросервисов повысил доступность системы с 99,9% до 99,99%.

 

Вариант 4: Расширение виртуализованного ресурсного пула

- Сценарии применения: необходимость быстрого расширения вычислительных ресурсов с учётом затрат.

- Основные моменты работы:

- Новый кластер: развертывание гиперконвергентной архитектуры (например, SmartX) с возможностью плавного обновления за счет миграции между кластерами.

- Постепенная модернизация: замена серверов по одному, повторное использование существующей сетевой конфигурации для минимизации перерывов в работе.

- Обработка совместимости: используйте инструменты миграции (например, CNware) для решения проблем совместимости виртуальных машин между различными архитектурами процессоров.

- Пример: некая фьючерсная компания за неделю заменила 8 серверов путём постепенного обновления, при этом бизнес остался без перерывов.

 

3. Порядок реализации

1. Анализ потребностей и планирование

– Оценка текущих системных узких мест (например, использование CPU, загрузка памяти).

- Разработка графика модернизации, бюджета и распределения обязанностей персонала.

 

2. Резервное копирование и проверка данных

– Создайте резервную копию важных данных на внешнем носителе или в облачной платформе.

– Проверка целостности и восстановимости резервных данных.

 

3. Поэтапное обновление

- Пилотный этап: проверка решения обновления в тестовой среде и устранение проблем совместимости.

- Этап внедрения: поэтапное обновление серверов в производственной среде с контролем показателей производительности (например, объема транзакций, уровня ошибок).

 

4. Тестирование и оптимизация

– Провести стресс-тестирование, имитируя пиковые сценарии транзакций.

– Корректировка параметров на основе результатов тестирования (например, размера пула подключений к базе данных).

 

5. Запуск и эксплуатация

- Разработать аварийный план и подготовить вариант отката.

- Развернуть инструменты мониторинга (например, Prometheus + Grafana) для оперативного оповещения об异常ностях.

 

4. Меры предосторожности

1. Проверка совместимости

– Убедитесь, что новое серверное оборудование (архитектура процессора, тип памяти) совместимо с виртуализационной платформой.

- Обновляйте прошивку (например, BIOS, карты RAID) и драйверы, чтобы избежать проблем с производительностью.

 

2. Соответствие и безопасность

- После обновления повторно пройдите оценку соответствия, чтобы убедиться в соблюдении нормативных требований.

- Усиленный доступ

Соответствующая информация