Skip to main content

ML Platform

ML Platform — AI-продукт, предоставляющий инфраструктуру для обучения, развёртывания и мониторинга моделей классического машинного обучения.


Назначение

ML Platform решает задачу стандартизации процесса работы с ML-моделями. Вместо того чтобы каждая команда строила свою инфраструктуру, организация предоставляет единую платформу.

Платформенная команда поддерживает инфраструктуру, data scientists строят модели поверх неё.


Компоненты платформы

Типовая ML Platform включает следующие компоненты:

  • Feature Store — централизованное хранилище и управление признаками
  • Experiment Tracking — отслеживание экспериментов (MLflow, Weights & Biases)
  • Model Registry — реестр версий моделей с метаданными
  • Training Pipelines — автоматизированные пайплайны обучения
  • Serving Infrastructure — инфраструктура для inference (batch и real-time)
  • Monitoring — мониторинг дрейфа данных, деградации качества, аномалий

Сценарии использования

ML Platform обслуживает следующие классы задач:

  • Скоринговые модели — кредитный скоринг, оценка риска, скоринг клиентов
  • Прогнозирование — прогноз спроса, финансовое прогнозирование, forecasting
  • Обнаружение аномалий — fraud detection, мониторинг транзакций
  • Рекомендательные системы — персонализация предложений, next best action
  • Классификация — категоризация документов, заявок, обращений

Ключевые принципы

ML Platform строится на следующих принципах:

  • Воспроизводимость — любой эксперимент можно воспроизвести; фиксируются данные, код, параметры
  • Версионирование — модели, данные и конфигурации версионируются
  • Автоматическое переобучение — модели переобучаются по расписанию или при деградации качества
  • Мониторинг — непрерывный контроль качества моделей в production
  • Стандартизация — единый процесс от эксперимента до деплоя

Модель поставки

ML Platform — это платформенный продукт с чётким разделением ответственности:

РольОтветственность
Platform TeamИнфраструктура, инструменты, CI/CD для моделей
Data ScientistsРазработка и обучение моделей
ML EngineersПродуктивизация, оптимизация inference
Data EngineersПодготовка данных, feature pipelines

Мониторинг моделей

Мониторинг в production включает:

  • Data drift — изменение распределения входных данных
  • Model drift — деградация качества предсказаний
  • Performance — латентность, throughput, error rate
  • Business metrics — влияние модели на бизнес-метрики

При обнаружении деградации запускается процесс переобучения или отката на предыдущую версию.


Связанные разделы

Model Risk Management