Machine Learning Service (Python)

Назначение

Модуль машинного обучения для анализа клиентских отзывов:

  • Кластеризация текстов (выделение тем: кредитные карты, вклады, мобильное приложение и т.д.).

  • Мультилейбл классификация по темам.

  • Определение тональности (положительно / нейтрально / отрицательно).

API

  • POST /predict

    {"data":[{"id":1,"text":"Карта понравилась, но приложение лагает"}]}

Ответ:

{"predictions":[{"id":1,"topics":["Кредитная карта","Мобильное приложение"],"sentiments":["положительно","отрицательно"]}]}

Сборка и запуск контейнера

docker compose up -d --build

ML/NLP стек:

  • NumPy, Pandas, SciPy — обработка данных

  • scikit-learn — классические ML-алгоритмы

  • PyTorch — обучение и инференс моделей

  • BERTopic + HDBSCAN — тематическое моделирование

  • NLTK, pymorphy2 — NLP-утилиты для русского языка

Сервисный стек:

  • FastAPI + Uvicorn — REST API

  • Pydantic — валидация и схемы данных

  • MLflow — управление экспериментами и моделями

Последнее обновление