Σεργκέι Τόβπεκο

Σεργκέι Τόβπεκο

Platform Engineer · MLOps · AI Infrastructure

Ο ειδικός σας σε

Platform & AI Infrastructure Engineer

Εμπειρία

4 έτη 5 μήνες

Обо мне

Platform / SRE engineer с глубокой экспертизой в автоматизации, observability и построении инфраструктуры для ML-нагрузок. Специализируюсь на развертывании высоконагруженного инференса локальных моделей (vLLM/Triton), оптимизации утилизации GPU и проектировании событийно-ориентированных RAG-систем. Обладаю редким продуктовым мышлением (Product-Minded): умею не просто настраивать инфраструктуру, но и самостоятельно разрабатывать внутренние инструменты автоматизации, CLI-утилиты и легковесные клиентские интерфейсы для мониторинга и управления системами под ключ.

Τεχνολογίες

AI Infrastructure & MLOps

vLLM Ollama CUDA optimization NVIDIA GPU Operator RAG pipelines pgvector Qdrant n8n

Platform & DevOps

Kubernetes (k3s) Docker GitLab CI Automated Delivery Pipelines Ansible Linux eBPF

Backend & Observability

Python (FastAPI) Go C# PostgreSQL ClickHouse Apache Airflow Prometheus Grafana VictoriaMetrics ELK Stack MinIO/S3

Internal Tooling & Client Interfaces

Kotlin (Jetpack Compose) Flutter (Dart) REST/WebSocket clients CLI utilities

Επαγγελματική εμπειρία

АО РТИ

Platform / DevOps-инженер

Апр 2025 – Апр 2026 · 1 год 1 месяц
  • Спроектировал и развернул высоконагруженный инференс LLM (Qwen) с использованием vLLM и Ollama, оптимизировал утилизацию GPU (CUDA) и добился скорости вывода 150+ токенов/сек на одном GPU.
  • Внедрил масштабируемый RAG-пайплайн с векторным поиском (pgvector, Qdrant) и событийно-ориентированной архитектурой на базе n8n и Supabase.
  • С нуля развернул и настроил кластер ClickHouse для сбора инфраструктурных метрик.
  • Автоматизировал доставку ML-моделей в Kubernetes (k3s) и настроил мониторинг метрик видеокарт (Prometheus + Grafana).
  • Разрабатывал внутренние кроссплатформенные клиентские приложения для мониторинга IoT-телеметрии и удаленной диагностики микрокомпьютеров.

Τεχνολογίες: vLLM, Ollama, Qwen, CUDA, Kubernetes/k3s, Docker, Prometheus, Grafana, ClickHouse, pgvector, Qdrant, n8n, Supabase, Python/FastAPI, Kotlin, Flutter

Сбер

DevOps / Automation Engineer

Фев 2024 – Апр 2025 · 1 год 3 месяца
  • Разработал инструментарий для нагрузочного тестирования: кастомные CLI-обертки и генераторы трафика на Go/Python.
  • Повышал стабильность систем под нагрузкой с помощью Chaos Engineering и стресс-тестов (k6, wrk).
  • Создал систему изолированного тестирования в Docker-средах с эмуляцией тяжелых внешних сервисов (Spark/Hadoop).
  • Переработал систему observability, внедрив бизнес-метрики и долгосрочное хранение в VictoriaMetrics и ClickHouse.

Τεχνολογίες: Go, Python, k6, wrk, Chaos Engineering, Docker, Ansible, Prometheus, VictoriaMetrics, Grafana, ClickHouse, ELK Stack, Spark, Hadoop

АО "Россети Цифра"

DevOps / Data Platform Engineer

Июл 2023 – Фев 2024 · 8 месяцев
  • Проектировал и поддерживал отказоустойчивую платформу автоматизации процессов на базе Apache Airflow, оптимизировал структуру DAG-ов.
  • Внедрил комплексную систему централизованного логирования и трассировки на базе ELK Stack, сократив среднее время восстановления системы (MTTR).
  • Провел контейнеризацию компонентов системы, стандартизировал окружения dev/prod через Docker.
  • Администрировал распределенные хранилища данных (PostgreSQL, MariaDB, MinIO/S3) и занимался тюнингом их производительности.

Τεχνολογίες: Python, Apache Airflow, PostgreSQL, MariaDB, MinIO/S3, Docker, ELK Stack, Grafana, Linux

Франклинс Бургер

Fullstack Developer / Automation Engineer

Дек 2022 – Апр 2024 · 1 год 5 месяцев
  • С нуля построил автоматизированную инфраструктуру доставки обновлений программного обеспечения на конечные точки в Yandex Cloud (Docker, Ansible).
  • Спроектировал и внедрил распределенную шину данных для централизованного управления конфигурациями точек и рекламой.
  • Разрабатывал серверные модули интеграции с POS-системами (IIKO) на C#/.NET и Python (FastAPI).
  • Проектировал и запускал внутренние веб-инструменты автоматизации бизнеса, CRM-системы и HR-ботов.

Τεχνολογίες: Python/FastAPI, C#, .NET, PostgreSQL, Docker, Ansible, Yandex Cloud, IIKO SDK, JavaScript, Vue.js, Svelte

Platform / MLOps Projects

High-Performance ML Inference Serving

vLLM/Ollama inference platform

  • Стенд локального деплоя LLM (Qwen/Llama) на базе vLLM/Ollama с production-like контейнеризацией.
  • Настроил автоматическое масштабирование, контроль throughput/latency и мониторинг CUDA-ядер через Prometheus и Grafana.
  • Подготовил Python tooling для smoke-тестов, health checks и эксплуатационной диагностики инференса.

Τεχνολογίες: vLLM, Docker, CUDA, Prometheus, Grafana, Python

AI-Driven Enterprise Automation Core

Agent workflows and RAG automation

  • Настроенный комплекс оркестрации агентных воркфлоу, интегрированный с векторными базами данных для контекстного поиска (RAG).
  • Связал n8n workflows, FastAPI-сервисы и Supabase в событийно-ориентированный контур корпоративной автоматизации.
  • Добавил векторное хранение, retrieval и контроль контекста для внутренних knowledge workflows.

Τεχνολογίες: n8n, pgvector, Qdrant, FastAPI, Supabase

Multi-Platform CI/CD Automation Framework

Universal delivery automation template

  • Универсальный шаблон автоматизации доставки ПО для сокращения релизных циклов и стабилизации сборок.
  • Включает контейнеризацию, автоматическое подписание артефактов, сбор release notes и интеграцию систем crash reporting.
  • Поддерживает повторяемые окружения, quality gates и быстрые rollback-сценарии для внутренних продуктов.

Τεχνολογίες: GitLab CI, Fastlane, Docker, Ansible, Gradle