Platform & AI Infrastructure Engineer
Опыт
4 года 5 месяцев
Обо мне
Platform / SRE engineer с глубокой экспертизой в автоматизации, observability и построении инфраструктуры для ML-нагрузок. Специализируюсь на развертывании высоконагруженного инференса локальных моделей (vLLM/Triton), оптимизации утилизации GPU и проектировании событийно-ориентированных RAG-систем. Обладаю редким продуктовым мышлением (Product-Minded): умею не просто настраивать инфраструктуру, но и самостоятельно разрабатывать внутренние инструменты автоматизации, CLI-утилиты и легковесные клиентские интерфейсы для мониторинга и управления системами под ключ.
Технологии
Platform & DevOps
Backend & Observability
Internal Tooling & Client Interfaces
Опыт работы
АО РТИ
Platform / DevOps-инженер
- Спроектировал и развернул высоконагруженный инференс LLM (Qwen) с использованием vLLM и Ollama, оптимизировал утилизацию GPU (CUDA) и добился скорости вывода 150+ токенов/сек на одном GPU.
- Внедрил масштабируемый RAG-пайплайн с векторным поиском (pgvector, Qdrant) и событийно-ориентированной архитектурой на базе n8n и Supabase.
- С нуля развернул и настроил кластер ClickHouse для сбора инфраструктурных метрик.
- Автоматизировал доставку ML-моделей в Kubernetes (k3s) и настроил мониторинг метрик видеокарт (Prometheus + Grafana).
- Разрабатывал внутренние кроссплатформенные клиентские приложения для мониторинга IoT-телеметрии и удаленной диагностики микрокомпьютеров.
Технологии: vLLM, Ollama, Qwen, CUDA, Kubernetes/k3s, Docker, Prometheus, Grafana, ClickHouse, pgvector, Qdrant, n8n, Supabase, Python/FastAPI, Kotlin, Flutter
Сбер
DevOps / Automation Engineer
- Разработал инструментарий для нагрузочного тестирования: кастомные CLI-обертки и генераторы трафика на Go/Python.
- Повышал стабильность систем под нагрузкой с помощью Chaos Engineering и стресс-тестов (k6, wrk).
- Создал систему изолированного тестирования в Docker-средах с эмуляцией тяжелых внешних сервисов (Spark/Hadoop).
- Переработал систему observability, внедрив бизнес-метрики и долгосрочное хранение в VictoriaMetrics и ClickHouse.
Технологии: Go, Python, k6, wrk, Chaos Engineering, Docker, Ansible, Prometheus, VictoriaMetrics, Grafana, ClickHouse, ELK Stack, Spark, Hadoop
АО "Россети Цифра"
DevOps / Data Platform Engineer
- Проектировал и поддерживал отказоустойчивую платформу автоматизации процессов на базе Apache Airflow, оптимизировал структуру DAG-ов.
- Внедрил комплексную систему централизованного логирования и трассировки на базе ELK Stack, сократив среднее время восстановления системы (MTTR).
- Провел контейнеризацию компонентов системы, стандартизировал окружения dev/prod через Docker.
- Администрировал распределенные хранилища данных (PostgreSQL, MariaDB, MinIO/S3) и занимался тюнингом их производительности.
Технологии: Python, Apache Airflow, PostgreSQL, MariaDB, MinIO/S3, Docker, ELK Stack, Grafana, Linux
Франклинс Бургер
Fullstack Developer / Automation Engineer
- С нуля построил автоматизированную инфраструктуру доставки обновлений программного обеспечения на конечные точки в Yandex Cloud (Docker, Ansible).
- Спроектировал и внедрил распределенную шину данных для централизованного управления конфигурациями точек и рекламой.
- Разрабатывал серверные модули интеграции с POS-системами (IIKO) на C#/.NET и Python (FastAPI).
- Проектировал и запускал внутренние веб-инструменты автоматизации бизнеса, CRM-системы и HR-ботов.
Технологии: Python/FastAPI, C#, .NET, PostgreSQL, Docker, Ansible, Yandex Cloud, IIKO SDK, JavaScript, Vue.js, Svelte
Platform / MLOps проекты
High-Performance ML Inference Serving
vLLM/Ollama inference platform
- Стенд локального деплоя LLM (Qwen/Llama) на базе vLLM/Ollama с production-like контейнеризацией.
- Настроил автоматическое масштабирование, контроль throughput/latency и мониторинг CUDA-ядер через Prometheus и Grafana.
- Подготовил Python tooling для smoke-тестов, health checks и эксплуатационной диагностики инференса.
Технологии: vLLM, Docker, CUDA, Prometheus, Grafana, Python
AI-Driven Enterprise Automation Core
Agent workflows and RAG automation
- Настроенный комплекс оркестрации агентных воркфлоу, интегрированный с векторными базами данных для контекстного поиска (RAG).
- Связал n8n workflows, FastAPI-сервисы и Supabase в событийно-ориентированный контур корпоративной автоматизации.
- Добавил векторное хранение, retrieval и контроль контекста для внутренних knowledge workflows.
Технологии: n8n, pgvector, Qdrant, FastAPI, Supabase
Multi-Platform CI/CD Automation Framework
Universal delivery automation template
- Универсальный шаблон автоматизации доставки ПО для сокращения релизных циклов и стабилизации сборок.
- Включает контейнеризацию, автоматическое подписание артефактов, сбор release notes и интеграцию систем crash reporting.
- Поддерживает повторяемые окружения, quality gates и быстрые rollback-сценарии для внутренних продуктов.
Технологии: GitLab CI, Fastlane, Docker, Ansible, Gradle