АО РТИ
Middle MLOps
- Спроектировал и развернул production-ready отказоустойчивую архитектуру для высоконагруженного инференса LLM на базе vLLM и Ollama.
- Выстроил MLOps-процессы: CI/CD пайплайны для доставки ML-моделей в Kubernetes (k3s), observability через Prometheus/Grafana.
- Внедрил RAG-систему на Qdrant/pgvector для семантического поиска и повышения точности ответов LLM.