АО РТИ
Middle MLOps
- Спроєктував і розгорнув production-ready відмовостійку архітектуру для високонавантаженого інференсу LLM на базі vLLM та Ollama.
- Вибудував MLOps-процеси: CI/CD пайплайни для доставки ML-моделей у Kubernetes (k3s), observability через Prometheus/Grafana.
- Впровадив RAG-систему на Qdrant/pgvector для семантичного пошуку та підвищення точності відповідей LLM.