АО РТИ
Middle MLOps
- VLLM ба Ollama дээрэ high-load LLM инференсэй production-ready архитектура зохёон байгуулба.
- MLOps процессуудые шэнээр байгуулба: Kubernetes (k3s) кластер руу ML-модель татаха CI/CD, Prometheus/Grafana харалга.
- Qdrant/pgvector дээрэ RAG-системэ нэбтэрүүлжэ, LLM харюунуудай нариишабари ехэдхэбэ.