Bytegen выполнил установку и настройку полного ПО-стека для команды ML-разработчиков. Проект включал подготовку среды на базе Linux, конфигурацию GPU-драйверов, установку библиотек и CI/CD для развёртывания моделей.
Небольшая исследовательская команда, занимающаяся распознаванием изображений и генерацией текста на базе GPT и Stable Diffusion. Требовалась быстрая подготовка рабочих станций и серверов с поддержкой GPU.
Задача
Развернуть полноценную AI-среду, включающую инструменты для обучения моделей, запуска инференса, визуализации и управления экспериментами. Обеспечить совместимость с существующими кодовыми репозиториями и облачной инфраструктурой.
Решение
- Установлена Ubuntu 22.04 LTS на сервер и две рабочие станции
- Настроены драйверы NVIDIA, CUDA 12 и cuDNN для RTX 3090
- Установлены и протестированы PyTorch, TensorFlow, OpenCV, HuggingFace Transformers
- Развёрнута среда разработки с JupyterLab, VS Code Remote и Docker-контейнерами
- Интеграция с MLflow для трекинга экспериментов и Prometheus для мониторинга GPU
Результат
- Команда начала обучение моделей в течение 1 дня после настройки
- Снижение времени на подготовку окружения — с 3–5 дней до 4 часов
- Настроено логирование и мониторинг нагрузки GPU
- Окружение масштабируемо на облачные инстансы (AWS, Yandex Cloud)