Основні обов’язки
- Перенос моделей з експериментального середовища в промислову експлуатацію через мікросервісну архітектуру
- Робота з хмарними API (OpenAI, Gemini) та open-source рішеннями, включаючи налаштування та оптимізацію запитів
- Розробка повного циклу RAG — від створення embeddings до налаштування стратегій пошуку в векторних базах (Pinecone, Qdrant)
- Створення ETL/ELT-пайплайнів для обробки та підготовки даних для навчання та інференсу
- Тісна співпраця з backend-командою для інтеграції моделей через FastAPI або Flask
- Зниження часу відповіді системи та витрат на обробку токенів, підвищення пропускної здатності
- Реалізація автоматизованих систем тестування та бенчмарків для оцінки якості моделей і промптів
Вимоги
- Від 2,5 років досвіду в ML Engineering, Data Science або NLP
- Досвід впровадження ML-рішень у промислову експлуатацію
- Глибоке володіння Python, включаючи pandas, numpy, scikit-learn, pydantic
- Практичні навички роботи з OpenAI, Anthropic, HuggingFace та техніками Prompt Engineering
- Досвід із векторними базами даних: Pinecone, Qdrant або Weaviate
- Навички роботи з Docker, базове розуміння Kubernetes та CI/CD
- Розуміння метрик оцінки якості моделей: precision, recall, ROC, а також фреймворків для оцінки LLM
Буде перевагою
- Досвід із LangChain або LlamaIndex
- Знання методів оптимізації моделей: квантування, дистилляція, групування запитів
- Робота з GPU та хмарними платформами: AWS, GCP, Azure
- Розуміння принципів побудови високонавантажених систем
Чому це цікаво
- Можливість проектувати архітектуру з нуля — ваші рішення формуватимуть основу продукту
- Швидкий кар’єрний розвиток — прямий шлях до позицій Lead ML Engineer або AI Architect
- Пряма взаємодія з технічною командою та фаундерами
- Повністю віддалений формат роботи без географічних обмежень

