Опис вакансії
Національний банк України – сучасна незалежна державна інституція, покликана забезпечувати цінову та фінансову стабільність у державі та сприяти економічному зростанню України.
Ми інтегруємося до міжнародної спільноти центральних банків, створюємо для цього ефективну і стійку фінансову екосистему, сприяємо розвитку інноваційних фінансових технологій, підвищенню фінансової обізнаності та інклюзії громадян.
Ми – сучасний центральний банк, що має довіру суспільства, діє для добробуту громадян і держави.
Функціональні завдання:- Аналіз та вибір open-source LLM-моделей під specific use cases банку: document processing, Q&A, аналіз транзакцій;
- Model optimization: quantization (GPTQ, AWQ, GGUF), pruning, distillation для зменшення розміру моделі та зростання швидкості на обмеженій GPU-інфраструктурі;
- Fine-tuning моделей на власних даних банку: LoRA, QLoRA, PEFT з урахуванням data privacy та регуляторних обмежень;
- Налаштування inference-серверів: vLLM, Triton Inference Server, llama.cpp - оптимізація throughput та latency;
- Розробка та підтримка evaluation pipelines: метрики якості моделі (BLEU, ROUGE, custom business metrics);
- Розробка промптів та RAG-архітектура (Retrieval-Augmented Generation) для інтеграції зі внутрішніми knowledge bases банку:
- Документування моделей: model cards, performance benchmarks, versioning;
- Координація з DevOps для забезпечення production-готовності моделей і інфраструктури.
Ми пропонуємо:
- Можливість для професійного розвитку в стабільній та прозорій організації;
- Можливість бути дотичним до розвитку країни;
- Ринковий рівень оплати праці, премії на основі оцінювання результатів роботи (KPI);
- Програми навчання;
- Недержавне корпоративне пенсійне страхування;
- Комфортні умови праці та гнучкий графік роботи;
- Колектив однодумців.
Наші очікування від кандидата:
- Вища освіта;
- Досвід роботи від 4 років;
- Рівень англійської мови не нижче А2;
- 3+ років досвіту в Machine Learning / Deep Learning з акцентом на NLP;
- Глибокий досвід з Python, PyTorch або TensorFlow;
- Знання LLM-архітектур: Transformer, attention mechanisms, tokenization;
- Досвід з fine-tuning і адаптацією моделей: LoRA, QLoRA, PEFT;
- Розуміння model quantization та optimization технік (GPTQ, AWQ, INT8);
- Досвід з open-source моделями: Llama, Mistral, GPT-2/Neo або аналогічними;
- Знання контейнеризації: Docker/Kubernetes;
- Розуміння RAG-архітектури та vector databases (pgvector, Milvus, Qdrant).
Бажані навички:
- Досвід з NVIDIA TensorRT та оптимізацією моделей під GPU;
- Знання Hugging Face ecosystem (transformers, datasets, PEFT);
- Досвід з MLOps: MLflow, Weights & Biases, або аналогічними;
- Розуміння банківських процесів та регуляторних вимог до AI (EU AI Act, guideline НБУ);
- Досвід з data pipelines та ETL для підготовки training data.
*В разі рівних умов щодо відповідності досвіду, кваліфікації, знань та навичок, благонадійності та безпечності кандидата, під час прийняття рішення щодо відбору кандидатів на вакантні посади, перевага надається:- ветеранам війни в Україні;
- особам з інвалідністю;
- іншим категоріям кандидатів, якщо це передбачено законодавством України.