Middle Data Scientist
Ми шукаємо кваліфікованого та досвідченого Data Scientist для приєднання до нашої команди. На цій позиції ви будете відповідати за проведення експериментів із наборами даних з метою пошуку корисних інсайтів і ознак, підтримку data pipelines, навчання алгоритмів машинного навчання та візуалізацію результатів.
Основні цілі та обов’язки
- Бути проактивним командним гравцем;
- Співпрацювати з командою над впровадженням нових функціональностей для підтримки зростаючих потреб у роботі з даними;
- Створювати, підтримувати та впроваджувати DS- і ML-пайплайни, включно з отриманням даних, попередньою обробкою, feature engineering, навчанням та інференсом моделей, аналізом і візуалізацією результатів;
- Створювати, підтримувати та впроваджувати системи на базі LLM і агентні пайплайни, включно з prompt engineering, інтеграцією інструментів та API, управлінням пам’яттю й контекстом, оркестрацією інференсу та оцінюванням результатів моделей;
- Ділитися знаннями з іншими командами щодо різних тем, пов’язаних із Data Science або проєктом;
- Співпрацювати з командою у виборі інструментів і стратегій для конкретних сценаріїв.
Обов’язкові вимоги
- Рівень англійської мови — Upper-Intermediate+;
- Хороша математична та статистична база, знання тензорного числення;
- Хороше знання баз даних, таких як Postgres, MongoDB, а також SQL;
- Знання Python та практичний досвід роботи з бібліотеками Scikit-learn, NumPy, Pandas і Matplotlib;
- Досвід роботи з алгоритмами градієнтного бустингу, зокрема XGBoost або LightGBM;
- Знайомство з інструментами оркестрації LLM, наприклад LangChain, LangGraph;
- Досвід використання або інтеграції з cloud LLM API, наприклад OpenAI, Claude, Amazon Bedrock, Vertex AI;
- Практичний досвід роботи з Retrieval-Augmented Generation-пайплайнами та векторними базами даних, наприклад pgvector, FAISS, Weaviate, Pinecone;
- Практичний досвід із техніками prompt engineering, агентними інструментами та workflow;
- Знання щонайменше одного фреймворку для побудови та навчання нейронних мереж — TensorFlow/Keras або PyTorch, а також хороше розуміння архітектур нейронних мереж і підходів до роботи з ними;
- Комерційний досвід із класичним машинним навчанням і deep learning, включно з NLP- та CV-моделями, такими як BERT, ResNet;
- Практичні навички побудови end-to-end ML training pipelines: завантаження даних, preprocessing, навчання, inference, а також робота з GitHub / GitLab CI/CD flows;
- Досвід роботи з Docker або Kubernetes;
- Досвід роботи на позиції Data Scientist — понад 2 роки.
Буде перевагою
- Практичний досвід роботи з Java та/або JavaScript/TypeScript або готовність розвиватися в цих мовах для підтримки AI/ML-імплементацій у non-Python tech stacks;
- Практичний досвід роботи щонайменше з однією з основних cloud-платформ: AWS, Azure або GCP;
- Вміння працювати зі Spark та Airflow.
Якщо ви маєте зазначені навички, прагнете навчатися, уважні до деталей і можете ефективно працювати як самостійно, так і в команді, ми будемо раді поспілкуватися з вами. Приєднуйтесь до нашої команди та зробіть свій внесок в успіх нашої організації.