Middle Data Scientist

Ми шукаємо кваліфікованого та досвідченого Data Scientist для приєднання до нашої команди. На цій позиції ви будете відповідати за проведення експериментів із наборами даних з метою пошуку корисних інсайтів і ознак, підтримку data pipelines, навчання алгоритмів машинного навчання та візуалізацію результатів.

Основні цілі та обов’язки

  • Бути проактивним командним гравцем;
  • Співпрацювати з командою над впровадженням нових функціональностей для підтримки зростаючих потреб у роботі з даними;
  • Створювати, підтримувати та впроваджувати DS- і ML-пайплайни, включно з отриманням даних, попередньою обробкою, feature engineering, навчанням та інференсом моделей, аналізом і візуалізацією результатів;
  • Створювати, підтримувати та впроваджувати системи на базі LLM і агентні пайплайни, включно з prompt engineering, інтеграцією інструментів та API, управлінням пам’яттю й контекстом, оркестрацією інференсу та оцінюванням результатів моделей;
  • Ділитися знаннями з іншими командами щодо різних тем, пов’язаних із Data Science або проєктом;
  • Співпрацювати з командою у виборі інструментів і стратегій для конкретних сценаріїв.

Обов’язкові вимоги

  • Рівень англійської мови — Upper-Intermediate+;
  • Хороша математична та статистична база, знання тензорного числення;
  • Хороше знання баз даних, таких як Postgres, MongoDB, а також SQL;
  • Знання Python та практичний досвід роботи з бібліотеками Scikit-learn, NumPy, Pandas і Matplotlib;
  • Досвід роботи з алгоритмами градієнтного бустингу, зокрема XGBoost або LightGBM;
  • Знайомство з інструментами оркестрації LLM, наприклад LangChain, LangGraph;
  • Досвід використання або інтеграції з cloud LLM API, наприклад OpenAI, Claude, Amazon Bedrock, Vertex AI;
  • Практичний досвід роботи з Retrieval-Augmented Generation-пайплайнами та векторними базами даних, наприклад pgvector, FAISS, Weaviate, Pinecone;
  • Практичний досвід із техніками prompt engineering, агентними інструментами та workflow;
  • Знання щонайменше одного фреймворку для побудови та навчання нейронних мереж — TensorFlow/Keras або PyTorch, а також хороше розуміння архітектур нейронних мереж і підходів до роботи з ними;
  • Комерційний досвід із класичним машинним навчанням і deep learning, включно з NLP- та CV-моделями, такими як BERT, ResNet;
  • Практичні навички побудови end-to-end ML training pipelines: завантаження даних, preprocessing, навчання, inference, а також робота з GitHub / GitLab CI/CD flows;
  • Досвід роботи з Docker або Kubernetes;
  • Досвід роботи на позиції Data Scientist — понад 2 роки.

Буде перевагою

  • Практичний досвід роботи з Java та/або JavaScript/TypeScript або готовність розвиватися в цих мовах для підтримки AI/ML-імплементацій у non-Python tech stacks;
  • Практичний досвід роботи щонайменше з однією з основних cloud-платформ: AWS, Azure або GCP;
  • Вміння працювати зі Spark та Airflow.

Якщо ви маєте зазначені навички, прагнете навчатися, уважні до деталей і можете ефективно працювати як самостійно, так і в команді, ми будемо раді поспілкуватися з вами. Приєднуйтесь до нашої команди та зробіть свій внесок в успіх нашої організації.