Вакансія Middle Data Scientist

Вакансії › Data

Ми шукаємо кваліфікованого та досвідченого Data Scientist для приєднання до нашої команди. На цій позиції ви будете відповідати за проведення експериментів із наборами даних з метою пошуку корисних інсайтів і ознак, підтримку data pipelines, навчання алгоритмів машинного навчання та візуалізацію результатів.

Основні цілі та обов’язки

Бути проактивним командним гравцем;
Співпрацювати з командою над впровадженням нових функціональностей для підтримки зростаючих потреб у роботі з даними;
Створювати, підтримувати та впроваджувати DS- і ML-пайплайни, включно з отриманням даних, попередньою обробкою, feature engineering, навчанням та інференсом моделей, аналізом і візуалізацією результатів;
Створювати, підтримувати та впроваджувати системи на базі LLM і агентні пайплайни, включно з prompt engineering, інтеграцією інструментів та API, управлінням пам’яттю й контекстом, оркестрацією інференсу та оцінюванням результатів моделей;
Ділитися знаннями з іншими командами щодо різних тем, пов’язаних із Data Science або проєктом;
Співпрацювати з командою у виборі інструментів і стратегій для конкретних сценаріїв.

Обов’язкові вимоги

Рівень англійської мови — Upper-Intermediate+;
Хороша математична та статистична база, знання тензорного числення;
Хороше знання баз даних, таких як Postgres, MongoDB, а також SQL;
Знання Python та практичний досвід роботи з бібліотеками Scikit-learn, NumPy, Pandas і Matplotlib;
Досвід роботи з алгоритмами градієнтного бустингу, зокрема XGBoost або LightGBM;
Знайомство з інструментами оркестрації LLM, наприклад LangChain, LangGraph;
Досвід використання або інтеграції з cloud LLM API, наприклад OpenAI, Claude, Amazon Bedrock, Vertex AI;
Практичний досвід роботи з Retrieval-Augmented Generation-пайплайнами та векторними базами даних, наприклад pgvector, FAISS, Weaviate, Pinecone;
Практичний досвід із техніками prompt engineering, агентними інструментами та workflow;
Знання щонайменше одного фреймворку для побудови та навчання нейронних мереж — TensorFlow/Keras або PyTorch, а також хороше розуміння архітектур нейронних мереж і підходів до роботи з ними;
Комерційний досвід із класичним машинним навчанням і deep learning, включно з NLP- та CV-моделями, такими як BERT, ResNet;
Практичні навички побудови end-to-end ML training pipelines: завантаження даних, preprocessing, навчання, inference, а також робота з GitHub / GitLab CI/CD flows;
Досвід роботи з Docker або Kubernetes;
Досвід роботи на позиції Data Scientist — понад 2 роки.

Буде перевагою

Практичний досвід роботи з Java та/або JavaScript/TypeScript або готовність розвиватися в цих мовах для підтримки AI/ML-імплементацій у non-Python tech stacks;
Практичний досвід роботи щонайменше з однією з основних cloud-платформ: AWS, Azure або GCP;
Вміння працювати зі Spark та Airflow.

Якщо ви маєте зазначені навички, прагнете навчатися, уважні до деталей і можете ефективно працювати як самостійно, так і в команді, ми будемо раді поспілкуватися з вами. Приєднуйтесь до нас та зробіть свій внесок в успіх команди NIX.

Відгукнутись на вакансію

Актуальне

Вакансії компанії