вчера в 15:26 Просмотры 1 +1 сегодня Вакансия партнера

Ассистент Data Science

Специализация: Дата-сайентист

Формат работы: На месте работодателя

График работы: 5/2

Тип занятости: Полная занятость

Опыт: От 1 года до 3 лет

Выплата: ежемесячно

Описание

Ромир – лидер исследований в России в сферах психологии, социологии, маркетинга, демографии и статистики, работаем более чем в 60 странах мира. Более 30 лет мы занимаемся глубинными исследованиями в евразийском пространстве, развивая инновационные инструменты, опираясь на фундамент социальных наук. Мы активно сотрудничаем с крупнейшими университетами, бизнесом и государственными организациями. Если вы стремитесь к инновациям и хотите быть частью динамичной компании, то эта вакансия для вас! Приглашаем присоединиться к нашей команде Data Science ассистента. Ключевая задача: работа в команде Data Science над задачами в области аналитики и обработки больших объёмов данных. Основной фокус — реализация ML-гипотез по подготовленным Тз, эксперименты с моделями и подготовка данных для обучения. С предоставлением отчёта по каждой гипотезе с описанием реализуемых подходов на основании выбранных метрик качества на тестовой выборке.

Обязанности

  • Работа с данными. Сборка выборок из корпоративных витрин (SQL) по поставленным Тз.
  • Разметка и валидация данных различными объёмами — для подготовки обучающих выборок, оценки качества моделей и контроля автоматической разметки. Формирование сбалансированных датасетов для дальнейшего обучения. Реализация ML-гипотез и LLM-пайплайнов. Имплементация поставленных гипотез: подготовка данных, обучение моделей, тестирование подходов (классический ML, эмбеддинги и векторные представления), построение пайплайнов на Llm через API и локально. Снятие метрик, выполнение экспериментов по чек-листу на разных параметрах, сравнение подходов, фиксация результатов в воспроизводимом виде, оформление отчётов. R&D. Участие в исследовательской части проектов: разбор актуальных статей и решений в области Llm и классического ML, поиск релевантных подходов под текущие задачи команды. Подготовка кратких обзоров найденных методов с оценкой применимости. Проверка перспективных подходов на пилотных выборках.

    Требования

  • Python: уверенное владение, знание основных библиотек (pandas, numpy, scikit-learn и пр,).
  • Классический ML: понимание основных алгоритмов (линейные модели, деревья, градиентный бустинг и пр.), умение корректно подбирать метрики под задачу и интерпретировать результаты. Векторные представления: понимание эмбеддингов, умение работать с векторными моделями (sentence-transformers, embedding-модели), опыт работы с векторным поиском. Llm: понимание принципов работы языковых моделей, опыт построения промптов, работа с локальными моделями; ориентация в актуальных подходах (Rag, few-shot, structured output) SQL: уверенный пользователь. API: опыт использования API Git: базовая работа с ветками, коммитами, мерж.

    Условия

    • Работа в одной из самых динамично развивающихся компаний на российском исследовательском рынке;
    • Работа с молодой командой профессионалов, которые горят своим делом и нацелены на результат;
    • Возможность участия в самых крупных российских исследовательских проектах;
    • Оформление в соответствии с ТК РФ.
    • Комфортный современный офис в шаговой доступности от ст. м. Багратионовская, м. Фили и Парк Победы;
    • Уровень заработной платы обсуждается с успешным кандидатом на собеседовании.
    • График работы с 9.30 до 18.00, 5/2 суббота и воскресенье выходные.

    Навыки

    Python
    SQL
    pandas
    Работа с базами данных