Ольга Н.

СпециалистData ScientistSenior

от 1 600 ₽/ч

Стаж 6 лет

4.6

Навыки подтверждены
нашим экспертом

Основное

Возраст:32 года
Гражданство:Россия
Опыт на зарубежных проектах:Не было
Уровень английского:C1

Образование

О себе

Я опытный Data Scientist с более чем четырьмя годами практического опыта в области анализа данных, моделирования и машинного обучения, особенно в финансовом секторе и финтехе. Выпускница AI Masters Московского государственного университета, обладаю глубокими знаниями в области теории машинного обучения, статистики и анализа данных. За время своей карьеры я успешно реализовала проекты по созданию моделей оценки кредитных рисков, антифрода и оценки клиентского поведения. В частности, я разрабатывала системы обнаружения мошенничества с использованием OCR, классификаторов и моделей градиентного бустинга (CatBoost, LightGBM). Работала с большими объёмами данных, использовала технологии Hadoop, PySpark, Hive для обработки и анализа данных из сложных источников. Кроме того, у меня есть опыт в NLP и Computer Vision — создавал системы мониторинга соцсетей, выделял именованные сущности, строил текстовые классификаторы и системы анализа мнений. Для этого использовал библиотеки, такие как nltk, natasha, PyTorch, OpenCV, а также облачные сервисы Yandex Cloud. Обладаю навыками работы с SQL, Docker, Git и другими инструментами DevOps и обучения. Владею английским языком на уровне C1, что позволяет работать с международными командами и источниками данных. Я заинтересована в участии в проектах, связанных с CV, NLP и Audio/Signal Processing, где могу применить свои знания нейросетей и аналитики для решения сложных задач и развития новых технологий.

Хард скиллы

Other10/10
Python6/10

SQL9/10
Docker7/10

PostgreSQL9/10

Портфолио

Зарегистироваться и посмотреть репозиторий

Проекты

Sep 2025 - н. в.
9 мес.
Decart IT
Финансы
Построение моделей Antifraud
Реализовано
через RIWO
- Стек проекта
  PostgreSQL, Hadoop, Hive, CatBoost, LightGBM, sklearn, XGBoost, Python, Pandas, NumPy, SHAP, feature importance, Tesseract OCR, OpenCV, Yandex Cloud, NLTK, spaCy, Natasha, PySpark, Docker
- Задачи
  Анализ и сбор данных, разработка и обучение моделей машинного обучения для выявления мошеннических операций, оптимизация моделей по метрикам precision, recall, F1-score и AUC, построение пайплайнов обработки данных и автоматизация процесса обучения, оценка эффективности моделей, внедрение систем мониторинга и обратной связи, взаимодействие с командой разработки для интеграции моделей в production-окружение, документирование решений, подготовка отчётов и презентаций для стейкхолдеров, курирование этапов сбора и предварительной обработки данных, проектирование архитектуры моделей и эксперименты с различными алгоритмами (CatBoost, LightGBM, XGBoost), участие в оптимизации скорости обучения и производительности моделей, проведение анализа важности признаков (shap, feature importance), внедрение инструментов автоматического тестирования и мониторинга моделей, обучение команды и подготовка рекомендаций по улучшению системы anti-fraud.
- Результат
  Разработана модель, повысившая точность обнаружения мошенничества на 15%, что привело к снижению финансовых потерь. Внедрена автоматизированная система сбора и предобработки данных, сократившая время подготовки данных на 40%. Реализованы механизмы мониторинга моделей, снизившие уровень ложных срабатываний и повысившие доверие к системе. Создана документация и рекомендации по более эффективной интеграции моделей в бизнес-процессы.
- Состав команды
  Старший Data Scientist (ведущий проект), Data Scientist, Инженер данных, Разработчик DevOps / ML Ops, Аналитик/Бизнес-аналитик
- Отзыв заказчика
  4.0
  Екатерина С.
  Хорошо взаимодействует с командой и выполняет задачи вовремя.
  Зарегистироваться и читать полностью
Dec 2024 - Sep 2025
9 мес.
Сбер
Финансы
Реализовано
через RIWO
- Стек проекта
  Hadoop, PySpark, Hive, CatBoost, LightGBM, Python, Oracle, PostgreSQL, Pandas, NumPy, scikit-learn, Yandex Cloud
- Задачи
  Координация исследований и анализ внутренних источников данных, тестирование и интеграция внешних источников данных, разработка и оптимизация моделей оценки рисков и поведения клиентов, создание инфраструктуры для обработки больших объёмов данных, анализ эффективности моделей, ведение командной работы, наставничество младших специалистов, взаимодействие с бизнес-подразделениями для внедрения решений, документирование решений и подготовка отчётов, построение конвейеров обработки данных, эксперименты с алгоритмами (CatBoost, LightGBM), анализ значимости признаков, объяснимость моделей, проведение совместных исследований по внедрению внешних данных в рабочие модели, участие в подготовке презентаций для руководства и бизнес-стейкхолдеров, обучение команды и делиться лучшими практиками.
- Результат
  Разработала и внедрила модели оценки кредитного риска, повысившие точность прогнозирования на 12%, что снизило уровень дефолтов. Интегрированы новые внешние источники данных, что увеличило покрытие и точность моделей. Создана автоматизированная инфраструктура обработки данных и обучения моделей, что уменьшило время подготовки данных на 30%. Проведён анализ важности признаков, выработаны рекомендации по улучшению качества данных и моделей. Внедрён механизм регулярного мониторинга эффективности моделей в рабочей среде.
- Состав команды
  Старший Data Scientist (ведущий проекта), Data Scientist, Инженер данных, Бизнес-аналитик, DevOps / ML Ops специалист
- Отзыв заказчика
  5.0
  Кирилл Н.
  Быстро находит решения и хорошо взаимодействует с коллегами.
  Зарегистироваться и читать полностью
Jan 2022 - Dec 2024
2 г., 11 мес.
Eqvanta
Финансы
- Стек проекта
  CatBoost, LightGBM, shap, PostgreSQL, MS SQL, TesseractOCR, OpenCV, Python, Pandas, NumPy, Docker, Airﬂow
- Задачи
  Анализ и подготовка данных, построение, обучение и tuning моделей оценки кредитного риска, внедрение методов объяснимости моделей, разработка и внедрение OCR-решений для автоматической обработки документов, создание классификаторов для выявления мошеннических операций, оптимизация моделей и автоматизация пайплайнов обработки данных, анализ результатов, подготовка отчётов и презентаций, анализ эффективности моделей, подбор гиперпараметров, эксперименты с различными алгоритмами, построение автоматизированных систем тестирования и внедрения, улучшение качества OCR и предварительной обработки документов.
- Результат
  Разработана и внедрена модель оценки кредитных рисков для двух рынков, что повысило точность прогнозов и снизило уровень просрочек. Внедрена система автоматической обработки документов с использованием OCR, что сократило ручной труд и ускорило проверку заявлений. Построены классификаторы AntiFraud, ставшие частью системы мониторинга транзакций, что повысило обнаружение мошенничества на 20%. Создана система объяснений моделей, обеспечивающая прозрачность решений для бизнес-пользователей. Автоматизирован пайплайны обработки изображений и данных, что снизило время доставки решений в production на 35%.
- Состав команды
  Data Scientist, Инженер данных, Разработчики OCR и Computer Vision специалистов, Бизнес-аналитик, Руководитель проекта / менеджер
Dec 2020 - Feb 2022
1 г., 2 мес.
АСАП
Технологии
- Стек проекта
  nltk, spacy, natasha, PyTorch, word2vec, fastText, Yandex Cloud, Python, PostgreSQL, NoSQL базы, Airﬂow, Docker, CI/CD
- Задачи
  Разработка и внедрение методов выделения именованных сущностей, построение текстовых классификаторов, адаптация и настройка инструментов для работы с большими объёмами текстовых данных, применение современных архитектур на базе PyTorch и обучающих моделей, использование инструментов NLP для предобработки текстов, разработка систем автоматической обработки и интеграции данных в облаке, оптимизация моделей и автоматизация пайплайнов анализа текста.
- Результат
  Разработана система автоматического выделения именованных сущностей, которая увеличила скорость анализа текстов на 40%. Созданы классификаторы настроений, успешно определяющие мнение по текстам с точностью свыше 85%. Интегрированы облачные решения на базе Yandex Cloud, обеспечивающие масштабируемость и отказоустойчивость системы. Оптимизированы модели для работы с большими потоками данных, что позволило обрабатывать тысячи сообщений в минуту. Разработана архитектура, позволяющая регулярно обновлять модели и повышать их качество без ручного вмешательства.
- Состав команды
  NLP Engineer / Data Scientist, Data Engineer, Data Analyst / Бизнес-аналитик, DevOps специалист

Запись видео интервью

Интервью с рекрутером-экспертом RIWO
Зарегистрироваться и смотреть
Техническое интервью
Зарегистрироваться и смотреть

Основное

Образование

О себе

Хард скиллы

Портфолио

Проекты

Decart IT

Сбер

Eqvanta

АСАП

Запись видео интервью

Похожие специалисты