Общая информация

  • Мужчина, 43 года, родился 3 января 1980
  • Проживает в Москве
  • Гражданство: Россия
  • Желаемая должность: Data Scientist
  • Опыт работы в Yandex Практикуме в области Data Science
  • Реализованные проекты в области анализа данных и машинного обучения
  • Опыт работы в области продаж и управления проектами
  • Высшее образование в области информационных систем
  • Ключевые навыки: Python, SQL, Git, Machine Learning, аналитическое мышление

Опыт работы

20 лет 7 месяцев

Проживает

Москва

Год выпуска

2002

Возраст

43 года

Желаемая должность

Data Scientist

Гражданство

Россия

Опыт работы

Яндекс Практикум

Студент курса Специалист Data Sciense плюс (учебный опыт)

Июнь 2022 - Сентябрь 2023

Информационные технологии, системная интеграция, интернет

ООО «БайСелл Групп»

Менеджер по проектам

Апрель 2019 - Апрель 2022

Электроника, приборостроение, бытовая техника, компьютеры и оргтехника

Самозанятый

Розничная торговля

Июль 2014 - Март 2019

Розничная торговля

Телеинком

Менеджер по продажам

Февраль 2003 - Июнь 2014

Электроника, приборостроение, бытовая техника, компьютеры и оргтехника Телекоммуникации, связь

Проекты

Оценка риска ДТП

Студент курса Специалист Data Sciense плюс (учебный опыт)

undefined 2022 - undefined 2023

Загрузил данные из Postgres используя библиотеку sqlalchemy. Провел статистический анализ факторов ДТП (sql-завросы к Бд, pandas, визуализация seaborn, выводы). Обучил модели для оценки риска ДТП (DecisionTreeClassifier. RandomForestClassifier, LogisticRegression, LGBMClassifier, CatBoostClassifier). Протестировал лучшую модель на тестовой выборке. Рекомендовал пути для улучшения модели.

Определение токсичных комментариев

Студент курса Специалист Data Sciense плюс (учебный опыт)

undefined Не указано - undefined Не указано

Обработал данные: удаление ненужных столбцов, оптимизация типов данных (pandas). Очистил текст: токенизация, лемматизация, удаление стоп-слов и символов пунктуации (re, spacy). Обучил следующие модели LogisticRegression, SGDClassifier, LGBMClassifier двумя методами: Векторизация TF-IDF (TfidfVectorizer); Эмбеддинги BERT. Протестировал лучшую модель на тестовой выборке и получил необходимый результат.

Прогнозирование температуры звезды

Студент курса Специалист Data Sciense плюс (учебный опыт)

undefined Не указано - undefined Не указано

Провел исследовательский анализ данных (pandas, визуализация seaborn). Построил модель нейронной сети для предсказания температуры звезды (pytorch). Реализовал улучшение нейросети (batchnorm, dropout). Протестировал модель на тестовой выборке. Получил необходимый по метрике результат с визуализацией результатов работы модели (seaborn).

Языки

Language

Русский

Родной