Pull to refresh
0
0
Артём Борзенко @Artem-Borzenko

Студент на специальность Data Scientist

Send message

Определение токсичных комментариев на русском языке

Reading time16 min
Views17K

Сегодня социальные сети превратились в одну из главных коммуникационных платформ как в онлайне, так и реальной жизни. Свобода выражения разных точек зрения, в том числе токсичных, агрессивных и оскорбительных комментариев может иметь долговременные негативные последствия для мнений людей и социальной сплочённости. Поэтому одной из важнейших задач современного общества является разработка средств автоматического определения токсичной информации в интернете для уменьшения негативных последствий.

В этой статье описывается решение этой задачи для русского языка. В качестве источника данных мы использовали анонимно опубликованный на Kaggle набор данных, дополнительно проверив качество аннотации. Для создания классифицирующей модели мы сделали тонкую настройку двух версий Multilingual Universal Sentence Encoder, Bidirectional Encoder Representations from Transformers и ruBERT. Настроенная модель ruBERT показала F1 = 92,20 %, это был лучший результат классификации. Мы выложили в открытый доступ обученные модели и примеры кода.
Читать дальше →
Total votes 32: ↑20 and ↓12+26
Comments25

Nvidia представила новую версию одноплатного ПК Jetson Nano всего за $59

Reading time2 min
Views40K

За последние несколько недель появилось сразу несколько отличных одноплатников. Только недавно вышел на рынок конкурент Raspberry Pi 4 c x86-процессором, а сейчас Nvidia представила еще одну альтернативу «малинке», только уже с уклоном в технологии искусственного интеллекта.

Называется новинка Jetson Nano, это уже вторая версия. Первая появилась в 2019 году и продавалась по цене в $99. Новый одноплатник практически такой же по функциональности, но дешевле — стоимость устройства составляет $59.
Читать дальше →
Total votes 33: ↑30 and ↓3+41
Comments39

Интерактивная визуализация алгоритмов на базе Jupyter

Reading time15 min
Views13K
Jupyter уже давно зарекомендовал себя как удобную платформу для работы в различных областях на стыке программирования, анализа данных, машинного обучения, математики и других. Вот например очень известная книга по анализу данных, состоящая из Jupyter блокнотов. Поддержка $\TeX$, markdown, html дает возможность использовать использовать Jupyter в качестве платформы для удобного оформления научного-технического материала. Преимущество таких блокнотов заключается в интерактивности, возможности сопровождать сухой материал примерами программ, при этом эта интерактивность очень естественна и проста в использовании. В этой статье хотелось бы рассказать про возможность создания в Jupyter анимированных примеров работы различных алгоритмов и привести несколько из них с исходным кодом. В качестве кликбейта алгоритм Дейкстры.


Читать дальше →
Total votes 23: ↑23 and ↓0+23
Comments3

Information

Rating
Does not participate
Location
Сургут, Тюменская обл. и Ханты-Мансийский АО, Россия
Date of birth
Registered
Activity