Александр Кукушкин
@alexanderkuk
Лаборатория анализа данных Александра Кукушкина
Информация
- В рейтинге
- Не участвует
- Откуда
- Москва, Москва и Московская обл., Россия
- Зарегистрирован
- Активность
Лаборатория анализа данных Александра Кукушкина
Обучение модели естественного языка с BERT и Tensorflow
Интересно про SBERT, не могли бы раскрыть подробности:
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
В проекте, кстати, уже есть есть такие обёртки. Там aiohttp + docker https://github.com/natasha/slovnet/blob/master/docker/slovnet-ner/exec/app.py
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Правила для Yargy-парсера
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Открытых решений для русского не знаю. Для тональности всего текста есть https://github.com/bureaucratic-labs/dostoevsky
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Нет
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Весь проект на Python. Нормального способа использовать с другими языками мне не известно. Только может быть заворачивать в веб интерфейс
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Na — natasha, eval — evaluation
Проект Natasha. Набор качественных открытых инструментов для обработки естественного русского языка (NLP)
Для соцсетей нужно делать кастомное решение, использовать статистические методы, не правила
Заметки Дата Сайентиста: как измерить время забега марафона лежа на диване
NLP. Основы. Техники. Саморазвитие. Часть 2: NER
Система которая заняла первое место на factRuEval-2016 www.pullenti.ru rule-based. Получается при большом желании можно и на непростых сущностях
Было бы интересно почитать про решение NER, которое используется в Abbyy
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Спасибо! Надо будет попробовать.
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
2. Опять же, если появятся задачи про это, то да. Пока планов нет. Теоретически, парсер такое поддерживает.
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Если вы введёте полное предложение, например «придя с работы Маша мыла Раму» «Маша» найдётся. Такая специфика работы NamesExtractor сейчас
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Yargy-парсер и библиотека Natasha. Извлечения структурированной информации из текстов на русском языке
Когда мне нужно было работать с такими именами я просто заводил словарь
'Абд Аль — Азиз Бин Мухаммад',
'Абд ар — Рахман Наср ас — Са ди',
'Абд ар — Рахман ибн Хасан',
'Абд — аль Хади ибн Али',
'Абд — уль — Кадим Заллюм',
'Абду — ль — Азиз Аль Абдуль — ли — Лятыф',
…