How to become an author
.NET Knowledge Base
  • All streams
  • Development
  • Administrating
  • Design
  • Management
  • Marketing
  • PopSci
Log in Sign up
59.2
Karma
0.0
Rating
11
Followers
1
Following

Roman Lugovkin RomanL

Пользователь

Profile

Posts 4

Comments 595

Bookmarks 1.1k

  • Пора переходить в красный лагерь: выбираем лучший AMD EPYC для сервера
    15
    RomanL
    August 20, 2020 at 05:08 PM
    0
    «из коробки»
  • Срочный переезд с Amazon Web Services — истории двух клиентов
    26
    RomanL
    April 23, 2018 at 04:32 PM
    +1
    А как суд относится к блокировке целых подсетей, ip адреса в которых могут вообще не иметь никакого отношения к блокируемому сервису?
  • Щи, или Распознавание 330 млн лиц на скорости 400 фото / сек
    25
    RomanL
    March 9, 2018 at 11:57 AM
    0
    Ну если в фотках друзей то да, тогда понятно. Просто если искать самый близкий эмбеддинг по всем юзерам (а это, наверное, косинусная мера) на 330M векторов — такое себе занятие…
  • Щи, или Распознавание 330 млн лиц на скорости 400 фото / сек
    25
    RomanL
    March 7, 2018 at 04:05 PM
    0
    Да, очень интересно как вы оптимизируете выбор наиболее подходящих векторов
  • Создатель Vue.js отвечает Хабру
    69
    RomanL
    March 2, 2018 at 02:08 PM
    +2
    Ну да, забить можно. Просто это закрывает дорогу приложениям на Vue в корпоративный сектор. Для сайтов это не критично, а если ты делаешь веб-приложения то ой.
  • Получаем список пассажиров рейсов крупнейшего авиаперевозчика Украины
    54
    RomanL
    February 26, 2018 at 04:22 PM
    0
    Ну так нефиг фоточки билетов в инстаграмчик выкладывать ))
  • Визуализация данных для киноманов: скрапим рекомендации фильмов и делаем интерактивный граф
    18
    RomanL
    February 20, 2018 at 12:14 PM
    +1
    Как рекомендательная система — выбираете любимые фильмы и исследуете кластер куда они входят для подбора чего бы посмотреть похожего.
  • Визуализация данных для киноманов: скрапим рекомендации фильмов и делаем интерактивный граф
    18
    RomanL
    February 20, 2018 at 12:13 PM
    +1
    Отличное решение! Я тоже люблю забавляться с графами и рекомендациями. Как раз работую сейчас над рекомендательной системой на основе данных кинопоиска. Немного на других принципах, но будет очень интересно сравнить то что получится с теми рекомендациями, которые отображены на вашем графе.
  • Весы и штрих-коды: Как ритейлеры и производители оказались в глубокой… луже
    81
    RomanL
    January 23, 2018 at 04:36 PM
    0
    Кстати, а есть где-то открытые базы EAN-13 продуктов питания?
  • Анализируй это — Lenta.ru
    23
    RomanL
    December 4, 2017 at 05:17 PM
    +1
    Отличное имя домена, очень подходит ))
  • Датасет: ассоциации к словам и выражениям русского языка
    14
    RomanL
    November 1, 2017 at 03:42 PM
    0
    Ну я так и подумал, я тоже так делаю ))
  • Датасет: ассоциации к словам и выражениям русского языка
    14
    RomanL
    November 1, 2017 at 03:28 PM
    0
    А как вы составляете «Каким бывает «счастье»»? Тоже вручную? Или анализируете словосочетания по правилам с ключевым словом?
  • Датасет: ассоциации к словам и выражениям русского языка
    14
    RomanL
    November 1, 2017 at 10:11 AM
    0
    Мне видится что вы не очень понимаете принципы использование датасетов в самообучающихся системах. Потому что если ваши «гипотезы», читай «веса синонимов» не будут находить подтверждение (а это, скорее всего так, потому что после 5-10 нормальных ассоциаций у вас идет, извините, бред, который приходится выдумывать) в реальном диалоге или текстах, то они вылетят из модели и останется только наиболее частотная «голова», которая не сильно отличается от того что дает word2vec.

    И я не понимаю как эти данные могут автоматически помочь в сентимент-анализе без разметки и в автоматическим составление тезауруса под новую предметную область.

    Не подумайте что я наезжаю, просто действительно, проделан большой объем работы, но кроме предположений из той статьи, на которую вы ссылаетесь, что бот запутается в эмоциях если делать его через word2vec я не увидел никаких проверок неадекватности существующих моделей и улучшений на вашем датасете. Что-то есть в вашей идее, но, боюсь, глобально и усреднено — нейронные сети лучше разберутся что к чему )))

    PS Кстати, о Glove. У меня сложилось впечатление что эта модель работает хуже чем word2vec. По крайней мере в моих тестах мне так показалось.
  • Датасет: ассоциации к словам и выражениям русского языка
    14
    RomanL
    October 31, 2017 at 11:08 PM
    +2
    В таком случае могу только восхищаться объемом проделанной работы, но не могу избавиться от двух извечных вопросов «зачем и нафига».

    Какую задачу вы решали? Чем ваш датасет может помочь лучше чем предварительно морфологизированный word2vec на приличном исходном множестве текстов?
  • Датасет: ассоциации к словам и выражениям русского языка
    14
    RomanL
    October 31, 2017 at 10:47 PM
    +2
    Это все прекрасно, но как вы сформировали этот датасет? Ничего не сказано же об этом. Из того что я вижу в assoc.csv — ну те же слова, выведенные через distance из тулчейна word2vec.

    Может быть вы как то использовали ранговую корреляцию в прямом ( изба -> дом, крыльцо, ...) и обратном ( дом->изба, крыльцо->изба, ...->изба) вычислении вектора наиболее похожих слов и это назвали «ассоциацией»? Или что? Где описание алгоритма?

  • Transformer — новая архитектура нейросетей для работы с последовательностями
    7
    RomanL
    October 30, 2017 at 02:44 PM
    +1
    А я правильно понимаю что использование сетей с вниманием в применении к тексту можно считать, по сути, некоторым развитием базовых алгоритмов типа tf-idf? Ну то есть могут решаться похожие задачи выделения контекста.
  • Российские радиоспектакли: от «Радионяни» до «Соляриса»
    23
    RomanL
    October 25, 2017 at 03:58 PM
    0
    А может быть кто-то помнит радиоспектакль где суть была в том что какой-то странник (кажется, его звали Спутник) помог паре выиграть много денег в лотерею, а они потом его убили? Слышал лет 20 назад… Не помню ни названия, ни автора.
  • Российские радиоспектакли: от «Радионяни» до «Соляриса»
    23
    RomanL
    October 25, 2017 at 03:56 PM
    0
    Есть еще отличное прочтение «Улитки на склоне» от Бориса Стругацкого.
  • Краткий курс машинного обучения или как создать нейронную сеть для решения скоринг задачи
    43
    RomanL
    October 24, 2017 at 11:54 AM
    0
    Да, в контексте статьи это несколько странно.
  • Краткий курс машинного обучения или как создать нейронную сеть для решения скоринг задачи
    43
    RomanL
    October 24, 2017 at 11:41 AM
    +1
    Если интерпретировать историю пользователя как цепочку событий то можно. Каждое событие — отдельное «слово» в словаре. А дальше работаем как с текстами ))
  • Рекомендательная система на коленке как средство против экзистенциального кризиса
    7
    RomanL
    October 18, 2017 at 02:47 PM
    0
    Под руку попался ))
  • Рекомендательная система на коленке как средство против экзистенциального кризиса
    7
    RomanL
    October 18, 2017 at 10:02 AM
    0
    Список блогов брался из кириллического рейтинга, скорее всего divov в него не входит (некоторые пользователи отключают эту опцию).
  • Рекомендательная система на коленке как средство против экзистенциального кризиса
    7
    RomanL
    October 17, 2017 at 10:58 PM
    +1
    Не так долго как могло бы показаться — это же хобби ))
    Краулер был написан еще в начале лета под задачу подсчета статистики активности в ЖЖ. Чуть больше недели на обработку данных и борьбу с SVD и несколько дней на конвертер для графов и их визуализацию — весьма такое творческое занятие. Ну и по паре дней (ночей) на написание фронт-энда для блогов и вина. Я не очень большой специалист в js-разработке, а некоторые аспекты рендеринга на svg и библиотеки d3js осваивал в процессе.
  • Как научить свою нейросеть анализировать морфологию
    18
    RomanL
    October 13, 2017 at 01:15 PM
    0
    А с яндексовским mystem не сравнивали?

    Я его использую в своих хобби-проектах, но если о чем-то коммерческом говорить — то там ограничения по лицензии, вот неспешно подыскиваю замену.
  • Рубрика «Читаем статьи за вас». Сентябрь 2017
    14
    RomanL
    October 10, 2017 at 11:11 AM
    0
    А в телеграме публичного канала нет у вас с материалами и обсуждениями?
  • Вести с полей больших и умных данных: программа конференции SmartData 2017 Piter
    4
    RomanL
    October 7, 2017 at 01:09 PM
    0
    > content-based рекоментадельный сервис для более чем 100 млн. пользователей рунета

    это про что?
  • Книга «Маленькая книга о большой теории струн»
    9
    RomanL
    August 15, 2017 at 04:22 PM
    0
    Неплохо написано на мой любительский взгляд. Гораздо понятнее чем в «бестселлерах» от Митио Каку.
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 20, 2017 at 05:24 PM
    0
    Там есть ссылка на github: https://github.com/roman-lugovkin/ecom-ulmart-bot
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 19, 2017 at 07:40 PM
    0
    Оказывается есть секретный чатик для невымерших perl-программистов ))
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 19, 2017 at 10:18 AM
    +1
    Ой, да, мне же пришло приглашение на вакансию от 220Вольт — видимо это действительно единственный смысл конкурса ))
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 18, 2017 at 03:17 PM
    0
    Там же есть закрытый спойлер в конце статьи с итогами ))
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 18, 2017 at 01:48 PM
    –5
    Ладно, ладно )) Я не против, но как по мне так машина состояний в контексте понятнее чем конечный автомат.
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 18, 2017 at 01:38 PM
    0
    Одно из условий задания — не использовать сторонние библиотеки для телеграма и целевого магазина. А я люблю изобретать велосипеды ))
  • Бот для Telegram за 48 часов на Perl или как купить кошачий корм не выходя из чата
    21
    RomanL
    July 18, 2017 at 01:37 PM
    –4
    Позанудствую в ответ — конечный автомат это конкретная реализация «машины состояний». Тут имеется в виду сама концепция ))
  • Да, Python медленный, но меня это не волнует
    223
    RomanL
    June 2, 2017 at 11:23 PM
    0
    А я Рома, пишу на Perl и мне не стыдно )))
  • Почему я больше не хочу програмировать на Perl
    220
    RomanL
    April 27, 2017 at 03:59 PM
    0
    И с удовольствием! )))
  • Как я парсил всю базу данных игр Metacritic-а
    23
    RomanL
    January 20, 2017 at 01:46 PM
    0
    Адекватные деньги это сколько? Есть AWS с его спот-микро-инстансами, есть пачки прокси. Я не спец именно по ботам для поисковых систем, но мне кажется подход то один.
  • Яндекс использовал нейросеть и научился прогнозировать осадки с точностью до минут
    92
    RomanL
    December 15, 2016 at 03:25 PM
    +3
    Открыл сайт, посмотрел на сообщение «В ближайшие два часа осадков не ожидается», посмотрел на то как валит снежище за окном, закрыл сайт.
  • Две задачи HeadHunter на Data Science Week: попробуйте решить сами
    3
    RomanL
    October 8, 2015 at 04:35 PM
    +2
    Первая задача интересная и весьма актуальна (уже не первый раз встречаю такую формулировку в некоторых областях). Будет время и настроение — попробую.
  • Распознавание кириллической Яндекс капчи
    17
    RomanL
    August 10, 2015 at 07:39 PM
    –17
    Если вы сделаете распознавалку 6-ти и 7-ми символьных капч VK с точностью процентов в 20 то напишите в личку сколько вы хотите за это решение ))
  • ← here
  • there →
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

Info

  • Rating 5,876–th
  • Date of birth June 22, 1982
  • Activity 8/25/20, 4:30 PM
  • Registered July 10, 2008

Contribution to hubs

  • Social networks and communities 134
  • Perl 28
  • Data Mining 15
  • Data visualization 15
  • Machine learning 15
  • Programming 15
  • Abnormal programming 13
  • Development for e-commerce 13

Your account

  • Log in
  • Sign up

Sections

  • Posts
  • Hubs
  • Companies
  • Users
  • Sandbox

Info

  • How it works
  • For Authors
  • For Companies
  • Documents
  • Agreement
  • Terms of service

Services

  • Ads
  • Subscription plans
  • Content
  • Seminars
  • Megaprojects
© 2006 – 2021 «Habr»
Language settings
About
Support
Mobile version
Language settings
Interface
Content