Articles / Profile of dustalov / Habr

Димочка @dustalov

Уверенный пользователь ПК

Profile Publications 8Comments 171Bookmarks 3

dustalov Aug 21 2023 at 16:06

Reinforcement Learning from Human Feedback: когда одной математики мало

Medium

13 min

Big Data*Open data*Machine learning*Artificial Intelligence

Tutorial

Translation

Сотни людей собрались на конференции ICML на туториале про обучение с подкреплением на основе отзывов (reinforcement learning from human feedback, RLHF). Докладчик спросил, кто хочет размечать данные. Пять, быть может, десять человек подняло руки. И это никого не удивило.

Что было дальше?

dustalov Feb 16 2023 at 16:29

Как Homebrew раздаёт 52 миллиона пакетов в месяц?

Medium

12 min

3.5K

Open source*Cloud computing*API*Big Data*Data Engineering*

Tutorial

Translation

Пакетный менеджер Homebrew раздаёт 52 миллиона пакетов в месяц. Чтобы это делать, он использует хранилища контейнеров, отлично подходящие для этой задачи. Как это работает?

dustalov Dec 17 2021 at 11:09

Агрегация ответов в краудсорсинге. Пример с открытой библиотекой Яндекса

4 min

3.1K

Яндекс corporate blogPython*CrowdsourcingMachine learning*

Tutorial

Краудсорсинг позволяет размечать данные для разных задач, но популярнее всего, конечно, задачи классификации объектов — текстов и картинок. Обычно в краудсорсинге несколько человек размечают каждый объект, что требует агрегации — выбора верного ответа из представленных. Под катом я покажу, как агрегировать результат разметки с помощью двух алгоритмов: голоса большинства и алгоритма Дэвида-Скина.

Я буду использовать Crowd-Kit — нашу открытую библиотеку вычислительных методов контроля качества в краудсорсинге, которая предлагает реализации разных методов агрегации ответов, оценки неопределённости и согласованности ответов и т. д. Но вы можете воспользоваться альтернативами: spark-crowd (использует Scala вместо Python), CEKA (Java вместо Python) или Truth Inference (использует Python, но предоставляет только категориальные и числовые ответы).

Читать дальше →

+16

dustalov Oct 7 2013 at 00:25

Petrovich просклоняет русские имена

3 min

64K

Ruby*Ruby on Rails*Programming*

Вам часто приходится иметь дело со склонением имён пользователей на русском языке? При рассылке писем, при отображении страниц и упоминаний, при генерации рекламных объявлений? Скорее всего, приходится изворачиваться и писать все сообщения в именительном падеже — Иванов Пётр Сергеевич.

Это не всегда удобно, не всегда красиво, не всегда уместно. Русский язык одарён богатой морфологией, которая несколько затрудняет его автоматическую обработку. Всем известно, что антропонимы, как полагается именам существительным, подчиняются всем правилам словообразования.

Для решения этой проблемы при использовании Ruby существует Petrovich — удобная легковесная библиотека для автомагического склонения русскоязычных имён, фамилий и отчеств.

Склоняй меня полностью!

+149

141

dustalov Sep 30 2013 at 17:37

Чего нам ждать от Ruby 2.1?

5 min

12K

Ruby*Ruby on Rails*

From sandbox

Несколько дней назад Константин Хаасе, один из ключевых людей в сообществе Ruby, опубликовал запись в своём блоге, посвящённую анонсу предварительной версии Ruby 2.1. Изменений между версиями 2.0 и 2.1 накопилось достаточно, чтобы вчитаться в его изложение, и лучше — на русском языке.

Читать дальше →

+38

dustalov Oct 1 2012 at 08:37

NLPub — каталог лингвистических решений

2 min

9.2K

Self Promo

Я хочу представить NLPub — небольшую базу знаний, посвящённую компьютерной лингвистике в России.

Сейчас никого не удивить устройствами и приложениями, способными понимать и говорить на человеческом языке. В основе таких приложений лежат методы обработки естественного языка, образующие общее направление на стыке лингвистики и искусственного интеллекта.

Почему подавляющее большинство устройств, приложений и сервисов не работает с русским языком?

Читать дальше →

+45

dustalov Jul 23 2012 at 01:44

Поприветствуйте вашего старого нового друга

4 min

8.9K

MySQL*PostgreSQL*

Translation

Сегодня разнообразные открытые СУБД встают лицом к лицу против массивных, неуклюжих и дорогостоящих «корпоративных» систем, таких как SQL Server и Oracle. Часто открытые СУБД прекрасно работают лучше закрытых систем, не уступая даже в функциональных возможностях.

Из всех открытых систем управления базами данных самой умной, производительной и функциональной системой является Postgres, которая заслуженно привлекает всё больше и больше внимания.

Читать дальше →

+75

111

dustalov Feb 16 2012 at 05:24

Встраиваемые движки пользовательских блогов для Ruby on Rails

3 min

3.2K

Ruby on Rails*

Иногда мне кажется, что в экосистеме Ruby on Rails есть проклятое место: встраиваемые движки для ведения блогов. Это особенно мило наблюдать в свете существования бесконечного количества скринкастов «блог на Rails за 10 минут».

Судя по всему, любая попытка создать какое-либо решение для блогов в виде подключаемого модуля приводит, как правило, к одному из двух исходов: либо человека утомляет эта работа и он уходит заниматься более насущными вещами, либо движок превращается в монстра, способного сожрать любое Rails-приложение ещё до момента его инициализации.

Некоторое время назад, когда я работал в «АБАК-ПРЕСС», руководство повелело внести в милый сайтик LookMart.ru весьма модную нынче «фишечку» — пользовательские блоги (на данный момент эта функциональность находится в активной разработке). Меньше всего нам хотелось изобретать велосипед и городить очевидные вагоны из контроллеров с моделями, но после небольшой разведки пришлось смириться и сделать всё самостоятельно. Почему?

Читать дальше →

+16