Статьи / Профиль dustalov / Хабр

Димочка@dustalov

Уверенный пользователь ПК

Подписчики

ПрофильСтатьи8ПостыНовостиКомментарии170

dustalov 21 авг 2023 в 13:06

Reinforcement Learning from Human Feedback: когда одной математики мало

Средний

13 мин

Big Data * Открытые данные * Машинное обучение * Искусственный интеллект

Туториал

Перевод

Сотни людей собрались на конференции ICML на туториале про обучение с подкреплением на основе отзывов (reinforcement learning from human feedback, RLHF). Докладчик спросил, кто хочет размечать данные. Пять, быть может, десять человек подняло руки. И это никого не удивило.

Что было дальше?

dustalov 16 фев 2023 в 13:29

Как Homebrew раздаёт 52 миллиона пакетов в месяц?

Средний

12 мин

4.3K

Data Engineering * Big Data * Проектирование API * Облачные вычисления * Open source *

Туториал

Перевод

Пакетный менеджер Homebrew раздаёт 52 миллиона пакетов в месяц. Чтобы это делать, он использует хранилища контейнеров, отлично подходящие для этой задачи. Как это работает?

dustalov 17 дек 2021 в 08:09

Агрегация ответов в краудсорсинге. Пример с открытой библиотекой Яндекса

4 мин

4.1K

Блог компании ЯндексМашинное обучение * КраудсорсингPython *

Туториал

Краудсорсинг позволяет размечать данные для разных задач, но популярнее всего, конечно, задачи классификации объектов — текстов и картинок. Обычно в краудсорсинге несколько человек размечают каждый объект, что требует агрегации — выбора верного ответа из представленных. Под катом я покажу, как агрегировать результат разметки с помощью двух алгоритмов: голоса большинства и алгоритма Дэвида-Скина.

Я буду использовать Crowd-Kit — нашу открытую библиотеку вычислительных методов контроля качества в краудсорсинге, которая предлагает реализации разных методов агрегации ответов, оценки неопределённости и согласованности ответов и т. д. Но вы можете воспользоваться альтернативами: spark-crowd (использует Scala вместо Python), CEKA (Java вместо Python) или Truth Inference (использует Python, но предоставляет только категориальные и числовые ответы).

Читать дальше →

+16

dustalov 6 окт 2013 в 20:25

Petrovich просклоняет русские имена

3 мин

66K

Ruby * Ruby on Rails * Программирование *

Вам часто приходится иметь дело со склонением имён пользователей на русском языке? При рассылке писем, при отображении страниц и упоминаний, при генерации рекламных объявлений? Скорее всего, приходится изворачиваться и писать все сообщения в именительном падеже — Иванов Пётр Сергеевич.

Это не всегда удобно, не всегда красиво, не всегда уместно. Русский язык одарён богатой морфологией, которая несколько затрудняет его автоматическую обработку. Всем известно, что антропонимы, как полагается именам существительным, подчиняются всем правилам словообразования.

Для решения этой проблемы при использовании Ruby существует Petrovich — удобная легковесная библиотека для автомагического склонения русскоязычных имён, фамилий и отчеств.

Склоняй меня полностью!

+148

144

dustalov 30 сен 2013 в 13:37

Чего нам ждать от Ruby 2.1?

5 мин

12K

Ruby on Rails * Ruby *

Из песочницы

Несколько дней назад Константин Хаасе, один из ключевых людей в сообществе Ruby, опубликовал запись в своём блоге, посвящённую анонсу предварительной версии Ruby 2.1. Изменений между версиями 2.0 и 2.1 накопилось достаточно, чтобы вчитаться в его изложение, и лучше — на русском языке.

Читать дальше →

+37

dustalov 1 окт 2012 в 04:37

NLPub — каталог лингвистических решений

2 мин

9.4K

Я пиарюсь

Я хочу представить NLPub — небольшую базу знаний, посвящённую компьютерной лингвистике в России.

Сейчас никого не удивить устройствами и приложениями, способными понимать и говорить на человеческом языке. В основе таких приложений лежат методы обработки естественного языка, образующие общее направление на стыке лингвистики и искусственного интеллекта.

Почему подавляющее большинство устройств, приложений и сервисов не работает с русским языком?

Читать дальше →

+44

dustalov 22 июл 2012 в 21:44

Поприветствуйте вашего старого нового друга

4 мин

MySQL * PostgreSQL *

Перевод

Сегодня разнообразные открытые СУБД встают лицом к лицу против массивных, неуклюжих и дорогостоящих «корпоративных» систем, таких как SQL Server и Oracle. Часто открытые СУБД прекрасно работают лучше закрытых систем, не уступая даже в функциональных возможностях.

Из всех открытых систем управления базами данных самой умной, производительной и функциональной системой является Postgres, которая заслуженно привлекает всё больше и больше внимания.

Читать дальше →

+75

111

dustalov 16 фев 2012 в 01:24

Встраиваемые движки пользовательских блогов для Ruby on Rails

3 мин

3.3K

Ruby on Rails *

Иногда мне кажется, что в экосистеме Ruby on Rails есть проклятое место: встраиваемые движки для ведения блогов. Это особенно мило наблюдать в свете существования бесконечного количества скринкастов «блог на Rails за 10 минут».

Судя по всему, любая попытка создать какое-либо решение для блогов в виде подключаемого модуля приводит, как правило, к одному из двух исходов: либо человека утомляет эта работа и он уходит заниматься более насущными вещами, либо движок превращается в монстра, способного сожрать любое Rails-приложение ещё до момента его инициализации.

Некоторое время назад, когда я работал в «АБАК-ПРЕСС», руководство повелело внести в милый сайтик LookMart.ru весьма модную нынче «фишечку» — пользовательские блоги (на данный момент эта функциональность находится в активной разработке). Меньше всего нам хотелось изобретать велосипед и городить очевидные вагоны из контроллеров с моделями, но после небольшой разведки пришлось смириться и сделать всё самостоятельно. Почему?

Читать дальше →

+16