Articles / Bookmarks / Profile of Alchemist / Habr

Alchemist @Alchemist

User

Profile Publications Comments 29Bookmarks 10

egor_labintcev Apr 30 2020 at 20:52

Генерация под контролем: как обуздать мощные языковые модели

5 min

3.2K

Algorithms*Machine learning*Natural Language Processing*

Intro

Если вы не проспали последние пару-тройку лет, то вы, конечно, слышали от трансформерах — архитектуре из каноничной Attention is all you need. Почему трансформеры так хороши? Например, они избегают рекуррентности, что дает им возможность эффективно создавать такое представление данных, в которое можно запихнуть очень много контекстной информации, что положительно сказывается на возможности генерации текстов и непревзойденной способности к transfer learning.

Трансформеры запустили лавину работ по language modelling — задаче, в которой модель подбирает следующее слово, учитывая вероятности предыдущих слов, то есть выучивая p(x), где x — текущий токен. Как можно догадаться, это задача совсем не требует разметки и потому в ней можно использовать огромные неаннотированные массивы текста. Уже обученная языковая модель может генерировать текст, да так хорошо, что авторы подчас отказываются выкладывать обученные модели.

Но что если мы хотим добавить немного “ручек” к генерации текста? Например, делать условную генерацию, задавая тему или контролируя другие атрибуты. Такая форма уже требует условной вероятности p(x|a), где a — это желаемый атрибут. Интересно? Поехали под кат!

Читать дальше →

+17

AlexeyNadezhin Feb 21 2013 at 22:55

Выбор многоканального видеорегистратора

5 min

121K

Computer hardwareCar Gadgets

Видеорегистратор (DVR) — устройство, позволяющее просто и дёшево организовать видеонаблюдение.

В этой статье я расскажу о наиболее распространённом классе — регистраторах, работающих с аналоговыми видеокамерами. Такой регистратор позволяет подключить 4, 8 или 16 камер, а так же 1 или несколько микрофонов. Запись ведётся на жёсткий диск, устанавливаемый внутрь корпуса регистратора. Большинство регистраторов продаются без жёстких дисков. Диск ставится обычный компьютерный с интерфейсом SATA. К регистратору можно подключить аналоговый монитор или телевизор, VGA-монитор, некоторые имеют выход HDMI. Все современные регистраторы могут подключаться к локальной сети и интернету. Это позволяет вести наблюдение, просматривать записи и управлять регистратором с компьютера и мобильных устройств.
Локально регистратор управляется кнопками на передней панели, инфракрасным пультом ДУ и USB-мышью.

Читать дальше →

+31

Boomburum Apr 19 2010 at 21:39

+1 компьютер

16 min

24K

Computer hardwareDesktop PC's

Расскажу о компьютере, который сделал себе для работы. Старался собрать оптимальную конфигурацию, поэтому, возможно, мой выбор пригодится кому-то еще. И совсем скоро — обзор ионного 1201N!

Осторожно, трафик!

Читать дальше →

+140

465

dsosnin May 3 2011 at 11:44

Открываем внутренний API сервиса SMS24X7 для разработчиков

2 min

2.3K

Self Promo

Давать доступ во «внутреннюю кухню» сервисов становится хорошим трендом: Гугл, Яндекс, Mailchimp и многие другие открывают API для работы даже с «внутренними» функциями своих сервисов. Спустя месяц после запуска SMS24X7.RU мы гордостью представляем Вам полное API к нашему сервису. Наша компания всегда старалась быть немного впереди игроков на рынке смс-рассылок и поэтому первые создали API, включающее СМС-шлюз и все функции для работы с настройками, адресной книгой и СМС-рассылками. Одним словом — абсолютно со всем!

Надо отметить, что архитектурное решение по введению API в качестве backend'а для нашего WEB-сервиса СМС-рассылок доставило нам небольшую головную боль. Зато позволило естественным образом отделить процесс разработки WEB-интерфейса. Таким образом, всё, что есть в сервисе оказалось доступно через API.

Допустим, что рассказывать о том, зачем нужен СМС-шлюз никому не надо. Все эти СМС-напоминания, СМС-уведомления и СМС-информирование изрядно утомляют, когда заставляют, в основном, не по делу звенеть и дергаться Ваш телефон. Но как быть, если надо разместить форму сбора мобильных номеров на сайте, интегрировать СМС-рассылки к заказчику в личный кабинет или отобразить у себя статистики по использованию СМС-шлюза? Ответ простой — используйте наше API.

Далее про API, создание документации на Doxygen и уникальное предложение по смс-шлюзу

+41

112

youROCK Jun 20 2011 at 00:22

Исследуем производительность JOIN в MySQL

4 min

37K

MySQL*

Я думаю, ни для кого не секрет, что JOIN считается достаточно дорогой операцией, и многих начинающих программистов (которые юзают MySQL) любят запугивать, что JOIN — это плохо, и лучше всего обойтись без них, если есть возможность.

Давайте исследуем этот вопрос более подробно и посмотрим, действительно ли JOIN — это плохо, и когда вообще стоит задумываться об этом.

Читать дальше →

+59

BarsMonster Apr 5 2011 at 11:14

Свет и освещение

7 min

165K

DIY

Часто (в том числе и на хабре) всплывает вопрос освещения, особенно «нанотехнологиченого» светодиодного и зачастую говны священных войн «светодиод» против люминисцентных ламп начинают подбурливать. Больше года я уже собирался написать статью о свете, и оно наконец свершилось.
Из этой статьи вы узнаете почему в фотостудиях не снимают с люминесцентными лампами, почему светодиоды до сих пор не захватили мир и стоит ли ими освещать улицы. Поехали!

Читать дальше →

+292

208

BarsMonster Feb 13 2009 at 08:40

Создаем свой SVN сервер: 3$ и 30 минут

4 min

14K

Configuring Linux*

Многих хабрачитателей иногда волнует вопрос хостинга SVN. В интернете полно вариантов захостить SVN репозиторий, с ценой порядка 10-15уе в месяц, но смущает одно: хостинг репозитория — намного более ответственное дело, нежели хостинг сайта. В коде — ваши «сверхценные идеи», от аптайма сервера и надежности бэкапов напрямую зависит работа вашего бизнеса. Некоторые выбирают все же хостить SVN в серьёзных компаниях. Хорошее сравнение по параметрам тут: http://www.svnhostingcomparison.com/, open-source кстати можно захостить в неплохом месте на букву G ;-).

Другие же, как и я, решают хостить SVN на своём VDS / Dedicated сервере. На этом вопросе я и остановлюсь, рассказав заодно немного о вариантах запуска/настройки svn сервера (в том числе относительно новых — шифрование/аутентификация SASL и хранение в FS). Выльеться все это вам в 3-4$/месяц, в полный контроль за бэкапами и доступом к серверу. Пожертвовать придется 30 минут драгоценного времени на настройку.

Целевая аудитория: начальный — средний уровень опыта работы с Linux.
PS. Я в курсе что FreeBSD is not Linux ;-)

Читать дальше →

+67

Donny Feb 14 2010 at 13:28

Готовим ПК к летнему отопительному периоду (часть 1)

12 min

42K

ИД iZine corporate blog

Хоть пока еще за окном полно снега и лютуют морозы, но скоро, очень скоро, придет март, а вместе с ним графический чип NVIDIA Fermi (будем называть его по кодовому имени, так как производитель путается в показаниях – то GT300, то GT400…), набухнут почки и кошелечки заядлых геймеров, которые, не смущаясь ценой новинки примерно в 1000 американских президентов, побегут апгрейдиться, а это значит, что рачительный любитель виртуальных развлечений скоро сможет взять с рук по весьма сходной цене предыдущий флагман «зеленого» флота – NVIDIA GeForce 295, лучшую подругу Crysis Warhead. Если его слегка подразогнать, то на первых порах можно будет выглядеть неплохо даже на фоне счастливых обладателей недешевого свежака.
Внимание! Под катом 36 фотографий.

Читать дальше →

+53

StanEgo Feb 27 2010 at 13:10

LogParser — привычный взгляд на непривычные вещи

5 min

56K

SQL*

Когда я в очередной раз использовал LogParser, то чтобы проникнуться и чужим опытом, ввел его название в поиск на Хабре. Как результат — сообщение «Удивительно, но поиск не дал результатов». Вот уж воистину удивительно, когда столь интересный инструмент обойден вниманием. Пришла пора восполнить этот пробел. Итак, встречайте LogParser. Маленькая, но чертовски полезная утилита для любителей SQL.

Из названия инструмента, казалось бы, очень непросто понять, что он делает в разделе SQL. А правда заключается в том, что он такой же LogParser, как и ChartGenerator. В то смысле, что он справляется с обоими задачами с одинаковыми успехом. В целом я бы его охарактеризовал как SQL-процессор гетерогенных данных. Концепция работы в общем такова, что он берет данные из некоторого формата и преобразует их в табличный вид (собственно говоря, только на этом этапе и выполняется иногда парсинг). Затем, посредством выполнения над этими табличными данными некоторого SQL-запроса формирует таблицу с результатом и сохраняет ее опять же в некотором формате. Если коротко, то цепочка выглядит как подготовка входных данных->SQL-процессинг->генерация выходных данных.

Читать дальше →

+36

MaXyC Dec 8 2009 at 15:22

Ext.Календарь

1 min

2.8K

ExtJS/Sencha*

MyCalendar — это расширенная версия стандартного ExtJS-календаря. Календарик не привязан к конкретному бэкэнду т.к. работает только с JSON данными, а их хоть из ассемблера кидай =). На сайте автора уже представлено два бэкэнда на Grails и PHP в качестве демо для лучшего понимания внутреннего устройства.

Протестировано в IE, FF, Chrome.
Товарисчь anotherpit подсказывает, что в Opera все тоже работает ~~(на первый взгляд)~~.

Читать дальше →

+26