Как стать автором
Обновить
0
0
Alchemist @Alchemist

Пользователь

Отправить сообщение

Генерация под контролем: как обуздать мощные языковые модели

Время на прочтение 5 мин
Количество просмотров 3.1K

Intro


Если вы не проспали последние пару-тройку лет, то вы, конечно, слышали от трансформерах — архитектуре из каноничной Attention is all you need. Почему трансформеры так хороши? Например, они избегают рекуррентности, что дает им возможность эффективно создавать такое представление данных, в которое можно запихнуть очень много контекстной информации, что положительно сказывается на возможности генерации текстов и непревзойденной способности к transfer learning.


Трансформеры запустили лавину работ по language modelling — задаче, в которой модель подбирает следующее слово, учитывая вероятности предыдущих слов, то есть выучивая p(x), где x — текущий токен. Как можно догадаться, это задача совсем не требует разметки и потому в ней можно использовать огромные неаннотированные массивы текста. Уже обученная языковая модель может генерировать текст, да так хорошо, что авторы подчас отказываются выкладывать обученные модели.


Но что если мы хотим добавить немного “ручек” к генерации текста? Например, делать условную генерацию, задавая тему или контролируя другие атрибуты. Такая форма уже требует условной вероятности p(x|a), где a — это желаемый атрибут. Интересно? Поехали под кат!

Читать дальше →
Всего голосов 19: ↑18 и ↓1 +17
Комментарии 0

Выбор многоканального видеорегистратора

Время на прочтение 5 мин
Количество просмотров 120K
Видеорегистратор (DVR) — устройство, позволяющее просто и дёшево организовать видеонаблюдение.



В этой статье я расскажу о наиболее распространённом классе — регистраторах, работающих с аналоговыми видеокамерами. Такой регистратор позволяет подключить 4, 8 или 16 камер, а так же 1 или несколько микрофонов. Запись ведётся на жёсткий диск, устанавливаемый внутрь корпуса регистратора. Большинство регистраторов продаются без жёстких дисков. Диск ставится обычный компьютерный с интерфейсом SATA. К регистратору можно подключить аналоговый монитор или телевизор, VGA-монитор, некоторые имеют выход HDMI. Все современные регистраторы могут подключаться к локальной сети и интернету. Это позволяет вести наблюдение, просматривать записи и управлять регистратором с компьютера и мобильных устройств.
Локально регистратор управляется кнопками на передней панели, инфракрасным пультом ДУ и USB-мышью.

Читать дальше →
Всего голосов 41: ↑36 и ↓5 +31
Комментарии 56

+1 компьютер

Время на прочтение 16 мин
Количество просмотров 24K
   Расскажу о компьютере, который сделал себе для работы. Старался собрать оптимальную конфигурацию, поэтому, возможно, мой выбор пригодится кому-то еще. И совсем скоро — обзор ионного 1201N!

image

Осторожно, трафик!
Читать дальше →
Всего голосов 314: ↑227 и ↓87 +140
Комментарии 465

Открываем внутренний API сервиса SMS24X7 для разработчиков

Время на прочтение 2 мин
Количество просмотров 2.2K
сервис sms-рассылок sms24x7Давать доступ во «внутреннюю кухню» сервисов становится хорошим трендом: Гугл, Яндекс, Mailchimp и многие другие открывают API для работы даже с «внутренними» функциями своих сервисов. Спустя месяц после запуска SMS24X7.RU мы гордостью представляем Вам полное API к нашему сервису. Наша компания всегда старалась быть немного впереди игроков на рынке смс-рассылок и поэтому первые создали API, включающее СМС-шлюз и все функции для работы с настройками, адресной книгой и СМС-рассылками. Одним словом — абсолютно со всем!

Надо отметить, что архитектурное решение по введению API в качестве backend'а для нашего WEB-сервиса СМС-рассылок доставило нам небольшую головную боль. Зато позволило естественным образом отделить процесс разработки WEB-интерфейса. Таким образом, всё, что есть в сервисе оказалось доступно через API.

Допустим, что рассказывать о том, зачем нужен СМС-шлюз никому не надо. Все эти СМС-напоминания, СМС-уведомления и СМС-информирование изрядно утомляют, когда заставляют, в основном, не по делу звенеть и дергаться Ваш телефон. Но как быть, если надо разместить форму сбора мобильных номеров на сайте, интегрировать СМС-рассылки к заказчику в личный кабинет или отобразить у себя статистики по использованию СМС-шлюза? Ответ простой — используйте наше API.

Далее про API, создание документации на Doxygen и уникальное предложение по смс-шлюзу
Всего голосов 65: ↑53 и ↓12 +41
Комментарии 112

Исследуем производительность JOIN в MySQL

Время на прочтение 4 мин
Количество просмотров 37K
Я думаю, ни для кого не секрет, что JOIN считается достаточно дорогой операцией, и многих начинающих программистов (которые юзают MySQL) любят запугивать, что JOIN — это плохо, и лучше всего обойтись без них, если есть возможность.

Давайте исследуем этот вопрос более подробно и посмотрим, действительно ли JOIN — это плохо, и когда вообще стоит задумываться об этом.
Читать дальше →
Всего голосов 103: ↑81 и ↓22 +59
Комментарии 90

Свет и освещение

Время на прочтение 7 мин
Количество просмотров 165K
Часто (в том числе и на хабре) всплывает вопрос освещения, особенно «нанотехнологиченого» светодиодного и зачастую говны священных войн «светодиод» против люминисцентных ламп начинают подбурливать. Больше года я уже собирался написать статью о свете, и оно наконец свершилось.
Из этой статьи вы узнаете почему в фотостудиях не снимают с люминесцентными лампами, почему светодиоды до сих пор не захватили мир и стоит ли ими освещать улицы. Поехали!
Читать дальше →
Всего голосов 302: ↑297 и ↓5 +292
Комментарии 208

Создаем свой SVN сервер: 3$ и 30 минут

Время на прочтение 4 мин
Количество просмотров 13K
Многих хабрачитателей иногда волнует вопрос хостинга SVN. В интернете полно вариантов захостить SVN репозиторий, с ценой порядка 10-15уе в месяц, но смущает одно: хостинг репозитория — намного более ответственное дело, нежели хостинг сайта. В коде — ваши «сверхценные идеи», от аптайма сервера и надежности бэкапов напрямую зависит работа вашего бизнеса. Некоторые выбирают все же хостить SVN в серьёзных компаниях. Хорошее сравнение по параметрам тут: http://www.svnhostingcomparison.com/, open-source кстати можно захостить в неплохом месте на букву G ;-).

Другие же, как и я, решают хостить SVN на своём VDS / Dedicated сервере. На этом вопросе я и остановлюсь, рассказав заодно немного о вариантах запуска/настройки svn сервера (в том числе относительно новых — шифрование/аутентификация SASL и хранение в FS). Выльеться все это вам в 3-4$/месяц, в полный контроль за бэкапами и доступом к серверу. Пожертвовать придется 30 минут драгоценного времени на настройку.

Целевая аудитория: начальный — средний уровень опыта работы с Linux.
PS. Я в курсе что FreeBSD is not Linux ;-)
Читать дальше →
Всего голосов 79: ↑73 и ↓6 +67
Комментарии 78

Готовим ПК к летнему отопительному периоду (часть 1)

Время на прочтение 12 мин
Количество просмотров 42K


Хоть пока еще за окном полно снега и лютуют морозы, но скоро, очень скоро, придет март, а вместе с ним графический чип NVIDIA Fermi (будем называть его по кодовому имени, так как производитель путается в показаниях – то GT300, то GT400…), набухнут почки и кошелечки заядлых геймеров, которые, не смущаясь ценой новинки примерно в 1000 американских президентов, побегут апгрейдиться, а это значит, что рачительный любитель виртуальных развлечений скоро сможет взять с рук по весьма сходной цене предыдущий флагман «зеленого» флота – NVIDIA GeForce 295, лучшую подругу Crysis Warhead. Если его слегка подразогнать, то на первых порах можно будет выглядеть неплохо даже на фоне счастливых обладателей недешевого свежака.
Внимание! Под катом 36 фотографий.
Читать дальше →
Всего голосов 81: ↑67 и ↓14 +53
Комментарии 90

LogParser — привычный взгляд на непривычные вещи

Время на прочтение 5 мин
Количество просмотров 55K
Когда я в очередной раз использовал LogParser, то чтобы проникнуться и чужим опытом, ввел его название в поиск на Хабре. Как результат — сообщение «Удивительно, но поиск не дал результатов». Вот уж воистину удивительно, когда столь интересный инструмент обойден вниманием. Пришла пора восполнить этот пробел. Итак, встречайте LogParser. Маленькая, но чертовски полезная утилита для любителей SQL.

Из названия инструмента, казалось бы, очень непросто понять, что он делает в разделе SQL. А правда заключается в том, что он такой же LogParser, как и ChartGenerator. В то смысле, что он справляется с обоими задачами с одинаковыми успехом. В целом я бы его охарактеризовал как SQL-процессор гетерогенных данных. Концепция работы в общем такова, что он берет данные из некоторого формата и преобразует их в табличный вид (собственно говоря, только на этом этапе и выполняется иногда парсинг). Затем, посредством выполнения над этими табличными данными некоторого SQL-запроса формирует таблицу с результатом и сохраняет ее опять же в некотором формате. Если коротко, то цепочка выглядит как подготовка входных данных->SQL-процессинг->генерация выходных данных.
Читать дальше →
Всего голосов 56: ↑46 и ↓10 +36
Комментарии 17

Ext.Календарь

Время на прочтение 1 мин
Количество просмотров 2.8K
imageMyCalendar — это расширенная версия стандартного ExtJS-календаря. Календарик не привязан к конкретному бэкэнду т.к. работает только с JSON данными, а их хоть из ассемблера кидай =). На сайте автора уже представлено два бэкэнда на Grails и PHP в качестве демо для лучшего понимания внутреннего устройства.

Протестировано в IE, FF, Chrome.
Товарисчь anotherpit подсказывает, что в Opera все тоже работает (на первый взгляд).

Читать дальше →
Всего голосов 42: ↑34 и ↓8 +26
Комментарии 22

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность