Комментарии / Профиль pavel

Павел Раскин @pavel_raskin

Пользователь

Профиль Публикации Комментарии 522Закладки 81

Как мы в билайне боремся со спам-звонками с помощью машинного обучения, часть 1

pavel_raskin 8 ноя в 16:11

Фраза "пчёлы против мёда" тут подходит лучше чем где-либо.

Посмотреть

Как мы в билайне боремся со спам-звонками с помощью машинного обучения, часть 1

pavel_raskin 8 ноя в 16:07

В тексте опечатки: билайн вместо "Билайн". Или в компании маркетологи даже технарей в заложники взяли? Если так - моргните, или ещё какой знак подайте.

Посмотреть

Как я переделал освещение в подъезде на два контура и сэкономил 200 т.р. не делая ремонт, а используя умный дом

pavel_raskin 7 ноя в 11:09

И камеры заодно.

Посмотреть

Созданный в МФТИ функциональный узел радиомодуля для системы связи 5G успешно прошел испытания

pavel_raskin 2 ноя в 11:49

А кто-то тут паяет? Винтик в корпус фильтра упал - чем-то нужно было подцепить, и, судя по всему, из инструментов под рукой оказался только паяльник.

Посмотреть

Просканировать ископаемые: в МФТИ разработали импортонезависимый софт для нефтяников и золотодобытчиков

pavel_raskin 2 ноя в 11:23

разработали импортонезависимый софт

Красивые слова для презентации чиновникам. Но на ресурсах типа Хабра подобное писать - только позориться. Разработали оригинальное прикладное ПО - отлично (без сарказма), но зачем при этом заявлять то, чего в реальности нет?

Посмотреть

Восстанавливаем данные с кассеты от старого стримера

pavel_raskin 1 ноя в 11:18

Вытаскиваем кассету из стримера и видим, что ей сильно поплохело: резиновый пассик рассохся и лопнул. Чтобы избежать такого, кассеты надо перематывать примерно один-два раза в год, однако тут этого, разумеется, никто не делал.

Периодическая перемотка должна спасти саму ленту, но никак не резиновый пассик.

Посмотреть

Хабр, «Мимино» и «Ералаш» — что между ними общего, или очередные разговоры о

pavel_raskin 30 окт в 10:44

Эх...Самое забавное, что такое может прилететь по вроде бы совершенно нейтральным комментариям/обсуждениям, как этот. Ну вот "придерживается", а написать что-то для пояснения не пожелал. Подумаешь, мелочь какая-то, но получатель минуса нередко после этой "мелочи" остаётся с урезанными правами, просто из-за того, что кто-то с "другой позицией".

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 16:59

Всё оказалось не так просто:

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 13:39

Да ладно яблоки и берёза. Тут с более простыми вещами не всегда разобраться могут:

Диалог с Алисой

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 13:22

Исходно обсуждаются LLM, но почему-то проверяются они тут тестами, суть которых выходит за рамки принципиальных возможностей модели.

А тест Тьюринга предлагаю оставить историкам кибернетики. Да, когда-то он был отличным вариантом для своего времени, но сейчас не имеет никакого практического смысла.

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 12:38

Полностью согласен. Разве что про идею следующего теста и про "тут у вас ошибка" уточню: подобный тест как раз и покажет всем тестирующим, что это и есть тот самый "Т9 на стероидах" (кстати, отличное сравнение, прямо в точку), а не что-то "мыслящее" с "когнитивными способностями".

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 11:28

Так о том и речь. Дайте модели тысячи вариаций про задачу сидения на коленях и будете получать ожидаемые "верные" ответы. Но текущие модели настраиваются только на одном типе входных данных, при этом интерпретируя их "в лоб". Человек учится комплексно, учитывая не только прямой смысл данных, но и их контекст, условия получения и т.п.

Посмотреть

LLM может довольно изобретательно разгадывать хитрые загадки, но не всегда

pavel_raskin 26 окт в 11:07

Когнитивные способности LLM можно оценивать по способности мыслить логически и строить цепочки рассуждений

На мой взгляд тут нет никаких "когнитивных способностей".

Модели настраиваются ("учатся") по очень большому объёму заранее подготовленной (размеченной) входящей информации. Следовательно, на задачи "с подковырками" мы получаем от модели типичные ответы, т.е. ответы на основе преобладающих в обучающей выборке исходных данных. Но в этих исходных данных крайне мало ситуаций по сценариям такого типа задач. В объёме обучающей выборки задачи про "сидящую девушку" или "летящее яйцо" встречаются с частотой на уровне погрешности - настройте модель на сотнях вариантов каждой такой задачи, и ответы будут совершенно иные.

Но чем текущие языковые модели отличаются от человека с реальными когнитивными способностями? Тем, что человек, узнавший про задачу с необычным подтекстом и нетипичным решением, будет в следующих задачах тоже искать скрытый смысл и пытаться решить их нетривиальным способом, а модель при смене темы следующей задачи попытается решить её не делая "выводов" на основе особенностей предыдущей. Кстати, вот и идея для следующих тестов.

Посмотреть

Белгородские учёные создали установку для трёхмерной печати зданий

pavel_raskin 25 окт в 20:12

Помимо перечисленных особенностей, новая модель отличается от существующих аналогов высокой производительностью

Отличается высокой производительностью, которая разбивается о время застывания раствора.

Посмотреть

Новые кассы самообслуживания в Магните: история редизайна интерфейса

pavel_raskin 24 окт в 21:26

А кассы уже научили обрабатывать случаи когда код маркировки находится рядом со штрих-кодом?

Сомнительно. Но многие покупатели уже научились лишний код рукой прикрывать.

Посмотреть

Новые кассы самообслуживания в Магните: история редизайна интерфейса

pavel_raskin 24 окт в 21:24

Поток покупателей только в определённые часы. Ну и в конце концов камеру (уверен что она там есть) можно нагрузить банальной доп.задачей по определению смены клиента.

Посмотреть

Новые кассы самообслуживания в Магните: история редизайна интерфейса

pavel_raskin 24 окт в 21:15

Ну да, или голосовать в опросе "Оцените магазин", оставшемся от предыдущего покупателя?
Для таких случаев таймаут есть, что и предложил @Mishootk в сообщении чуть выше.

Посмотреть

Новые кассы самообслуживания в Магните: история редизайна интерфейса

pavel_raskin 24 окт в 19:11

Главный инсайт — покупатели на кассе самообслуживания не хотят задумываться, они стремятся как можно быстрее оплатить товары и уйти. Поэтому чем меньше шагов требуется для покупки, тем лучше.

Но при этом видим:
"Сколько бонусов списать?" - Спишите возможный максимум! Неужели их реально кто-то копит?
"Спасибо за покупку. Оцените магазин..." - Какая оценка? Я не хочу задумываться, а хочу просто уйти.
"Нужен чек? Да/Нет" - Сделайте по умолчанию без чека, т.к. я не хочу задумываться, а хочу просто уйти, а для редких случаев когда он кому-то нужен кнопку после завершения покупки для печати чека (можно вместо "Оцените магазин...").

Посмотреть

Автономный картографический сервер с питанием от USB

pavel_raskin 22 окт в 23:34

Сейчас есть Onyx Boox продолжающие идеологию E-Ink+Android. Их даже рутировать не требуется для установки стороннего ПО, а не как в ушедших с рынка Nook.

Посмотреть

Автономный картографический сервер с питанием от USB

pavel_raskin 22 окт в 23:30

Совсем не понимаю зачем городить дополнительную точку отказа (а то и не одну, глядя на конструктор из модулей и проводов), если по цене используемых компонентов можно купить новый телефон (или аналогичное устройство), в который отлично уместится всё необходимое ПО и данные, а если не уместится, то есть карта памяти.

Посмотреть

2 3 ...

26 27