Статьи / Закладки / Профиль Dekakhrone / Хабр

Антон Дробышев @Dekakhrone

Руководитель проектов по машинному обучению

Профиль Публикации 1Комментарии 7Закладки 159

AntonZPara 9 окт 2019 в 13:10

Чат-бот на RASA: опыт Parallels

7 мин

11K

Блог компании ParallelsМашинное обучение*Софт

В настоящее время бурно развивается индустрия чат-ботов. Сначала они были достаточно глупыми и могли вести диалог с пользователем, являясь ведущими и предлагая возможные ответы. Потом боты слегка поумнели и начали требовать от пользователя текстового ввода, чтобы из ответов вытаскивать ключевые слова. Развитие машинного обучения привело к появлению возможности общаться с ботом еще и голосом. Однако, большая часть решений не сильно далеко ушла от все того же построения графа диалогов и перехода между его узлами по ключевым словам.

Читать дальше →

+11

DairMustakhimov 7 окт 2022 в 11:17

Как мы доработали чат-бота «Дану» и сделали её проницательнее и сообразительнее

9 мин

3.3K

Блог компании Beeline КазахстанИскусственный интеллектBig Data*

Привет! Меня зовут Даир, я Data Scientist. Эту статью мы писали вместе с Санжаром, моим коллегой, который тоже занимался проектом. Мы расскажем, как научили понимать любые клиентские запросы уже разработанным ранее в Beeline чат-бота.

Фраза «понимание клиента» для нас значит следующее: клиент пишет текстовый запрос с описанием своей проблемы, если чат-бот может уловить суть проблемы, ее тематику и намерение, мы считаем, что мы справились со своей задачей. Намерение клиента в текстовом запросе мы называем «интент» (intent).

Улучшаем чат-бот

+11

ZlodeiBaal 18 янв в 03:50

«Пора ли гнать на мороз Computer Vision — scientist'ов ?» (Fondation Models и вокруг)

Средний

8 мин

17K

Блог компании RecognitorАлгоритмы*Обработка изображений*Машинное обучение*Искусственный интеллект

Аналитика

Прошлый год в Computer Vision запомнился тем, что появилось множество больших претрейненных сетей (Fondation Models). Самая известная - GPT4v (ChatGPT с обработкой изображений).
В статье я попробую простым языком объяснить что это такое (для тех кто пропустил), как меняет индустрию. Какие задачи стало проще решать. Какие продукты появились в последнее время и появятся в будущем.
И можно ли уже выгнать на мороз лишних "ресерчеров"?!

+65

visualcomments 18 янв в 08:30

Делаем обучающие датасеты для больших языковых моделей

Простой

12 мин

8.3K

Машинное обучение*

Кейс

Дообучение больших языковых моделей на кастомных датасетах делает модели гораздо сообразительнее. Есть история успеха датасета alpaca. Он творит чудеса с моделями, которые сначала если и умели что-то делать, то делали это очень плохо. Мы решили понять, как это делается, а главное - какие проблемы есть на этом пути и могут ли новички вроде нас разобраться в этом. История взлетов и падений - под катом.

+13

Asya_Dyu 16 фев 2023 в 17:01

C Днём Рождения, Герои Меча и Магии 3

11 мин

16K

Блог компании Timeweb CloudДизайн игр*Игры и игровые консолиИстория ITРазработка игр*

Помните этот диск? 16 февраля 1999 года – именно в этот день 24 года назад был готов мастер-диск «Heroes of Might and Magic III».

Вот тут на Хабре очень круто написали про историю всей серии, я постараюсь добавить то, чего еще было про третью часть. А вы знали, что

«Heroes of Might and Magic III» — любимая часть Джона Ван Кэнегема, создателя всей серии.
Разработчики потратили на третью часть ровно 14 месяцев и уложились в изначальный план, что большая редкость для геймдев индустрии.
Серия «Heroes of Might and Magic» появилась благодаря ежедневным просьбам жены Джона Ван Кэнегема, до этого компания полностью фокусировалась на «Might and Magic».
Во время разработки рабочий билд Героев 3 слил в сеть 14-летний подросток. Дважды.
Портрет Сэра Мюллиха из замка с людьми — это портрет продюсера HoMM3, подарок от коллектива к рождению сына.
Команда из 20 художников создала более 10 000 тайлов для игры.
Тема для Rampart вдохновлена армянской музыкой.
Композитор музыки для HoMM Пол Ромеро никогда не играл в HoMM.
Артдиректор HoMM 3 ненавидела оранжевый цвет.
Крэг Хак — герой школьных ролёвок Ван Кэнегема.
Баланс Героев изначально обсчитывали и тестировали в Excel.
Имена рыцарям из человеческого замка нарративщик придумывал дольше, чем их биографии.

Я веду ламповый Telegram-канал GameDEVils и блог на Substack . Заглядывайте в гости, я делюсь там материалами про геймдизайн, разработку и историю игр ^__^

Читать дальше →

+63

grajdaninrossii 21 янв в 10:42

Python и чистая архитектура…

Средний

12 мин

26K

Python*API*

Из песочницы

Всем привет! Сегодня я хочу поделиться своими опытом разработки на различных языках программирования и размышлениями касаемо проектирования серверных приложений. Речь пойдет про много обсуждаемую в последнее время чистую архитектуру в рамках языка python. Казалось бы, по заветам Роберта Мартина мы не должны зависеть от инструмента(зачастую под этим понимают фреймворк или библиотеку), однако это порождает множество ошибок и просто небольших неточностей в проектировании сервисов и даже выборе языка программирования.

И на заметку, моя цель в данной статье показать и рассказать свое видение с точки зрения практики, без особого углубления в базовую душную теорию. Однако ссылочки на статьи и информацию никуда не пропадут.

+10

Mark_K 22 янв в 09:15

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

8 мин

6.9K

Машинное обучение*

Туториал

В вводной части обзора мы познакомились с концепцией Retrieval Augmented Generation (RAG) и её расширением через методологию RAGAS (Retrieval Augmented Generation Automated Scoring). Мы разобрались, как RAGAS подходит к процессу оценки эффективности и точности RAG-систем.

В этой части мы более подробно рассмотрим техническую сторону RAGAS. Как обычно, начнем с более простых и интуитивно понятных примеров, потом перейдем к более сложным сценариям.

+13

alexwortega 23 янв в 08:43

Вихрь — семейство переведенных русскоязычных LLM

Средний

5 мин

22K

Natural Language Processing*

Кейс

Мы русифицировали Mistral и он работает лучше(по бенчмаркам) чем закрытые русскоязычные LLM. Как мы это сделали, ссылки на модели и бенчмарки - в статье.

+36

BraveSoftware 22 янв в 11:56

CodeLLM теперь в Поиске Brave

Простой

3 мин

1.5K

Блог компании BraveПоисковые технологии*Искусственный интеллектБраузеры

Кейс

Перевод

Поиск Brave теперь включает в себя CodeLLM на основе ИИ для запросов, связанных с программированием. CodeLLM совмещает глубину и качество поисковой выдачи с возможностями резюмирования и объяснения больших языковых моделей. CodeLLM предоставляет программистам возможность получить сгенерированные ИИ фрагменты кода на основе результатов поиска, а также пошаговые объяснения к ним и ссылки на цитируемые материалы, которые можно применять в целях валидации результатов выдачи. CodeLLM бесплатна и интегрирована в Поиск Brave, так что пользователям не требуется переключаться между приложениями и подвергать свою конфиденциальность риску.

+10

varagian 22 янв в 10:25

Это один из лучших подходов к изучению английского, что я видел за последние годы — коллокации

7 мин

123K

Изучение языковЛайфхаки для гиковУчебный процесс в IT

Туториал

Значение слова – это его использование в языкеЛюдвиг Витгенштейн (сурс)

Что это вообще за магия такая? Коллокация – это просто пара или группа слов, которые часто возникают вместе. Такие комбинации звучат естественно для носителей языка, однако, тем, у кого язык не родной, бывает сложно догадаться до этой естественной комбинации.

А что если я скажу, что они улучшают сразу и вашу способность органично говорить, и канонично писать, и что совсем удивительно воспринимать английский от носителей языка на слух? И главный вопрос, который меня мучает – почему я узнал об этой технике изучения языка только полгода назад? (Рассказ об этой подготовке здесь.)

Внимательно посмотрите на пример с картинки. Как только собеседник начал(а) произносить “pitch d…” ваш мозг, зная нужные коллокации, подскажет, что там должно быть “dark”. Даже если вы плохо расслышали эту часть. Это один из механизмов, через который коллокации позволяют лучше воспринимать язык на слух.

Подробнее о том, как их учить и использовать и будет эта статья.

Disclaimer: если у вас филологическое образование, то вам наверное будет смешно, что кто-то открыл для себя коллокации и их использование для изучения иностранного языка в 202N году, а вот если вы, как и я, когда-то читали “randomize” как “рандомизе”, то возможно эта статья будет вам полезной.

Добро пожаловать под кат

+95

116

makovich 22 янв в 16:11

История будущего. Что ждёт Землю, Вселенную и человечество миллиарды лет спустя (конспект книги Антона Нелихова)

Простой

2 мин

5.2K

Читальный залНаучно-популярное

Обзор

В отличие от событий наступающего года, отдаленное будущее нашей планеты можно предсказать достаточно точно (на основе прошлых данных и наблюдений за другими планетами и звездами). Итак, "что будет дальше"?

Через 50 тысяч лет

Вся планета — громадный ледник (если кто не знал, мы уже 34 млн лет живем в ледниковом периоде и сейчас наслаждаемся его теплой частью;). На небе — ни облачка, влаги мало, времен года нет, есть только зима.

Моря и океаны уменьшатся в размерах, Средиземное море высохнет, а джунгли превратятся в степи, Земля станет планетой холодных пустынь, ледников, засухи, ветра и пыли.

Через 250 млн лет

Самое долгое и жаркое лето на планете. Ледники начнут таять, создавая громадные потопы. На планете есть только один континент (как когда-то была Пангея). В нашем случае — Африка соединиться с Евразией, и к ним добавятся Австралия, обе Америки и Антарктида. В центре этого суперконтинента будет гигантская пустыня величиной с несколько Австралий, ближе к воде — леса из потомков кактусов и бамбука.

ph_piter 22 янв в 17:29

Книга «Гейм-дизайн: как создаются игры»

9 мин

13K

Блог компании Издательский дом «Питер»Unity*Дизайн игр*Профессиональная литература*Разработка игр*

Привет, Хаброжители!

Узнайте, как придумать и создать свою первую игру. Загляните за кулисы гейм-дизайна и глубоко погрузитесь в теорию и техническую сторону разработки видеоигр.

Книга затрагивает теорию гейм-дизайна, практические особенности реализации игр в различных жанрах, их внутренние механизмы и самые успешные проекты в конкурентном игровом мире. Майкл Киллик, получивший премию BAFTA за наставничество молодых дизайнеров видеоигр, познакомит вас с техническими аспектами разработки игр и поделится приемами, которые помогут сделать первые шаги на пути создания собственных проектов. Вы поймете особенности игровой индустрии и будете разбираться во всех этапах создания игрового продукта, от идеи до разработки и выпуска игры.

Читать дальше →

Boctopr 13 янв в 03:41

Книги, о которых редко говорят

4 мин

49K

Программирование*Математика*Профессиональная литература*Читальный залНаучно-популярное

Дал ему подборку книг, он приходит месяца через два, и с порога такой сразу:
— Я с друзьями не могу разговаривать.
— Ну да есть такой, недостаточек.
интервью Жака Фреско

+87

haqreu 14 янв в 19:43

Компилятор за выходные: синтаксические деревья

Средний

11 мин

27K

Python*Программирование*Алгоритмы*Компиляторы*Математика*

Туториал

Вам когда-нибудь приходилось задаваться вопросом, как работает компилятор, но так руки и не дошли разобраться? Тогда этот текст для вас. Мне тоже не доводилось заглядывать под капот, но тут так случилось, что мне нужно прочитать курс лекций о компиляторах местным третьекурсникам. Кто встречался с некомпетентными преподавателями? Здравствуйте, это я :)

Итак, чтобы самому разобраться в теме, я собираюсь написать транслятор с эзотерического языка программирования wend (сокращение от week-end), который я только что сам придумал, в обычный ассемблер. Задача уложиться в несколько сотен строк питоновского кода. Основной репозиторий живёт на гитхабе (не забудьте заглянуть в мой профиль и посмотреть другие tiny* репозитории).

+74

InlyIT 18 янв в 14:59

Репутация эксперта ускоряет карьерный рост

7 мин

1.8K

Блог компании InlyITКарьера в IT-индустрииУчебный процесс в IT

Перевод

Чтобы выйти на уровень сениора, необходимо увеличивать масштабы деятельности, влияние на результат и уровень ответственности. Один из лучших способов этого добиться – стать человеком, к которому по той или иной проблеме обращаются в первую очередь, иными словами, экспертом.

Можно стать экспертом по базам данных, экспертом по Python, экспертом по кэшированию, экспертом по фронтенду, экспертом по Typescript и так далее. Кроме того, можно стать экспертом по определенному компоненту продукта, например экспертом по процессу онбординга, экспертом по платежным порталам или экспертом по ленте домашней страницы.

Если не верите, что это имеет настолько большое значение – посмотрите на критерии, согласно которым повышают в крупнейших технических компаниях. В критериях Google упоминается, что нужно «быть признанным специалистом по какой-либо теме». В требованиях к программистам-сениорам у Square говорится: «…техническая реализация: обладает продвинутыми навыками в одной или нескольких областях». В требованиях к программистам-сениоров у Etsy читаем следующее: «программисты этого уровня обычно выказывают высокую квалификацию в определенной теме, или продвинутые навыки по набору различных тематик».

Читать дальше →

ph_piter 17 янв в 17:57

Книга «System Design. Машинное обучение. Подготовка к сложному интервью»

10 мин

12K

Блог компании Издательский дом «Питер»Алгоритмы*ИнтервьюМашинное обучение*Профессиональная литература*

Привет, Хаброжители!

Собеседования по проектированию систем машинного обучения — самые сложные. Если нужно подготовиться к такому, книга создана специально для вас.

Также она поможет всем, кто интересуется проектированием систем МО, будь то новички или опытные инженеры.

Что внутри?

О чем на самом деле спрашивают на собеседовании по System Design в МО и почему (инсайдерская информация!).
7 основных шагов для решения любой задачи МО, предлагаемой на собеседовании.
10 вопросов из реальных собеседований по System Design в МО с подробным разбором ответов.
211 диаграмм, которые наглядно объясняют, как работают различные системы.

Читать дальше →

+17

PatientZero 18 янв в 10:16

Как работают трансформеры: разбираем математику

Средний

28 мин

20K

Математика*Машинное обучение*Искусственный интеллект

Туториал

Перевод

В этом посте я представлю подробный пример математики, используемой внутри модели трансформера, чтобы вы получили хорошее представление о работе модели. Чтобы пост был понятным, я многое упрощу. Мы будем выполнять довольно много вычислений вручную, поэтому снизим размерность модели. Например, вместо эмбеддингов из 512 значений мы используем эмбеддинги из 4 значений. Это позволит упростить понимание вычислений. Мы используем произвольные векторы и матрицы, но при желании вы можете выбрать собственные значения.

Как вы увидите, математика модели не так уж сложна. Сложность возникает из-за количества этапов и количества параметров. Перед прочтением этой статьи я рекомендую прочитать пост Illustrated Transformer (или читать их параллельно) [перевод на Хабре]. Это отличный пост, объясняющий модель трансформера интуитивным (и наглядным!) образом, поэтому я не буду объяснять то, что уже объяснено в нём. Моя цель заключается в том, чтобы объяснить, как работает модель трансформера, а не что это такое. Если вы хотите углубиться в подробности, то изучите известную статью Attention is all you need [перевод на Хабре: первая и вторая части].

+40

hipnosis 20 дек 2023 в 19:09

Как прогнозировать время выполнения задач

Сложный

20 мин

40K

Блог компании Т-БанкИсследования и прогнозы в IT*Управление проектами*

Аналитика

Лучший Техноавтор 2023

Привет! Меня зовут Павел Ахметчанов, я руководитель направления улучшения процессов разработки. В статье расскажу про часто используемые методики оценок задач и есть ли в них ошибки. Посмотрим, как правильно ставить вопросы при оценке. Узнаем, что собой представляет время решения задач, а это далеко не очевидная вещь. Попробуем изменить свое мышление и получим рецепт для определения времени решения задач.

Если спросить любого начинающего исследователя этой темы «А зачем нам оценка?», он скажет, что постоянно задают вопрос «Когда вы выполните эту задачу?», на который и надо ответить с помощью этой оценки. А что, если сам вопрос задан неверно?

+66

Shyhartskoi 30 янв 2023 в 17:01

Введение в нечёткую логику

9 мин

22K

Блог компании Timeweb CloudАлгоритмы*Программирование*

Туториал

Перевод

Вы когда-нибудь подумывали написать такой алгоритм, в соответствии с которым приложение само принимало бы решения, либо справлялось с какими-нибудь странными действиями, при помощи которых клиент отчаянно пытается его сломать?

Создавая такой алгоритм, вы заметите, что просто замусориваете ваш код логикой if-else (пока он не превратится в кашу), а самим вам начинает казаться, что вот так просто не прокатит.

Итак, если только вас не пробирает дрожь от математики – читайте дальше. Здесь в дело вступает нечёткая логика! Немного контекста: слово «нечёткий» (англ. «fuzzy») в данном случае означает «труднопонимаемый» — таков может быть, например, код вашего коллеги.

В этом посте я постараюсь объяснить нечёткую логику и объяснить, как она работает.

Читать дальше →

+21

solid_93 12 авг 2016 в 10:54

Основы компьютерных сетей. Тема №1. Основные сетевые термины и сетевые модели

14 мин

1.4M

Cisco*IT-инфраструктура*Сетевые технологии*Системное администрирование*

Туториал

Всем привет. На днях возникла идея написать статьи про основы компьютерных сетей, разобрать работу самых важных протоколов и как строятся сети простым языком. Заинтересовавшихся приглашаю под кат.

Читать дальше →

+25

1 2

4 5 6 7 8

Чат-бот на RASA: опыт Parallels

Как мы доработали чат-бота «Дану» и сделали её проницательнее и сообразительнее

«Пора ли гнать на мороз Computer Vision — scientist'ов ?» (Fondation Models и вокруг)

Делаем обучающие датасеты для больших языковых моделей

C Днём Рождения, Герои Меча и Магии 3

Python и чистая архитектура…

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

Вихрь — семейство переведенных русскоязычных LLM

CodeLLM теперь в Поиске Brave

Это один из лучших подходов к изучению английского, что я видел за последние годы — коллокации

История будущего. Что ждёт Землю, Вселенную и человечество миллиарды лет спустя (конспект книги Антона Нелихова)

Книга «Гейм-дизайн: как создаются игры»

Книги, о которых редко говорят

Компилятор за выходные: синтаксические деревья

Репутация эксперта ускоряет карьерный рост

Книга «System Design. Машинное обучение. Подготовка к сложному интервью»

Как работают трансформеры: разбираем математику

Как прогнозировать время выполнения задач

Введение в нечёткую логику

Основы компьютерных сетей. Тема №1. Основные сетевые термины и сетевые модели

Информация

Специализация