Как стать автором
Обновить
684.95

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Понимает ли Vision Llama импрессионистов?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров444

Всем привет, меня зовут Арсений, я Data Scientist в компании Raft, и сегодня я расскажу вам про Visual Language Models (VLM).

Большие языковые модели уже стали частью нашей жизни и мы применяем их, чтобы упростить современную рутину, а так же используем для решения бизнес задач. Недавно вышло новое поколение vision transformer моделей, которые заметно упростили анализ изображений, из какой бы сферы эти изображения не были.

Особенно заметным был сентябрьский релиз Llama-3.2-11b, и не только потому что это первая vision модель от Llama, сколько потому, что с ней вместе вышло целое семейство моделей, включая маленькие на 1B и 3B параметров. А как вы знаете, меньше, значит юзабельнее.

Читать далее
Всего голосов 7: ↑7 и ↓0+11
Комментарии2

Новости

Алгоритмы. Рекурсивные функции. Часть I

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров964

Определение. Алгоритм – некоторая конечная последовательность предписаний (правил, инструкций и т.п.), однозначно определяющая процесс преобразования исходных P и промежуточных данных в результат Q решения задачи.


Теория алгоритмов - это наука, изучающая общие свойства и закономерности алгоритмов, разнообразные формальные модели их представления. На основе формализации понятия алгоритма возможно сравнение алгоритмов по их эффективности и другим показателям, проверка их эквивалентности, определение областей применимости.

Абстракция потенциальной осуществимости. Как уже отмечалось, алгоритмический процесс при выработке результата Q из исходных данных P совершает несколько отдельных шагов. Число таких шагов может быть настолько велико, что достижение результата Q является практически неосуществимым. Однако в теории алгоритмов мы не учитываем практическую неосуществимость и считаем возможным выполнить любое конечное число шагов. Это положение называется абстракцией потенциальной осуществимости. Это же положение предполагает, что мы можем оперировать со сколь угодно большими объектами, например, сколь угодно длинными словами и т.п.


Описание алгоритмов и формулирование используемых правил могут осуществляться различными математическими средствами. Каждый способ задания алгоритма характеризуется абстрактным алфавитом и математическим формализмом. При этом вводится понятие алгоритмической системы, как общего способа задания алгоритмов

Читать далее
Всего голосов 5: ↑3 и ↓2+1
Комментарии2

Как мы в билайне боремся со спам-звонками с помощью машинного обучения, часть 1

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров648

Всем привет! Меня зовут Наталья Багрова, сегодня расскажу, какие есть возможности у крупного телеком-оператора для борьбы с таким неприятным явлением как голосовой спам; какие логические и технические трудности ждали нас на этом пути, как мы их решали и к чему пришли. Мы сконцентрируемся в первую очередь на том, как мы строили модель с нуля до первого жизнеспособного прототипа.

Давайте начнем с краткого обзора рынка антиспам-услуг.

Очень условно всех поставщиков антиспам услуг можно разделить на две категории: те, кто видят трафик (телеком-операторы) и те, кто видят отзывы (приложения Яндекса, Тинькофф или Kaspersky, которые собирают отзывы с абонентов). Если посмотреть на то, как устроен дизайн услуги, то это либо блокировки, когда спам-звонок в принципе не доводится до абонента или же уводится на голосового ассистента, а затем присылается текстовая расшифровка, либо же просто подсвечивается, кто сейчас звонит, и всю ответственность за решение, разговаривать сейчас или нет, несет сам клиент. Если мы говорим о билайне, то мы себя относим в первую очередь к тем, кто видит трафик, и идем путем голосового ассистента.

Плюсы и минусы

Какие у нас есть сильные стороны?

Читать далее
Всего голосов 8: ↑4 и ↓4+3
Комментарии13

Стандартное отклонение для полных чайников

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.4K

Готов поспорить вы слышали о стандартном отклонении или кто то из колег упоминал его в разговоре (чтобы показать какой он умный и поставить вас на место). Звучит похоже на умственное отклонение, но интуиция подсказывает вам что возможно разговор тут совсем про другое? Ваша интуиция совершенно права. Настало время поставить коллег на место и разобраться что же это такое.
Вот объяснение, которое даже ваша собака сможет понять.

Читать далее
Всего голосов 11: ↑9 и ↓2+10
Комментарии8

Истории

ChatGPT как второй пилот: сильные и слабые стороны с практическими советами

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.8K

Порой очень лениво выполнять рутинную работу или писать бойлерплейт с настройкой конфигов под новый проект. Я считаю себя самым ленивым разработчиком на планете, так что эра ИИ для меня как манна небесная. Наконец-то появилась возможность отдать рутину второму пилоту. Но так ли этот пилот хорош? Больше года я использую ChatGPT в роли своего помощника и вот что я понял...

Читать далее
Всего голосов 3: ↑3 и ↓0+4
Комментарии12

Как изменится положение дел в Кремниевой Долине во время второго срока Дональда Трампа

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.3K

Дональд Трамп станет следующим президентом Соединенных Штатов, вновь вступив в должность в январе. Любое изменение администрации знаменует собой смену приоритетов, а новый лидер неизбежно отменяет некоторые из политик своего предшественника — особенно учитывая, что взгляды и политика Трампа находятся в полной противоположности к курсу предыдущей администрации.  

Вот как победа Трампа может повлиять на технологический сектор. 

Читать далее
Всего голосов 11: ↑3 и ↓8-5
Комментарии4

KAN: Kolmogorov–Arnold Networks

Уровень сложностиСложный
Время на прочтение75 мин
Количество просмотров5.6K

Предлагаю вашему вниманию полный перевод статьи об алгоритме нейронной сети на основе теоремы Колмогорова Арнольда, опубликованной исследователями из Massachusetts Institute of Technology, California Institute of Technology, Northeastern University и The NSF Institute for Artificial Intelligence and Fundamental Interactions.
В настоящее время в на просторах интернета есть лишь посты на основе данной статьи с интригующими названиями типа «Новый убийца нейросетей? Сеть Колмогорова Арнольда (KANs)» или «Исследователи разработали принципиально новую архитектуру нейросетей, которая работает лучше персептрона» и т. п. Для лучшего понимания это темы обратимся к первоисточнику, опубликованному не так давно — в апреле 2024 года.

Читать далее
Всего голосов 28: ↑26 и ↓2+29
Комментарии0

Практика: мой опыт интеграции более 50 нейронных сетей в один проект

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров4K

Статья основана на полутора годах работы по внедрению нейронных сетей в веб-приложение с открытым исходным кодом. В ней собраны практические лайфхаки для решения реальных задач и преодоления сложностей, с которыми сталкиваются разработчики.

Преодолеть открытие
Всего голосов 15: ↑11 и ↓4+9
Комментарии4

Оценка LLM: комплексные оценщики и фреймворки оценки

Время на прочтение10 мин
Количество просмотров249

В этой статье подробно описываются сложные статистические и предметно-ориентированные оценщики, которые можно использовать для оценки производительности крупных языковых моделей. В ней также рассматриваются наиболее широко используемые фреймворки оценки LLM, которые помогут вам начать оценивать производительность модели.

Читать далее
Рейтинг0
Комментарии1

ECCV 2024: как это было. Актуальные статьи и главные тренды

Время на прочтение18 мин
Количество просмотров616

Привет! Меня зовут Александр Устюжанин, и я разработчик в команде YandexART. Недавно я побывал в Милане на одной из крупнейших международных конференций по компьютерному зрению — ECCV (European Conference on Computer Vision). В этом году она проходила уже в 18-й раз, и от Яндекса я приехал не один, а в составе целой делегации специалистов по CV из разных команд. Ребята помогли собрать материалы для этой статьи, и по ходу повествования я всех обязательно представлю.

Конференция проходила с 29 сентября по 4 октября. Исследователи подали на ECCV 8585 (!) статей, а прошли отбор 2395 — получается, чуть меньше 30%. Такие масштабные конференции всегда привлекают внимание людей как из академии, так и из индустрии: от больших компаний до стартапов — люди приезжают за новой информацией, нетворкингом и атмосферой большой научной тусовки.

Программа была насыщенной, но при этом комфортной — начинали в 9 утра, заканчивали в 18 — оставалось достаточно времени на активности вне расписания. Конечно, невозможно ознакомиться с тысячами докладов, поэтому мы сверялись с расписанием и заранее решали, кто куда хочет сходить. В статье я поделюсь как своими находками, так и отзывами коллег — благодаря этому, как кажется, обзор получился разнообразным и даёт неплохое представление о том, что происходит в мире CV прямо сейчас.

Поехали!
Всего голосов 12: ↑12 и ↓0+15
Комментарии0

В чем секрет более низкой цены аренды чипов Nvidia в Китае по сравнению с США?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.4K

Привет, на связи Юлия Рогозина, аналитик бизнес-процессов Шерпа Роботикс. Сегодня я перевела для вас статью по теме, которая находится на стыке экономики и технологической составляющей развития ИИ. А именно - обходу санкций на поставки чипов Nvidia. Не смотря на ограничения, аренда облачных услуг с использованием чипов Nvidia обходится в Китае значительно дешевле, чем в США.

Читать далее
Всего голосов 4: ↑2 и ↓20
Комментарии1

Тестируем LLM для русского языка: Какие модели справятся с вашими задачами?

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.5K

В последние годы большие языковые модели (LLM) стали важной частью бизнес-решений на базе ИИ, применяемых для генерации текста и анализа данных. Однако, большинство разработок ориентированы на англоязычные проекты, что создает сложности для компаний, работающих с русскоязычными данными.

Готовые LLM для русского языка часто показывают низкую точность и ограниченные возможности. Проблемы конфиденциальности также вынуждают компании выбирать локальные модели.

Наша компания давно занимается искусственным интеллектом и стала часто получать подобные запросы от клиентов — создание ИИ-решения с локальной обработкой данных. Мы задались вопросом, какие LLM хороши для таких решений, что мы можем предложить заказчику? Всё это вылилось в большой рисеч разных языковых моделей.

В статье рассмотрим, какие LLM подходят для задач на русском языке, протестируем их по разным параметрам и выявим лидеров. Мы оценили генерацию текста, ответы на вопросы, исправление ошибок и другие функции.

Читать далее
Всего голосов 10: ↑8 и ↓2+7
Комментарии15

Сверточные нейронные сети. Создание нейросети для распознавания цифр на языке программирования Python

Уровень сложностиСредний
Время на прочтение18 мин
Количество просмотров3.2K

В современном мире искусственный интеллект и машинное обучение стремительно развиваются, меняя нашу повседневную жизнь и открывая новые горизонты в различных областях. Одной из ключевых технологий, лежащих в основе этих достижений, являются сверточные нейронные сети (Convolutional Neural Networks, CNN). Эти мощные алгоритмы позволяют эффективно обрабатывать и анализировать изображения, что находит применение в самых разных сферах: от медицинской диагностики до систем безопасности.

CNN подходит для классификации изображений, что делает её отличным выбором для задачи распознавания рукописных цифр.

Читать далее
Всего голосов 16: ↑14 и ↓2+12
Комментарии10

Ближайшие события

15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Пишем простую нейронку для адаптивного управления JVM: обучение и применение многослойной нейронной сети на Java

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров660

Данная статья является описанием моего эксперимента передать управление ресурсами JVM нейронной сети, которая будет предсказывать необходимость управления ресурсами на основе текущих данных, таких как загрузка CPU и память.

Читать далее
Всего голосов 4: ↑4 и ↓0+5
Комментарии2

Шахматная комната

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров2.6K

В 1980 году в журнале «The Behavioral and Brain Sciences» была опубликована статья философа Джона Сёрла[i] (John Searle) «Minds, Brains, and Programs», содержащая описание мысленного эксперимента «Китайская комната»[ii], критику этого эксперимента различными исследователями, а также ответы Сёрла на эту критику.

Аргумент «Китайской комнаты» оказался одним из самых обсуждаемых в когнитивистике.

Эта статья показывает очевидную ошибочность этого аргумента.

Возражение настолько простое, что мне сложно поверить, что оно не появилось раньше. Гораздо вероятнее, что этот велосипед до меня был изобретён уже много раз. Если это в самом деле так, я буду искренне признателен тем, кто найдёт и покажет мне это опровержение.

Читать далее
Всего голосов 8: ↑7 и ↓1+8
Комментарии59

Квантизация позволяет запускать Llama 3.2 на мобилках

Время на прочтение3 мин
Количество просмотров6.7K

Квантизация помогла портировать последнюю версию LLM Llama 3.2 на мобильные платформы - iOS и Android. Для этого разработчики выпустили квантованные версии Llama 3.2 1B и 3B, которые при тестах на ARM-процессорах показали высокую скорость инференса, по сравнению с несжатыми весами в формате BF16. 

Как вообще получилось, что Llama работает на мобильных процессорах, ведь для ее запуска нужен определенный программный стек, чаще всего библиотека Pytorch и CUDA на операционной системе Linux?

Дело в том, что Meta* (признана в России экстремистской организацией) используют ExecuTorch - это фреймворк, который является частью Pytorch-платформы и предназначен для запуска Pytorch-программ на мобильных девайсах. ExecuTorch поддерживается фреймворком Llama Stack для запуска моделей Llama, а именно легковесных Llama 3.2 1B и 3B, на iOS и Android. Для разработки мобильных приложений под эти платформы Llama Stack предоставляет клиентский SDK на Swift для iOS и Kotlin для Android, оба написаны под ExecuTorch бэкенд.

Какого именно уровня производительности удалось добиться новым квантованным моделям Llama?

В среднем это ускорение инференса от двух до четырех раз по сравнению с весами в формате BF16, при сохранении практически сопоставимого качества. Уменьшение размера модели на 56% - что важно для мобильного приложения, чтобы меньше места на телефоне занимало - и уменьшение объема потребляемой памяти на 41% процент. Все это согласно результатам бенчмарков, приведенных на сайте Llama.

Сразу стоит отметить важную деталь: речь идет не об обычной post-training квантизации, когда вы берете веса в FP16 и квантуете в GGUF или GPTQ. Хотя такие веса, безусловно, имеют практическое применение для множества задач, они страдают падением качества, это хорошо заметно на бенчмарках ниже. 

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии5

Как я автоматизировал поиск работы при помощи LLM

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.4K

В свете последних новостей о сокращениях в IT-индустрии вопрос поиска работы встает все более остро даже для людей, которые в данный момент трудоустроены. Встал он и для меня, так как хоть на данный момент с работой у меня все в порядке, но начали появляться звоночки, намекающие на возможную необходимость ее смены в ближайшее время.

И тут вспоминается мой прошлый опыт поиска работы с многочасовым блужданием по соответствующим сайтам, вычитыванием очередной вакансии, попытками понять, как те или иные требования работодателя соотносятся с вакансией, добавлены ли они туда потому что действительно нужны или это такой фильтр от лишних соискателей. В общем монотонная однообразная работа вида: "Открыл вакансию -> прочитал -> если заинтересовало, нажал кнопку отклика -> прикрепил сопроводительное письмо и т.д."

Можно конечно ускорить процесс, выкинув из этого алгоритма пункт с вычитыванием резюме, но:
а) есть немалый шанс, кликая на все подряд, как обезьяна, откликнуться на неподходящую для тебя вакансию; кому-то это норм, но мне бы не хотелось дергать HR'ов лишний раз по поводу вакансии, которая на самом деле мне не интересна;
б) некоторые особо хитрые работодатели добавляют в описание своих вакансий всякие ключевые слова/вопросы, которые нужно упомянуть/ответить в резюме; по мне так не самая лучшая практика, но я их за это не виню.

Эх, вот бы нашелся кто-нибудь, кто вычитал бы вакансию за меня, определил, будет ли мне она интересна, написал бы сопроводительное письмо с учетом моего резюме, текста вакансии и всяких там ключевых слов, ответил бы на сопутствующие вопросы и послал бы все это дело работодателю...

Читать далее...
Всего голосов 13: ↑9 и ↓4+5
Комментарии5

Принципы дизайна интерфейсов для ИИ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров577

Привет! Я Таня, продуктовый дизайнер в Центре ИИ Контура. Как и многие, я начала свое знакомство с ИИ-интерфейсами через научную фантастику. Помните, как Тони Старк общался с Джарвисом? Голографические дисплеи, разговоры как с обычным человеком... Современные ИИ-системы умеют многое, но их возможности и ограничения совсем не такие, как в кино.

В этой статье я собрала принципы, которые помогают мне в работе. Это не готовые решения, а скорее размышления и наблюдения дизайнера, которая пытается нащупать правильный путь в этой новой области. 

Читать далее
Всего голосов 5: ↑4 и ↓1+5
Комментарии0

Что ищет он в краю далёком? Как найти смысл жизни с PostgreSQL

Уровень сложностиСредний
Время на прочтение31 мин
Количество просмотров3.2K

Эта статья родилась из пары лекций, которые я прочитал студентам в рамках курса, посвященного вопросам машинного обучения. Почему именно PostgreSQL? Почему векторы? За последние два года тема языковых моделей стала невероятно популярной, и вместе с этим появилось множество инструментов, доступных даже начинающему инженеру, стремящемуся познакомиться с миром текстового анализа.

Доступность этих технологий открывает безграничные возможности для их применения в самых разных областях: от систем управления знаниями до «копилотов», помогающих более тщательно анализировать анамнез пациентов, или информационных киосков, позволяющих собрать идеальную корзину товаров для пикника.

Вряд ли данная работа может похвастаться полнотой или глубиной, однако, я надеюсь, что она предоставит те самые “хорошие” точки входа, которые позволят, погружаясь в детали, открыть для себя множество новых интересных и полезных тем для исследований и инженерных проектов.

Откроем скрытые смыслы
Всего голосов 9: ↑8 и ↓1+10
Комментарии1

«Все говорили, что зашло» — как прошла ламповая IT-конференция для инженеров и технарей — GoCloud Tech

Время на прочтение5 мин
Количество просмотров1.2K

Всем привет, это Миша Трифонов — руководитель разработки в департаменте  «Поверхности» в Cloud.ru, а еще один из главных организаторов нашей второй конференции GoCloud Tech, которая прошла 24 октября. Хочу поделиться с вами впечатлениями от мероприятия. Расскажу, что было, как все прошло и чем наша конфа отличается от других. Также приоткрою завесу трека с нетворкингом, который проходил в офлайне и который мы, в отличии от других докладов, не записывали. Поехали! 

Читать далее
Всего голосов 5: ↑2 и ↓3+1
Комментарии1
1
23 ...