Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

Sivchenko_translate 18 дек 2023 в 17:15

Векторные представления — что это такое, и почему в них важно разбираться

24 мин

17K

Python*Алгоритмы*Машинное обучение*Natural Language Processing*

Перевод

Векторные представления (эмбеддинги, векторы) — это по‑настоящему приятный инструмент, но в любом рассказе о векторных представлениях эта техника скрыта за ворохом каких‑то страшных словес.

Если вам удастся продраться через эти словеса, то вы откроете для себя мощные и интересные приёмы, применимые для решения всевозможных интересных задач.

Я выступал с лекцией о векторных представлениях на конференции PyBay 2023. Эта статья — улучшенная версия той самой лекции, и она должна быть интересна сама по себе, даже если не смотреть видео.

Если вы пока не знакомы с эмбеддингами, то, полагаю, в этой статье вы найдёте всю необходимую информацию, которая позволит вам приступить к их использованию при решении реалистичных задач.

38-минутная видеоверсия

Вот видеоверсия той лекции, которую я прочитал на PyBay.

+34

bredd_owen 16 дек 2023 в 19:05

Мамкин программист про ИИ, «программисты скоро будут не нужны» и прочие страшилки

Простой

6 мин

35K

Python*Программирование*Машинное обучение*Искусственный интеллект

Мнение

Недавно на Хабре вышел перевод статьи под названием: «Классическое программирование на грани вымирания» с постапокалиптической картинкой, где автор буквально пишет, что «Приближается конец эпохи классических компьютерных наук, и большинство из нас словно динозавры в ожидании падения метеорита». Если коротко, данная статья о том, что классические компьютерные науки становятся менее актуальными на фоне развития искусственного интеллекта и современных технологий. Автор рассказывает о своем опыте в области компьютерных наук, полученном в 80-х и 90-х годах, и подчеркивает, что, несмотря на то что классические подходы к программированию и алгоритмам всё еще актуальны, но в будущем (горизонт автор не указывает), скорее всего, ИИ с самообучаемыми системами заменит программистов. В будущем студентам факультетов компьютерных наук не нужно будет изучать традиционные навыки, такие как работа с двоичными деревьями или программирование на С++, обучение таким вещам станет неактуальным, потому что от инженеров будущего будет требоваться обучение и запуск генеративных моделей.

Я читаю Хабр довольно давно и очень люблю этот ресурс. При этом здесь регулярно возникают статьи, типа «Если хочешь программировать, начни с языка Си» или наоборот, «Python — это простой язык, с которым любой идиот может разобраться» (статьи такой направленности иногда нещадно минусуют). Есть также и третья категория статей о том, что программисты скоро станут попросту не нужны (как статья, которая недавно опубликована).

+70

282

Bright_Translate 15 дек 2023 в 16:00

Классическое программирование на грани вымирания

Простой

6 мин

95K

Блог компании RUVDS.comПрограммирование*Машинное обучение*Искусственный интеллект

Мнение

Перевод

Все изображения в этой статье сгенерированы нейросетью DALL-E 2

Приближается конец эпохи классических компьютерных наук, и большинство из нас словно динозавры в ожидании падения метеорита.

Период моего юношества пришёлся на 80-е годы. Тогда я занимался программированием ПК вроде Commodore VIC-20 и Apple IIe дома. Во время обучения в Калифорнийском университете, где я в итоге получил свою докторскую степень, основная часть моей учебной программы была посвящена «классическим» компьютерным наукам: программирование, алгоритмы, структуры данных, системы и различные языки. В классической форме задача компьютерных наук заключается в представлении некой идеи в виде программы, написанной человеком на языке вроде Java, C++ или Python. Причём, какой бы сложной ни была эта идея — начиная от алгоритма объединения баз данных и заканчивая крайне сложным протоколом консенсуса Paxos — её можно выразить в виде понятной для человека программы.

Читать дальше →

+30

322

Doctor_IT 15 дек 2023 в 14:57

«Да не робот я!»: CAPTCHA исчезнет или станет ёщё более раздражающей?

4 мин

5.5K

Блог компании SelectelСпам и антиспамИнформационная безопасность*Машинное обучение*Искусственный интеллект

Мнение

Интернет-мем про роботов и капчу. Источник: Лаборатория Касперского.

Вместе с ростом числа интернет-пользователей развивались боты для спам-рассылок и создания фейковых учетных записей. В 2000 году исследователями из Университета Карнеги-Меллона была разработана CAPTCHA, Completely Automated Public Turing Test to tell Computers and Humans Apart.

Капча служит защитным механизмом, генерируя задачи, которые легко решить людям и тяжело — ботам. Она не давала спамерам и мошенникам обманывать веб-сайты. Но с годами простые пользователи стали все больше уставать от капчи и воспринимать ее как раздражитель, а не механизм аутентификации.

Кроме того, сегодня роботы легко обходят капчи с помощью методов компьютерного зрения. Это привело к дилемме: актуальна ли сейчас технология? Или капча — это устаревший механизм, который только тратит время?

Читать дальше →

+41

Bully 15 дек 2023 в 10:39

Тест на Муму

Простой

1 мин

7.8K

Машинное обучение*Искусственный интеллект

Мнение

Recovery Mode

Когда количество восторженных возгласов о возможностях AI из каждого утюга превысило мою возможность сопротивляться, я решил проверить, действительно ли AI может помочь мне?

+42

fedorborovitsky 15 дек 2023 в 10:02

LSTM и GRU

Простой

9 мин

5.1K

Блог компании М.Видео-ЭльдорадоPython*Машинное обучение*Аналитика мобильных приложений*

Обзор

Рекуррентные нейронные сети уникальны тем, что способны обрабатывать последовательности данных, будь то тексты, временные ряды или даже музыка. В отличие от их бро — сверточных нейронных сетей, которые идеально подходят для обработки изображений, RNN обладают способностью «помнить» предыдущую информацию и использовать ее для обработки текущих данных. Это делает их идеальными для задач, где контекст важен, например, при генерации текста или прогнозировании временных рядов.

Но не все так радужно, как может показаться на первый взгляд. Основной головной болью при работе с RNN являются проблемы затухания и взрыва градиента. Эти явления возникают в процессе обучения сети, когда веса модели корректируются с помощью обратного распространения ошибки. Затухание градиента происходит, когда веса корректируются настолько слабо, что обучение становится неэффективным. С другой стороны, взрыв градиента происходит, когда эти корректировки слишком велики, что также ведет к нестабильности обучения. Обе эти проблемы могут серьезно затруднить обучение RNN.

Читать дальше →

+26

qed1337 14 дек 2023 в 12:48

Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц

8 мин

2.7K

Блог компании VKBig Data*Машинное обучение*

Есть два подхода к работе с машинным обучением (Machine Learning, ML): быть человеком-оркестром и задействовать «зоопарк технологий» для каждого этапа, или работать с готовым набором инфраструктурных решений, который позволяет выстроить MLOps-конвейер в рамках одной платформы. Для реализации первого подхода нужны senior-специалисты и большие ресурсы, для второго достаточно найти сервис с нужным набором возможностей.

Меня зовут Станислав Кипрюшин, я ведущий программист в VK Cloud. В этой статье на примере Cloud ML Platform мы разберём, как создать MLOps-конвейер для обучения моделей и построения сервиса распознавания лиц.

Читать дальше →

+25

akimovpro 14 дек 2023 в 10:08

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Средний

27 мин

30K

Машинное обучение*Искусственный интеллект

Обзор

Перевод

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

+25

AlanRobotics 13 дек 2023 в 16:10

LLMClone: как клонировать себя в Telegram

8 мин

17K

Блог компании MTS AIМашинное обучение*Искусственный интеллектNatural Language Processing*

✏️ Технотекст 2023

У меня, как и у многих, довольно много чатов в телеграмме. Иногда просто нет времени (а иногда и не хочется) отвечать на некоторые сообщения. Именно так возникла идея создания виртуального клона. В статье рассматривается простая идея, состоящая в том, чтобы зафайнтюнить языковую модель на личных сообщениях, выгруженных из Telegram-чатов. Возможно, в дальнейшем такой клон сможет общаться за вас

+31

RunFMe 13 дек 2023 в 13:09

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

Средний

18 мин

17K

Блог компании SberDevicesМашинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

С момента запуска GigaChat прошло около полугода, и за это время у нас появилось более полутора миллионов пользователей. Они активно используют нейросетевые технологии как в работе, так и для развлечения. От пользователей поступают разнообразные запросы: от просьбы сделать краткую выжимку из текста письма до срочного написания поэмы на день рождения коллеги-тестировщика. Мы всегда учитываем обратную связь, которая помогает нам развиваться и внедрять новые идеи.

За последнее время нами были выпущены новые модели и добавлены новые функциональные возможности в сервис. А теперь мы представляем новую нейросетевую модель, у которой более 29 миллиардов параметров. Она успешно прошла тест на ЕГЭ и показала отличные результаты в сравнении с другими системами. Если вы только начинаете интересоваться новыми технологиями в области искусственного интеллекта, то имейте в виду, именно они в ближайшие годы будут формировать наше с вами будущее и давать преимущество тем, кто ими владеет. Давайте познакомимся с ними поближе.

+46

tablum 12 дек 2023 в 13:45

Как быстро выбирать языковые модели (LLM) под свои задачи

Средний

6 мин

12K

Блог компании EXTRACTUM.IOМашинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

✏️ Технотекст 2023

Последние полгода я активно занимаюсь разработкой сервисов на базе больших языковых моделей, они же «LLM». Для каждого проекта мне приходится подбирать модель по определенным критериям: языковая поддержка, требования к памяти, типу (instruction-based или completion), скорости генерации и т.п. Первое время я использовал платформу HuggingFace, где ежедневно публикуются около сотни новых моделей. Но кто им пользовался, знает, насколько там неудобный и слабый поиск: даже точные совпадения по названию он иногда не выдаёт. Плюс к этому, приходится тратить достаточно времени, чтобы найти и сравнить модели по нескольким критериям. В этой статье я расскажу, как решил проблему выбора языковых моделей.

+27

Bright_Translate 8 дек 2023 в 16:00

Создаём сортировщик деталей Lego Technic, распознающий объекты в реальном времени

Средний

8 мин

4.8K

Блог компании RUVDS.comPython*Машинное обучение*

Кейс

Перевод

Когда я проходил стажировку в Nullspace Robotics, мне повезло участвовать в проекте, нацеленном на расширение возможностей компании. Мы совместили системы обнаружения объектов и распознавания изображений для создания модели, классифицирующей детали конструктора Lego Technic в реальном времени.

В этой статье я расскажу о том, с какими сложностями столкнулся наш проект, и как мы довели его до успешного завершения.

Читать дальше →

+43

ksotar 8 дек 2023 в 08:04

Свежий Google Gemini, GPT-4 и математика

Средний

10 мин

24K

Семантика*Математика*Машинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

Итак, Google всё‑таки решилась выпустить в свет языковую модель Gemini не дожидаясь Нового Года, и, конечно, обещая революцию. Она де превосходит все публично доступные модели, и местами превосходит людей. Отдельной её особенностью является мультимодальность (в частности способность работать с изображениями и видео) в почти реалтайм режиме, чему есть довольно впечатляющие демонстрации.

Давайте же сравним её с флагманом OpenAI/Microsoft — GPT-4, на трудном поле математики.

+26

Doctor_IT 7 дек 2023 в 16:52

Чего не знают айтишники? Как мы провели IT-кроссворд и нашли ответы на все вопросы

3 мин

4.2K

Блог компании SelectelПрограммирование*ХакатоныМашинное обучение*

Прошел почти месяц, как завершился IT-кроссворд Selectel — онлайн-соревнование для любителей разработки и тестирования, ML и Data Science, сетевых и серверных технологий. В нем приняли участие около 200 человек, из которых более половины — пользователи Хабра.

В течение четырех дней участники отвечали на вопросы из разных областей. В каждой номинации нашлись свои победители и призеры. Некоторые из них даже сумели решить кроссворд полностью. Но были и вопросы, омраченные тайной.

Хотим рассказать, как мы запустили первый и самый масштабный IT-кроссворд на Хабре, и поделиться статистикой о том, какие вопросы оказались самыми сложными. Интересно? Тогда добро пожаловать под кат!

Читать дальше →

+35

PatientZero 5 дек 2023 в 12:03

Большинство ИИ-стартапов обречено

Простой

7 мин

15K

Машинное обучение*Искусственный интеллектФинансы в IT

Аналитика

Перевод

Заявление о том, что большинство ИИ-стартапов обречено, может показаться довольно очевидным. В конце концов, большинство стартапов обречено, так уж сложилось.

Но я хочу донести нечто более провокативное. Почти все стартапы, возникшие после хайпа ChatGPT, и особенно те, которые называют себя «ИИ-стартапы», обреченыs.

Я венчурный капиталист, инвестировавший в ИИ уже долгое время; на самом деле, я даже ушёл и мира хедж-фондов, потому что увидел, насколько много всего интересного происходит в сфере ИИ. То есть я определённо не ИИ-скептик.

Тем не менее, я считаю, что большинство из того, что финансируется на текущем цикле хайпа, не имеет ценности с точки зрения инвестора.

+31

atomlib 2 дек 2023 в 18:12

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Простой

8 мин

32K

Машинное обучение*Научно-популярноеИскусственный интеллектNatural Language Processing*

Обзор

Несколько похожая, но иная атака от @andrewmccalip

Научная работа «Scalable Extraction of Training Data from (Production) Language Models» (arXiv:2311.17035) анализирует извлечение данных датасетов обучения из различных языковых моделей. Исследователи проверили как локальные модели, так и коммерческое решение от OpenAI. С помощью атаки на выравнивание удалось заставить ChatGPT процитировать данные, на которых обучали GPT-3.5.

Читать дальше →

+37

Shannon 28 ноя 2023 в 12:14

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

8 мин

78K

Машинное обучение*Искусственный интеллект

Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.

Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.

И бонусом затронем новую модель для качественного подробного описания фото.

UPD: Добавлена информация для запуска на Windows с ускорением на AMD.

+103

antonaleks605 24 ноя 2023 в 15:28

Как разбить видеокарту и поделиться с коллегами? Динамический шеринг GPU в Kubernetes с помощью MIG, MPS и TimeSlicing

Сложный

31 мин

3.7K

Блог компании SelectelВысокая производительность*Машинное обучение*ВидеокартыKubernetes*

Туториал

Привет, Хабр! С вами снова Антон, все еще DevOps-инженер в отделе Data- и ML-продуктов Selectel, который все еще исследует тему шеринга GPU. В предыдущей статье я рассказал, как можно использовать шеринг видеокарт в Kubernetes.

В комментариях была затронута тема динамического переконфигурирования MIG. Вопрос: можно ли настраивать деление GPU при активной нагрузке? Я погрузился подробнее в этот вопрос и нашел несколько способов, как это сделать. Интересно? Тогда добро пожаловать под кат!

Читать дальше →

+39

AlekseiPodkletnov 23 ноя 2023 в 08:44

Генеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллект

12 мин

41K

Сжатие данных*Машинное обучение*Искусственный интеллектБудущее здесь

ИИ чат‑боты любят ловить глюки и выдавать всякую чушь. Так массово, что словом 2023 года признали «галлюционировать». В чем причина такого явления? Является ли генеративный ИИ интеллектом (спойлер — и да, и нет)? И что общего у ChatGPT и копировального аппарата Xerox? Разбираемся, осмысляя неочевидный нюанс в логике работы больших языковых моделей.

+81

216

ru_vds 22 ноя 2023 в 16:00

Увядает ли ремесло программиста?

Простой

16 мин

22K

Блог компании RUVDS.comПрограммирование*Машинное обучение*Карьера в IT-индустрииИскусственный интеллект

Мнение

Перевод

Я всегда считал, что как мои родители позаботились о том, чтобы я научился читать и писать, так и я позабочусь о том, чтобы мои дети могли программировать компьютеры. Это одно из самых молодых искусств, но в то же время одно из самых насущных, и с каждым днём оно становится всё важнее в любой сфере, от съёмки фильмов до физики. Беглый кодинг станет частью грамотности моих детей и обеспечит им работу. На момент написания статьи моя жена беременна нашим первым ребёнком и должна родить через три недели. Я профессионально пишу код, но когда мой ребёнок научится печатать, ценность кодинга как навыка может померкнуть для мира.

Читать дальше →

+59

274

1 2 3 4

6 7 ...

49 50

Машинное обучение *

Векторные представления — что это такое, и почему в них важно разбираться

Мамкин программист про ИИ, «программисты скоро будут не нужны» и прочие страшилки

Классическое программирование на грани вымирания

«Да не робот я!»: CAPTCHA исчезнет или станет ёщё более раздражающей?

Истории

Тест на Муму

LSTM и GRU

Используем MLOps-конвейер: пример работы с Cloud ML Platform для построения сервиса распознавания лиц

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

LLMClone: как клонировать себя в Telegram

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

Как быстро выбирать языковые модели (LLM) под свои задачи

Создаём сортировщик деталей Lego Technic, распознающий объекты в реальном времени

Свежий Google Gemini, GPT-4 и математика

Ближайшие события

Чего не знают айтишники? Как мы провели IT-кроссворд и нашли ответы на все вопросы

Большинство ИИ-стартапов обречено

Исследователи заставили ChatGPT процитировать данные, на которых он учился

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

Как разбить видеокарту и поделиться с коллегами? Динамический шеринг GPU в Kubernetes с помощью MIG, MPS и TimeSlicing

Генеративный ИИ — это просто «замыленный JPEG интернета», который убедительно косит под интеллект

Увядает ли ремесло программиста?

Вклад авторов

Работа