Машинное обучение *

Основа искусственного интеллекта

Статьи Посты Новости Авторы Компании

dshelukh 2 фев в 15:28

Обзор по LLM

10 мин

10K

Блог компании ТензорМашинное обучение*Искусственный интеллектNatural Language Processing*

Обзор

В прошлом году(2023) в мире больших языковых моделей(LLM) произошло много нового и нитересного. В новостях появились фразы о гонке искусственных интеллектов, а многие ведущие IT компании включились в эту гонку. Рассмотрим как все начиналось, кто сейчас занимает лидирующие позиции в гонке и когда роботы захватят мир.

+17

m1shail 2 фев в 12:48

GigaChat обогнал по качеству ChatGPT и расширил контекст до 32 тысяч токенов

Средний

7 мин

39K

Блог компании SberDevicesМашинное обучение*Искусственный интеллектNatural Language Processing*

Аналитика

Салют! Уже ни для кого не секрет, что GigaChat активно развивается, и обновление моделей не заставляет себя долго ждать. Рады сообщить вам, что новые версии GigaChat Lite и GigaChat Pro получили мощный апгрейд и стали еще более креативными, умными и точными в исполнении инструкций, а также получили более высокую оценку, чем ChatGPT (gpt-3.5-turbo-0613) на бенчмарке MMLU. На сегодняшний день GigaChat используют уже более 2,5 миллионов человек.

В новом обновлении GigaChat Lite получил расширение максимального контекста до 32768 токенов (GigaChat Lite+), а GigaChat Pro — до 8192 токенов. Вместе с контекстом мы улучшили качество ответов, превзойдя ChatGPT на русском SBS и английском MMLU, а также сделали апдейт датасетов по экономике, медицине и праву, добавили экспертные и редакторские данные, а также прокачали функции (улучшили работу запросов).

Узнать, как попробовать самую сильную версию GigaChat бесплатно, можно в конце статьи.

+30

155

Lilia_P 2 фев в 10:01

Как мы с помощью Midjourney визуализировали понятия из мира ИТ на картах «‎Имаджинариума»

Простой

7 мин

12K

Блог компании ГК ЛАНИТМашинное обучение*Графический дизайн*ДизайнИскусственный интеллект

Кейс

Всем привет! Хочу поделиться необычным кейсом из моей практики – созданием иллюстраций для игровых карточек «‎Имиджинариума» с использованием нейросети Midjourney. Наша команда визуализировала выражения и понятия из мира ИТ. Мы представили, как может выглядеть на карточках настольной игры Agile, путь пользователя, удаленный доступ, оживили системы видеонаблюдения, пофантазировали над человеческим обличием бекенда, стартапа или дедлайна. Об этом - новая статья в блоге ЛАНИТ. Бонус –под катом вас ждут очень много красивых картинок и ссылка на составленный мной гайд по работе с промтами в Midjourney.

+53

Lithium_vn 1 фев в 18:02

Новые горизонты производства электроники и солнечных батарей: оптимизация мультикристаллических материалов с помощью ML

Средний

16 мин

1.5K

Блог компании BotHubМашинное обучение*Производство и разработка электроники*Искусственный интеллект

Обзор

упность и различные преимущества мультикристаллических материалов сделали их широко распространенным сырьем для различных применений в сфере солнечной энергетики и, в целом, полупроводни.ковой индустрии, электроники и медицины, однако работа с ними сопровождается серьезными трудностями

Использование мультикристаллических материалов усложняется наличием дефектов и неоднородностей свойств кристаллов по поверхности материала, связанных с различной кристаллографической ориентацией каждых отдельных зерен. Кроме того, работа с такими материалами требует наличие дорогостоящего оборудования и использование современных методов, затрачивающих много времени и неподходящих для образцов большой площади, что является насущной проблемой.

Другими словами: материал очень востребован во многих сферах промышленности, но имеет ряд особенностей, и не имеет достаточно эффективных способов работы с ними.

В данной статье я расскажу, какое решение данной проблемы было найдено исследователями, и для сравнения опишу современные используемые методы для определения кристаллографических ориентаций в мультикристаллических материалах.

Приятного чтения! :)

+11

Safreliy 1 фев в 08:25

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 1)

Средний

9 мин

5.3K

Работа с 3D-графикой*Алгоритмы*Машинное обучение*Искусственный интеллектAR и VR

Обзор

В последнее время мы оцениваем на удивление много проектов, так или иначе связанных с 3D-пространством и ML-моделями. По всей видимости по прошествии 2023 года люди воодушевились и начали видеть возможность реализации тех идей, которые ранее просто-напросто казались научной фантастикой - и они не ошибаются! Исследователи и разработчики последних технологий достигли сногсшибательных результатов. В связи с этим хотел бы накидать цикл обзорных статей, которых как мне лично, так и нашей рабочей группе очень сильно недоставало в процессе ресёрча.

+13

Sber 31 янв в 16:09

Универсальные факты: конструктор извлечения для аналитика

Средний

7 мин

1.2K

Блог компании СберАнализ и проектирование систем*Машинное обучение*

Кейс

Привет, мы команда LegalDocs Управления «Проектный офис» в Правовом департаменте. У Сбербанка огромное количество клиентов, от обычных людей до больших корпораций. Все вместе они предоставляют множество видов документов, из которых нам нужно быстро извлекать юридически значимую информацию для последующей правовой экспертизы. Например, к нам обращается представитель большой компании за кредитом. И нам нужно оценить правоспособность: проверить, есть ли у этого представителя соответствующие полномочия в той организации, которую он представляет.

Если бы эту экспертизу проводил человек, то на его стол (физический или виртуальный) должен попасть большой пакет документов: устав организации, протокол о создании общества, протокол о нотариальные доверенности и многое другое. И чтобы искусственный интеллект (система автоматического принятия правового решения, или, как мы её называем, «робот-юрист», эта технология даже запатентована) мог принять решение, нужно сначала из каждого документа извлечь определённую информацию (значимые факты), структурировать её и отправить на проверку. Только после этого робот-юрист решит, есть ли правовые риски в этой кредитной сделке.

+11

krutovsky 29 янв в 20:55

Что такое «паралич» сети, и как его избежать?

Простой

2 мин

3.6K

Машинное обучение*

Из песочницы

✏️ Технотекст 2023

Паралич сети - это явление, при котором глубокие слои не обучаются. Это происходит из-за затухания градиента при обратном распространении ошибки. Затухание градиента может возникнуть из-за большой глубины сети или больших выходных значений.

Цель статьи - объяснить проблему, причины ее возникновения и показать несколько решений. Дополнительно статья связывает редкое понятие «паралича сети» и распространённое понятие «затухания градиента».

+11

KAA-zdes 29 янв в 20:32

Дефекты рельсов. Найти, используя IT

Средний

13 мин

2.3K

Машинное обучение*Искусственный интеллектТранспорт

Аналитика

Цель данной работы – оценить возможность создания эффективной системы распознавания дефектов рельсов по дефектограммам ультразвукового контроля методами ML

+12

Squirrelfm 29 янв в 07:59

Просто о Stable Diffusion: никакой магии

Простой

15 мин

10K

Блог компании RaftМашинное обучение*Искусственный интеллект

Туториал

Если вы не провели последние два года на ферме в Сибири, вы, вероятно, слышали о Stable Diffusion или пробовали генерировать изображения с помощью моделей, вроде Dall-e или Midjourney. Они становятся все лучше каждый день, и по качеству уже сравнимы с людьми, а во многих аспектах даже лучше (например, им не нужно платить).

Исследования в области создания видео уже идут полным ходом во многих лабораториях и компаниях, так что это лишь вопрос времени, когда генеративные модели сместят людей с очередного столпа на котором держится наше общества — порно. Я не вижу чтобы кто то поднимал тревогу об огромном количестве людей, которые потеряют работу из-за этого. Я не такой бессердечный, поэтому, прежде чем наступил этот печальный момент, я решил принять меры и создать базовое руководство, которое даже работник индустрии для взрослых сможет понять и использовать, чтобы оставаться в игре. Давайте посмотрим, что к чему.

+33

snakers4 28 янв в 15:23

Играемся с RTX 5000 Ada (AD103): первые впечатления

Средний

6 мин

15K

Машинное обучение*Компьютерное железоИскусственный интеллектВидеокарты

Обзор

Майнинг и использование для майнинга в этой статье не обсуждается.

У меня есть пара старых статей (про A100, и про 3090 и A10) и также вот есть тоже старое, но всё еще неплохое и актуальное сравнение карточек для расчетов от Selectel. С тех пор прошло примерно два года и пора написать что-то новенькое и попробовать новые ускорители для расчетов. Да, это всё ещё статья про карточку Nvidia, не AMD и не Intel, и не про китайцев и какие-то модные большие чипы, увы.

С тех пор появились новые карточки уже аж двух новых поколений - Ada Lovelace и Hopper. При этом Hopper вроде как должны были прийти на замену очень удачному поколению Ampere (это древняя традиция Nvidia - за супер успешным поколением следует менее удачное), но не пришли. Но возможно из-за торговых войн с Китаем карточки поколения Hopper стали выдавать только нужным вендорам и в виде собранных систем и при этом запретили экспорт в Китай.

В этой статьей мы разберем первые впечатления от карточки NVIDIA RTX 5000 Ada Generation (AD103), но начнем с небольшой дозы юмора.

Давайте разбираться!

+11

atomlib 27 янв в 20:51

Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

Простой

10 мин

Спам и антиспамМашинное обучение*Научно-популярноеИскусственный интеллектNatural Language Processing*

Обзор

ChatGPT пишет не хуже человека, но можно ли обнаружить «машинность» в тексте? Хотя некоторым компаниям было бы выгоднее представить всё так, будто результат работы языковых моделей неотличим от человеческого, исследования в этом направлении активно ведутся. Авторы научной статьи «Spotting LLMs With Binoculars: Zero-Shot Detection of Machine-Generated Text» (arXiv:2401.12070) утверждают, что их метод имеет низкий уровень ложноположительных срабатываний (0,01 %), правильно обнаруживает текст от языковых моделей в 90 % случаев и работает для нескольких семейств современных продуктов.

Читать дальше →

+22

nmakarova 25 янв в 16:07

Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров

Простой

11 мин

5.3K

Блог компании CDEKАнализ и проектирование систем*Big Data*Машинное обучение*

Кейс

✏️ Технотекст 2023

Привет, Хабр! Меня зовут Наталья Макарова, я ведущий разработчик команды геоданных в CDEK. В этой статье расскажу, как мы с помощью ML решили проблему, не дававшую нашей компании перейти на автоматическую маршрутизацию курьеров.

Мы умеем отслеживать прохождение грузом всей транспортной цепочки, включая промежуточные склады. Но посылку нужно ставить на конкретный маршрут до того, как весь груз придет на склад доставки. И даже до того, как он попадет в ERP‑систему СDEK (посылки оформят в офисах). То есть задача такая: определить, на какой маршрут поставить конкретный заказ до того, как появился сам маршрут!

+35

SerjN 25 янв в 14:30

Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs

Простой

7 мин

1.6K

Блог компании Yandex Cloud & Yandex InfrastructureМашинное обучение*Облачные сервисы*Искусственный интеллект

Обзор

В сообществе ML-инженеров и дата-сайентистов популярны инструменты с быстрой обратной связью наподобие JupyterLab — они помогают легко и без лишних обвязок проверять гипотезы или создавать прототипы. Но довольно часто бывает, что при разработке ML-пайплайна, будь то инференс или обучение модели, хочется пользоваться установленной локально полноценной IDE, в которой открыт проект со многими зависимостями, окружением, сложной структурой. При написании кода и его отладке хочется пользоваться дебагером и уметь быстро менять код, а при запуске — скейлить ресурсы исполнения и не думать о том, как перенести код и окружение на продакшн-сервера. Всех этих возможностей в Jupyter-экосистеме из коробки нет, поэтому разработчикам часто приходится создавать костыли.

Помочь в решении этих задач могут инструменты для удалённого исполнения кода в ML. Сегодня на конкретном примере покажу, как устроен и как работает один из таких инструментов, созданный нами для пользователей облака, — DataSphere Jobs. А в следующий раз вместе с моими коллегами рассмотрим опенсорс-инструменты для подобных задач.

+10

erbanovanastasia 23 янв в 17:42

Виртуальная девушка, Midjourney на коленке за 5 минут и другие эксперименты с нейросетями

Простой

3 мин

21K

Блог компании SelectelМашинное обучение*Искусственный интеллект

Дайджест

Мы часто рассказываем о наших экспериментах с нейросетями, а вы — делитесь своими идеями, вопросами и замечаниями. В этой статье мы решили самый интересный опыт работы с нейросетями. Под катом — инструкции, рейтинг и советы из практики.

Читать дальше →

+20

Lithium_vn 23 янв в 17:00

ИИ помог обойти защиту резистентных бактерий: открыт новый класс перспективных антибиотиков

Средний

19 мин

6.1K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Обзор

По прогнозам к 2050 году смертность от инфекционных и бактериальных заболеваний, не поддающихся лечению в связи с устойчивостью возбудителей к антибактериальным препаратам, составит 10 млн человек в год и выйдет на одно из лидирующих мест наряду с сердечно-сосудистыми и онкологическими заболеваниями. Основным объектом данного исследования как раз является один из таких типов бактерий – метициллинрезистентный золотистый стафилококк (MRSA), устойчивый к стандартным лекарственным препаратам, известным и применяемым на практике антибиотикам.

Данной проблемой уже долгие годы занимаются ученые и медицинские организации по всему миру, и, наконец, с мертвой точки позволили сдвинуться силы искусственного интеллекта и глубокого обучения, основанного на применении графовых моделей нейронных сетей, знакомых для каждого из нас.

Ученым из Массачусетского университета удалось осуществить данное исследование за счет использования глубокого обучения. Помимо того, что новый класс антибиотиков способен уничтожать MRSA бактерии, он также обладает очень низкой токсичностью по отношению к клеткам человека, что является безупречным результатом.

В данной статье я подробнее расскажу о методах и ходе данного исследования, от зарождения идеи, до ее реализации и практических результатов.

Приятного прочтения! :)

+31

ajaxtpm 23 янв в 12:19

Ваших соседей пошифровали! Прямой репортаж с места событий

Простой

8 мин

22K

Блог компании Positive TechnologiesИнформационная безопасность*Сетевые технологии*Машинное обучение*

✏️ Технотекст 2023

Такие истории редко оказываются публичными: мало кто любит хвастаться тем, как их пошифровали (даже если это хэппиэнд). Но пора признать — эти истории есть, они ближе, чем мы думаем, и их абсолютно точно в разы больше, чем все привыкли считать. Шифровальщики все еще остаются в топе угроз среди атак на организации. Одну из таких атак сумела запечатлеть система поведенческого анализа сетевого трафика PT Network Attack Discovery (PT NAD), которая в это время пилотировалась в компании. И если бы только оператор SOC обратил внимание на алерты в интерфейсе новой системы… но история не терпит сослагательного наклонения.

Подробнее

+24

Odin_Himself 22 янв в 16:15

Яндексу здесь не место…

Простой

4 мин

106K

Машинное обучение*Управление персоналом*

Аналитика

Recovery Mode

Здравствуйте, уважаемые читатели!

Тема сегодняшней статьи будет несколько нестандартная, однако, безусловно связанная с информационными технологиями, нейросетями и технологическим гигантом нашего времени – компанией Яндекс.

Сразу хочу отметить – я отлично осознаю факт того, что Хабр не является площадкой для сведения счетов, размещения жалоб или ломания копий. И идея о том, чтобы написать свой отзыв об опыте общения с компанией Яндекс так и осталась бы идеей, лежащей где-то чуть ли не на дальней полочке в моем мозге, если бы буквально на днях, 18.01.2024 г., спустя 5 месяцев после того, как поступили со мной, я не увидел полностью аналогичный случай, о котором написали в сети. См. ссылку ниже:

https://journal.tinkoff.ru/kak-ia-pytalas-ustroitsia-na-rabotu-v-iandeks/

Прочитав пост, я понял, что эпопея “Яндекс-швырялово” длится уже около полугода и при этом все её организаторы чувствуют себя предельно комфортно, поэтому я был просто вынужден расчехлить перо.

+267

381

Mark_K 22 янв в 09:15

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

8 мин

4.9K

Машинное обучение*

Туториал

В вводной части обзора мы познакомились с концепцией Retrieval Augmented Generation (RAG) и её расширением через методологию RAGAS (Retrieval Augmented Generation Automated Scoring). Мы разобрались, как RAGAS подходит к процессу оценки эффективности и точности RAG-систем.

В этой части мы более подробно рассмотрим техническую сторону RAGAS. Как обычно, начнем с более простых и интуитивно понятных примеров, потом перейдем к более сложным сценариям.

+13

badcasedaily1 21 янв в 13:45

Методы работы со смещением и дисперсией в модельках машинного обучения

Простой

8 мин

4.4K

Блог компании OTUSPython*Машинное обучение*

В давние времена были вечные битвы с переобучением и недообучением в модельках машинного обучеиня. Вечная битва между смещением и дисперсией. Подходит ли модель к данным как идеальный ключик, или же она скорее ели пытается влезть туда...

Эта дилемма определяет, насколько хорошо модель будет работать на реальных данных.

Переобучение и недообучение – это Сцилла и Харибда в ML, между которыми нужно лавировать. С тех давних времен появилось множество методов для решения этой проблемы. Рассмотрим их кратко.

+10

OlegSivchenko 20 янв в 20:13

Следуй за человеком. Об ориентировании роботов в толпе

12 мин

2.3K

Машинное обучение*РобототехникаНаучно-популярноеИскусственный интеллект

Минувшим летом я знакомил сына с Москвой, а также с моими московскими друзьями из разных времён. Мы даже успели заглянуть в офис Хабра в компании с @Boomburum Неудивительно, что нам довелось посетить разные уголки прекрасного московского метрополитена, считая светло‑синий Арбат, Смоленскую, ВДНХ, Сокол, Выхино, Некрасовку, Бауманскую и Окружную. Сын мне то и дело напоминал, что «нужно идти туда, куда больше людей идёт» — признаться, стратегия не лучшая, хотя и логичная. Развивая его идею, я предложил ему пофантазировать, как бы в московском метро ориентировался робот, на что бы он обращал внимание? На инфографики, сквозняки, расположение эскалаторов или, всё‑таки, на человеческие потоки? Постепенно я пришёл к выводу, что в многолюдном пространстве именно человеческие потоки были бы самым важным ориентиром для мобильного робота, и под катом попробую разобрать этот вопрос подробнее.

Наверняка я бы и не подумал обращаться к этой теме, если бы не бесценный опыт помощи с подготовкой научных статей, приобретённый мной в 2019–2021 годах в лаборатории автономных робототехнических систем (ЛАРС) в институте СПИИРАН, бессменным руководителем которой с тех и до сих пор является уважаемый Антон Савельев.

+22

1 2 ...

6 7

9 10 ...

49 50

Машинное обучение *

Обзор по LLM

GigaChat обогнал по качеству ChatGPT и расширил контекст до 32 тысяч токенов

Как мы с помощью Midjourney визуализировали понятия из мира ИТ на картах «‎Имаджинариума»

Новые горизонты производства электроники и солнечных батарей: оптимизация мультикристаллических материалов с помощью ML

Истории

ИИ в 3D: Где мы сейчас и какое будущее нас ждёт? (Часть 1)

Универсальные факты: конструктор извлечения для аналитика

Что такое «паралич» сети, и как его избежать?

Дефекты рельсов. Найти, используя IT

Просто о Stable Diffusion: никакой магии

Играемся с RTX 5000 Ada (AD103): первые впечатления

Метод Binoculars обещает высокую точность обнаружения текста от больших языковых моделей

Как мы с помощью ML вылечили проблему, не дававшую перейти на автомаршрутизацию курьеров

Запускаем локальный ML-процесс в облаке с помощью DataSphere Jobs

Ближайшие события

Виртуальная девушка, Midjourney на коленке за 5 минут и другие эксперименты с нейросетями

ИИ помог обойти защиту резистентных бактерий: открыт новый класс перспективных антибиотиков

Ваших соседей пошифровали! Прямой репортаж с места событий

Яндексу здесь не место…

Как сделать чат-бота лучше, нужен всего лишь простой советский… RAGAS

Методы работы со смещением и дисперсией в модельках машинного обучения

Следуй за человеком. Об ориентировании роботов в толпе

Вклад авторов

Работа