Искусственный интеллект

AI, ANN и иные формы искусственного разума

Статьи Посты Новости Авторы Компании

ksenia-plesovskikh 8 апр в 14:36

Можно ли научить чат-бота всегда говорить правду. Часть 2

Средний

10 мин

1.6K

Машинное обучение*Искусственный интеллект

Обзор

Эта статья является продолжением анализа существующих способов устранения галлюцинаций чат-ботов и повышения точности их ответа. В прошлый раз был разбор того, как оценивать точность в процессе диалога, а сегодня мы поговорим о методах, которые из научного сообщества уже проникли в такую библиотеку как llamaIndex, но еще не получили освещения на Хабре.

Часть первая тут.

Как пользователи, мы хотим иметь возможность просто загрузить все нужные нам документы в RAG и пользоваться ими без дополнительных настроек. Большинство традиционных подходов RAG также используют полученные документы “как есть”, без проверок, являются ли эти документы релевантными или нет. Более того, современные методы в основном рассматривают полные документы как справочные знания, как во время поиска, так и во время использования. Но значительная часть текста в этих извлеченных документах часто не важна для генерации и только затрудняет поиск релевантной информации. А если результат работы ретривера окажется низкого качества, есть большая вероятность получить галлюцинацию в ответе.

Для решения проблемы можно двигаться в нескольких направлениях.

janvarev 8 апр в 11:01

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

Средний

10 мин

15K

Блог компании Timeweb CloudИскусственный интеллектNatural Language Processing*

Туториал

Несмотря на то, что сейчас ~~из каждого утюга~~ рекламируется доступ к ChatGPT и GPT-4, вообще говоря, в мире существует несколько больше разных поставщиков LLM (больших языковых моделей), и некоторые из которых могут гораааздо более эффективнее решать какие-то конкретные задачи.

Я уже полгода веду проект VseGPT.ru с доступом к разным LLM из России по OpenAI API (ну, и через вебчат). Львиная доля работы — подключение новых нейросетей. Сейчас их уже свыше 60, и каждую я попробовал хотя бы раз, ну, когда подключал.

Правда, сайт LLMExplorer, собирающий данные об опенсорс нейросетях с портала Hugging Face, говорит, что их там уже более 33 000 штук. М-да.

В общем, вероятно, я не знаю о текстовых сетках всё, но определенно знаю кое-что — хотя бы в пределах своего скромного опыта в 60 сеток. Так что кому интересно — прошу под кат.

Читать дальше →

+29

ggospodinov 8 апр в 09:50

GigaAM: класс открытых моделей для обработки звучащей речи

Средний

10 мин

5.8K

Блог компании SberDevicesOpen source*Машинное обучение*Искусственный интеллект

Салют, Хабр! Ранее мы в SberDevices анонсировали предобученную на русском языке модель GigaAM (Giga Acoustic Model) и её дообученные состояния под распознавание речи (GigaAM-CTC) и определение эмоций (GigaAM-Emo). Сегодня же делимся с сообществом весами моделей и примерами использования.

Приглашаем под кат погрузиться в self-supervised learning для звучащей речи и оценить возможности предобученных моделей!

+30

timonin 7 апр в 23:24

Жажда «цифровой крови»: как Google, OpenAI и Meta переступают черту ради развития ИИ

Простой

13 мин

18K

Искусственный интеллектБудущее здесь

Технологические гиганты OpenAI, Google и Meta* в погоне за онлайн-данными для обучения своих новейших систем искусственного интеллекта готовы на всё: игнорировать корпоративные политики, менять собственные правила и даже обсуждать возможность обхода законов об авторском праве.

+20

aansty4U 6 апр в 18:30

Революция в клеточной биологии: Применение GPT-4 для РНК-секвенирования

Простой

11 мин

10K

Блог компании BotHubИскусственный интеллектЗдоровье

Обзор

Одноклеточное РНК-секвенирование (scRNA-seq) – метод изучения экспрессионных профилей на уровне отдельных клеток, то есть определения, какие РНК присутствуют в каждой клетке и в каком количестве. Это позволяет ученым понимать, как функционирует каждая клетка и какие функции она выполняет.

Простыми словами: данный метод помогает понять, какие гены в клетке "включены" и "выключены" в данный момент. Это важно, потому что активные гены определяют, как клетка будет себя вести, например, будет ли она здоровой, превратится ли в раковую, поможет ли она иммунной системе бороться с инфекцией и так далее. Таким образом, РНК-секвенирование применяют для разработки лекарств, при изучении болезней и их лечении, а также для того, чтобы понять, как развиваются и функционируют различные живые организмы на уровне их клеток.

Весь процесс достаточно сложный, но как GPT-4 помогает в его осуществлении? Об этом подробно и доступно я расскажу в этой статье!

Приятного прочтения! :)

+31

CyberPaul 5 апр в 11:43

Новый «ИИгрок»: что мы знаем о Grok?

Простой

6 мин

4.6K

Блог компании ServerspaceIT-инфраструктура*История ITИскусственный интеллектIT-компании

Обзор

Среди чат-ботов с генеративным искусственным интеллектом самым известным и раскрученным считается, безусловно, ChatGPT. Примечательно, что сооснователем компании OpenAI, которая разработала эту большую языковую модель, был Илон Маск, инвестировавший в продукт на начальном этапе серьезный капитал. Позже он покинул проект: формально — чтобы заняться созданием собственной платформы с искусственным интеллектом, по слухам — потому что утратил веру в перспективы ChatGPT. Публика ожидала, что ИИ-технологии нового поколения в первую очередь будут внедрены в автомобилях Tesla, но они неожиданно воплотились в другом проекте Маска — социальной сети X, где с недавних пор заработал «интеллектуальный» чат-бот Grok. Этот продукт имеет целый ряд существенных отличий от своего предшественника в исполнении OpenAI. В чем они заключаются и каковы особенности большой языковой модели от Илона Маска, мы сегодня и попытаемся разобраться.

Читать дальше →

+12

veseluha 4 апр в 18:00

Как обнаружить галлюцинации в LLM?

Средний

10 мин

2.8K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Туториал

LLM продолжают свое пребывание в центре технологических дискуссий. Они трансформируют наши взаимодействия с технологиями, поскольку предоставляют возможность усовершенствованной работы в обработке и генерации текстов. Однако и упомянутые модели не идеальны, так как одна из их самых значительных проблем - галлюцинации, критическое препятствие в развитии LLM, возникающие в основном из-за качества обучающих данных, поскольку они могут быть неполными или противоречивыми.

Для эффективной работы с LLM крайне важно понимать что такое, эти "галлюцинации" и как их обнаружить. В статье мы опробуем обнаружение галлюцинаций, исследуя различные метрики сходства текста, и проанализируем их релевантность.

itmo_nsslab 4 апр в 17:04

Open Source в российском ИИ: исследование ландшафта

Простой

7 мин

1.8K

Блог компании ИТМОOpen source*GitHub*Машинное обучение*Искусственный интеллект

Аналитика

Привет, Хабр!

Это исследователи из NSS Lab ИТМО и создатели сообщества ITMO.OpenSource. Мы считаем, что важно делать не просто науку, а открытую науку, результатами которой можно легко воспользоваться. Поэтому пишем об открытом коде, проводим митапы «Scientific Open Source» и разрабатываем научные решения с открытым кодом. Эта статья написана на материале исследования, которое мы презентовали на последнем митапе. В ней поговорим об открытом научном коде, посмотрим, как с ним обстоят дела в разных организациях, и поделимся подборкой репозиториев, которые могут решать различные научные задачи.

+19

Mixiw 4 апр в 09:32

Рисуем с нейросетями: Есть ли у ИИ-художника свой стиль?

Простой

2 мин

1.5K

Блог компании X5 TechОбработка изображений*Графический дизайн*ДизайнИскусственный интеллект

Мнение

Привет, Хабр! Я – Михаил Суворов, ведущий дизайнер коммуникаций в X5 Tech. В статье я ставлю эксперименты над ИИ, пока у них нет возможности “дать сдачи” человеку. Если серьёзно, то проверим гипотезу, может ли нейросеть, генерирующая изображения, иметь собственный “авторский стиль”.

Aremys 3 апр в 23:00

Введение в нейросети: что, зачем и как?

Средний

25 мин

31K

Python*Математика*Машинное обучение*Искусственный интеллект

Туториал

Из песочницы

Это модное слово всё чаще используется в разговорной речи: обывателей плотнее окутывают угрозами бунта искусственного интеллекта и войны с роботами — с одной стороны, и рекламой нейросетевых продуктов — с другой. Отдельный котёл в аду — для тех, кто впаривает «курсы дата‑саентистов». А когда бедный юзернейм в поисках истины обращается к ~~Гуглу~~ своему любимому поисковику — то вместо простого ответа на простой вопрос, получает ещё больше вопросов — таких как тензорфлоу, сигмоида и, не дай Бог, линейная алгебра.

Как же нейросети рисуют картинки?

+54

Lithium_vn 3 апр в 19:00

6 нейросетей для создания презентаций: тестируем и проверяем

8 мин

5.6K

Блог компании BotHubМашинное обучение*Искусственный интеллект

Обзор

Век живи - век учись, а презентации составлять так и не научишься. Сколько времени и сил тратится на подготовку этих стандартных презентаций, особенно во время сессии. Но что если значительную часть этой рутинной работы можно было бы делегировать искусственному интеллекту? Именно такую возможность обещают многочисленные сервисы, использующие нейросети для генерации презентационного контента.

В этом обзоре мы попробуем разобраться, что из себя представляют новомодные ИИ-генераторы презентаций. Честно оценим их возможности и ограничения, пройдемся по функционалу, проверим на практических примерах.

Главный вопрос к этим сервисам - смогут ли они в текущей форме полностью заменить человека в создании качественного презентационного контента? Или они пока что больше напоминают ассистента, которому нужен присмотр и доработка результатов ручным трудом?

Исследуем, анализируем, делаем выводы! Ведь только опираясь на реальный опыт использования, можно понять, стоит ли овчинка выделки и имеет ли смысл переходить на ИИ-генерацию презентаций. Начнем!

+12

Epoch8 3 апр в 18:11

Создание ИИ-ассистента, который отвечает на вопросы пользователей по базе знаний

Средний

5 мин

2.8K

Блог компании AGIMAИскусственный интеллект

Кейс

Привет! На связи Ольга Татаринова, сооснователь компании AGIMA AI. Времена, когда звонок в техподдержку сервиса означал бесконечное ожидание на линии с музыкой вместо гудков, проходят. Искусственный интеллект не устает, не делает перерывов и, к счастью, не играет навязчивые мелодии.

+12

EasyLy 3 апр в 14:39

Нейросетевой чип с интерфейсом, привычным Embedded программисту

Средний

11 мин

5.2K

Программирование микроконтроллеров*Искусственный интеллект

Обзор

Обычно я пишу циклы статей по двум причинам. Либо я участвую в какой-то разработке и, с одной стороны, хочу рассказать о ней, но с другой – описать что-то интересное про применённые там технологии, так как овладел ими в достаточной мере. Самый большой цикл был про комплекс Redd, который перерос в разработку USB-анализатора на его базе. Другая причина засесть за клавиатуру – я нашёл какую-то интересную поделку

В сегодняшней статье (которая, надеюсь, разрастётся до цикла) всё несколько иначе. Поделка сама нашла меня. Её разрабатывают в другом отделе нашей же компании. Но именно в соседнем отделе, не в моём. Как она устроена внутри, мне знать не положено. Зато я могу, вдобавок к чтению документации, не просто расспрашивать авторов про пользовательский интерфейс, а ещё и давать им советы, как его изменить.

Речь пойдёт про чип, который по задумке разработчиков должен помочь Embedded-программистам начать работу с Искусственным Интеллектом, не погружаясь в его недра, а оперируя только привычными им сущностями. Давайте разбираться более детально.

Читать дальше →

LangMagic 3 апр в 14:31

Как айтишникам быстро выучить английский с помощью ChatGPT?

Простой

2 мин

35K

Программирование*Искусственный интеллектИзучение языковIT-компании

Из песочницы

Как айтишникам быстро выучить английский с помощью ChatGPT?

Проведя небольшие исследования среди русскоговорящих айтишников, мы выявили две боли: сложно перейти работать в зарубежную компанию и как эффективнее искать ответы на ютубе, когда Stackoverflow уже не спасает и приходится обращаться к индусам.

И там, и там лейтмотивом сквозит тема английского, ведь без него на вас в Кремниевой долине не посмотрят, да и обычные ролики на YouTube не особо легко воспринимаются. Поэтому сегодня поделимся несколькими лайфками.

-6

klimensky 3 апр в 11:07

7 примеров ИИ, которых не хватает прямо сейчас

10 мин

2.6K

Блог компании FirstVDSИсследования и прогнозы в IT*Научно-популярноеИскусственный интеллектЛайфхаки для гиков

Писать статьи для блога вместо авторов? Генерировать картинки на сайт вместо веб-дизайнеров? Дописывать код за стажерами, которые активно вкатываются в IT после трех месяцев обучения на каких-нибудь курсах? Этим уже никого не удивить.

Но ведь у нейросетей есть и более интересные применения, которые могли бы упростить или улучшить повседневную жизнь уже сейчас. Правда, пока они еще не получили массового распространения. Давайте пофантазируем, в каких отраслях внедрение ИИ может принести пользу в ближайшие несколько лет.

Dmytro_Kikot 3 апр в 10:00

Улыбка робота: предсказание и имитация выражения лица человека

12 мин

584

Блог компании ua-hosting.companyРазработка робототехники*РобототехникаНаучно-популярноеИскусственный интеллект

Социальное взаимодействие между людьми является одним из основополагающих аспектов жизни. Родные, коллеги, друзья или совершенно незнакомые люди могут взаимодействовать с нами в самых разных сценариях. Одной из основных составляющих данного взаимодействия является мимика лица человека, способна без слов выразить эмоциональное состояние. Несмотря на культурные и этнические отличия разных народностей Земли, существует базовый набор выражений лица, который практически везде обладают одинаковым смыслом. К примеру, улыбка может зловещей, насмешливой, ироничной, притворной и т. д., но чаще всего она является признаком доброжелательности и миролюбивого настроения по отношению к собеседнику. Но что если собеседник робот? Ученые из Школы инженерии и прикладных наук Колумбийского университета (США) провели исследование, в котором попытались научить робота своевременной и уместной мимике в ответ на мимику собеседника-человека. Какой вид имел робот, чему удалось его научить, и как проходило его общение с людьми? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+11

aansty4U 2 апр в 19:30

Использование ML и новых методов кластеризации для борьбы с COVID-19: Революция в выявлении вирусных мутаций

Средний

14 мин

1.2K

Блог компании BotHubМашинное обучение*Научно-популярноеИскусственный интеллектЗдоровье

Обзор

С момента появления COVID-19 мы застали множество “волн” и новых вспышек вируса. Помимо очевидной тяжести заболевания и невероятной скорости передачи, SARS-CoV-2 также отличается большим количеством различных мутаций, уклоняющихся от иммунных реакций.

Несмотря на то, что сейчас ситуация с коронавирусом стабилизировались, вирус продолжает развиваться и мутировать, что все равно сохраняет большую опасность для населения, в связи с трудностью и затратностью отслеживания его эволюции.

В данной статье я подробно расскажу, как с помощью машинного обучения и новых методов кластеризации исследователям удалось встать на путь обнаружения новых вариантов вируса SARS-CoV-2, вызывающего COVID-19, со значительным временным и вычислительным выигрышем, по сравнению с существующими методами.

+12

ph_piter 2 апр в 18:00

Книга «Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. 2-е межд изд.»

8 мин

4.4K

Блог компании Издательский дом «Питер»Алгоритмы*Профессиональная литература*Машинное обучение*Искусственный интеллект

Привет, Хаброжители!

Генеративное моделирование — одна из самых обсуждаемых тем в области искусственного интеллекта. Машины можно научить рисовать, писать и сочинять музыку. Вы сами можете посадить искусственный интеллект за парту или мольберт, для этого достаточно познакомиться с самыми актуальными примерами генеративных моделей глубокого обучения: вариационными автокодировщиками, генеративно-состязательными сетями, моделями типа кодер-декодер и многим другим.

Дэвид Фостер делает понятными и доступными архитектуру и методы генеративного моделирования, его советы и подсказки сделают ваши модели более творческими и эффективными в обучении. Вы начнете с основ глубокого обучения на базе Keras, а затем перейдете к самым передовым алгоритмам.

Читать дальше →

+12

CrocInc 2 апр в 15:34

AFCOM: Бум ИИ стимулирует инновации в проектировании и строительстве ЦОД

Простой

5 мин

800

Блог компании КРОКIT-инфраструктура*Исследования и прогнозы в IT*Читальный залИскусственный интеллект

Аналитика

Перевод

В своем последнем отчете AFCOM (Association For Computer Operations Management) отмечают, что стремительное развитие искусственного интеллекта и широкое распространение цифровых сервисов стимулируют спрос на инновационные технологии в области проектирования ЦОД. Однако в ходе проведения исследования в AFCOM пришли к выводу, что хотя индустрия дата-центров и переживает «бум в области проектирования и строительства инфраструктуры», вместе с тем возникают и новые проблемы в таких ключевых аспектах, как энергопотребление, охлаждение и реализация целей устойчивого развития.

Команда редакции Хабра КРОК подготовила для вас перевод ключевых трендов из отчета AFCOM. Читайте под катом!

+15

derunat 2 апр в 15:09

Что такое task contamination и почему one-shot и zero-shot заподозрили в нечестности

Средний

3 мин

540

Блог компании НТРМашинное обучение*Искусственный интеллект

Recovery Mode

Почти детективное расследование провели в Калифорнийском университете. Авторы взяли 12 разных LLM, включая GPT-3, и проверили их на датасетах, созданных в разное время — до и после обучения моделей. Обнаруженные артефакты указывают на то, что one-shot и few-shot задания улучшают работу модели просто потому, что она уже встречала эти данные в процессе обучения. Авторы назвали это загрязнением заданий, task contamination.

1 2 3

5 6 ...

49 50

Искусственный интеллект

Можно ли научить чат-бота всегда говорить правду. Часть 2

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

GigaAM: класс открытых моделей для обработки звучащей речи

Жажда «цифровой крови»: как Google, OpenAI и Meta переступают черту ради развития ИИ

Истории

Революция в клеточной биологии: Применение GPT-4 для РНК-секвенирования

Новый «ИИгрок»: что мы знаем о Grok?

Как обнаружить галлюцинации в LLM?

Open Source в российском ИИ: исследование ландшафта

Рисуем с нейросетями: Есть ли у ИИ-художника свой стиль?

Введение в нейросети: что, зачем и как?

6 нейросетей для создания презентаций: тестируем и проверяем

Создание ИИ-ассистента, который отвечает на вопросы пользователей по базе знаний

Нейросетевой чип с интерфейсом, привычным Embedded программисту

Ближайшие события

Как айтишникам быстро выучить английский с помощью ChatGPT?

7 примеров ИИ, которых не хватает прямо сейчас

Улыбка робота: предсказание и имитация выражения лица человека

Использование ML и новых методов кластеризации для борьбы с COVID-19: Революция в выявлении вирусных мутаций

Книга «Генеративное глубокое обучение. Как не мы рисуем картины, пишем романы и музыку. 2-е межд изд.»

AFCOM: Бум ИИ стимулирует инновации в проектировании и строительстве ЦОД

Что такое task contamination и почему one-shot и zero-shot заподозрили в нечестности

Вклад авторов