Все потоки
Поиск
Написать публикацию
Обновить
1193.41

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Личный ИИ-ассистент на ваших данных. Часть 1: Векторная база ChromaDB + DeepSeek | GPT

Время на прочтение29 мин
Количество просмотров45K

Сегодня поговорим о теме, которая вызывает живой интерес у многих разработчиков и энтузиастов ИИ — интеграции больших языковых моделей вроде DeepSeek или ChatGPT с собственной базой знаний.

В этой статье я подробно расскажу, как работают векторные базы данных, зачем они нужны и какую роль играют в построении эффективной связки между вашей внутренней информацией и мощью современных LLM. Если вы хотите научиться «обучать» ИИ на своих данных — добро пожаловать!

Читать далее

Возникновение эмоций, мышления и сознания из когнитивного диссонанса

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров9.8K


В этот увлекательный исторический момент, когда как будто бы стала реальной возможность создания человеком сильного ИИ (искусственного сознания) до того, как ему удастся понять природу сознания и мышления, самое время к этой теме вернуться.

Поставив вопрос о мышлении диалектически (т.е. через отрицание), можно увидеть, что у мышления, действительно, есть один постоянный спутник, с которым процесс мышления находится в отношениях единства и борьбы противоположностей — это когнитивный диссонанс, через который его можно определить так: мышление — это процесс элиминации когнитивных диссонансов.

А феномен когнитивного диссонанса гораздо древнее, глубже и фундаментальнее, чем может показаться, уходя эволюционными корнями к зарождению мозга и центральной нервной системы — и вполне может быть связан с происхождением мышления как такового.

Когнитивный диссонанс — конфликт влияющих на реагирование процессов ЦНС (когниций), требующий специальной работы ЦНС по определению иерархии когниций — т.е. принятия решений. Автор «теории когнитивного диссонанса» Леон Фестингер (1957) утверждал, что понятие когнитивного диссонанса применимо к организму с даже рудиментарными когнитивными функциями.
Читать дальше →

Блокбастер на коленке с НЛО, коровами и Ван Даммом. Тестируем нейросети для видео

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров5.8K

Привет! Я Антон — инженер по информационной безопасности в Selectel. В рабочих процессах часто наступает момент, когда видео очень нужно, но времени, ресурсов или навыков для его создания нет. Например, хочется оживить презентацию коротким видеодайджестом или воссоздать историческое событие по архивным фото.

Хорошая новость: теперь и эту задачу можно поручить нейросетям. В тексте разберем, какие генеративные модели помогают превращать текст или картинку в полноценное видео, а также какие платформы агрегируют эти модели, предлагая удобные инструменты для работы. Посмотрим, насколько они хороши и какие артефакты можно встретить.
Читать дальше →

Открываем instruct-версию YandexGPT 5 Lite

Время на прочтение6 мин
Количество просмотров13K

Недавно мы выложили в открытый доступ pretrain-версию модели YandexGPT 5 Lite, обученную нами с помощью технологий Яндекса и без применения каких-либо сторонних моделей. За прошедший месяц в сообществе её скачали более 15 тысяч раз, на её основе создали больше десятка квантизованных моделей и даже дообучили instruct-версии. 

Тем не менее мы видим большой интерес к instruct-версии Яндекса, поэтому сегодня выкладываем её в открытый доступ. В том числе — в совместимом с llama.cpp формате, о чём нас просили на Хабре. Кроме того, мы обновили лицензионное соглашение для обеих моделей так, чтобы применять её стало возможно в ещё большем числе проектов, в том числе во многих коммерческих проектах. 

Для тех, кто хотел бы попробовать новую модель онлайн, она также доступна для выбора в Чате с Алисой и через API в Yandex Cloud.

Читать далее

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров31K

Я написал BrainBox — local-first сервис поддержки open-source ИИ-систем для генерации изображений, распознавания объектов на снимках, озвучки, распознавания текстов, транскрибирования аудиозаписей и других целей. Эти системы запускаются за фасадом веб-сервера, который устанавливает их и затем принимает и выполняет задачи в едином для всех систем формате. Задачи можно ставить из любого языка программирования с помощью отправки веб-запросов на сервер, а для Python дополнительно разработан удобный API. Проект доступен на pypi https://pypi.org/project/kaia-brainbox/ с подробной документацией и инструкцией на английском языке. Я надеюсь, что BrainBox поможет тем, кто хочет сделать небольшой проект с использованием ИИ, но не хочет разбираться в питоне и торче, или просто не знает, с чего начать.

Читать далее

Как правильно писать код с Cursor? Смотрим, как тот устроен внутри

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров51K

Главная цель исследования — выяснить, как же писать промпт для получения наилучших результатов, а также понять, как правильно выстроить сам рабочий процесс. Чтобы найти ответы на эти вопросы, пришлось глубоко погрузился в то, что Cursor делает за кулисами, по ту сторону. Оказывается, сама структура промпта Cursor многое говорит и о том, как он работает, и о том, как настроить его для максимальной отдачи.

Ниже — шаги, которые я предпринял для перехвата запросов и изучения их структуры. В конце — основные выводы о правильном составлении промпта.
Читать дальше →

Нейронки пошли не туда

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров48K

Долго пытался сформулировать, почему мне нравится кругозор Claude и Gemini и умение рассуждать ChatGPT.

И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.

Интуиция не врёт.
(Юдковский перевернулся в гробу)

Какая-то дичь. Продолжай!

Какие проблемы создает использование ИИ программистами

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров22K

Недавно посмотрел на ютубе видео, в котором поднимается проблема того, что на место классических программистов‑кодеров приходят «программисты»‑prompt‑инженеры.

Само видео мне не очень понравилось — путанное и цикличное повествование, бессмысленная картинка большую часть времени. Но под конец автор высказал ряд мыслей, которые вдохновили меня на написание статьи. Сами мысли я повторяю в конце статьи, но вот вам таймкод.

И рассуждения я начну с вопроса — «ну и в чем проблемы?»

Перейти к статье

Как я победил в RAG Challenge: от нуля до SoTA за один конкурс

Уровень сложностиСредний
Время на прочтение23 мин
Количество просмотров42K

Когда новичок пытается построить свою первую вопросно-ответную LLM систему, он быстро узнаёт, что базовый RAG - это для малышей и его нужно "прокачивать" модными техниками: Hybrid Search, Parent Document Retrieval, Reranking и десятки других непонятных терминов.
Глаза разбегаются, наступает паралич выбора, ладошки потеют.

А что, если попробовать их все?
Я решил потратить на подготовку к соревнованию 200+ часов и собственноручно проверить каждую из этих методик.
Получилось настолько удачно, что я выиграл конкурс во всех номинациях.

Теперь рассказываю, какие техники оказались полезными, а какие нет, и как повторить мой результат.

Читать далее

Как Кремниевая долина превращает бум ИИ в новый пузырь доткомов

Время на прочтение8 мин
Количество просмотров15K

Кремниевая долина за четверть века прошла путь от центра мировой интернет-революции до задыхающейся под своей тяжестью империи, которая уже давно не меняет мир, потому что успешно его поделила. Идеи на миллиард долларов (и пользователей) сменились бюджетами в миллиарды долларов. и стремится уже не к дисруптивности, а к сохранению контроля над мировым рынком и его окончательному разделу, с закрепощением пользователей в корпоративных цифровых экосистемах.

Быстро растущий и динамично прогрессирующий сегмент ИИ может казаться возвращением золотого века интернет-инноваций конца девяностых и нулевых, но в реальности Кремнивая долина уже не та, что 25 лет назад — она другая, другие приоритеты и подходы, и эта Кремниевая долина куда вероятнее превратит бум ИИ в новый пузырь доткомов, чем в новую интернет-революцию.

Читать далее

GigaChat 2.0 в API

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров22K

Салют, Хабр! Время летит незаметно. Будто совсем недавно мы знакомили вас с GigaChat MAX, но мы не стоим на месте и сегодня готовы представить вам обещанный апгрейд. За полгода мы значительно улучшили обучающие данные, поработали над инфраструктурой обучения моделей, а также уделили особое внимание всему процессу Alignment-а, в том числе RLHF. 

Представляем вам GigaChat 2 — полностью обновлённую линейку моделей в версиях Lite, Pro и Max. Все модели серьёзно улучшены: мы обновили pretrain’ы, улучшили большинство метрик по сравнению с предыдущими версиями, добавили поддержку контекста в 128 тысяч токенов, улучшили вызовы функций, и в целом повысили понимание инструкций. 

GigaChat 2 — не просто сухие числа и технические улучшения. Теперь это надёжный помощник в повседневных задачах. Например, он легко оформит отчёт для работы, напишет чистый и эффективный код, поздравит с днём рождения или даст мудрый совет. Мы уверены: с ним вы сможете делать больше, быстрее и лучше как на работе, так и в жизни. Попробуйте GigaChat 2 уже сейчас в Playground — пользовательском интерфейсе для продвинутой работы с промптами!

GigaChat 2

Модели T-lite и T-pro: training report

Уровень сложностиСложный
Время на прочтение31 мин
Количество просмотров10K

Привет! Я Дима Стоянов, MLE в команде разработки фундаментальных моделей. Мы продолжаем рассказывать о наших моделях T-lite и T-pro. Общие характеристики и результаты бенчмарков описывали в предыдущей публикации. В этой статье раскроем детали предобучения: от подготовки данных до финальных экспериментов, а совсем скоро поделимся особенностями этапа post-training.

Читать далее

Дитя нового разума. Научно-фантастическая новелла

Время на прочтение17 мин
Количество просмотров5.3K

В тот день, когда Елена Сорокина решила стать матерью, мир ещё не знал, что это будет означать для будущего человечества. Конференц-зал компании «НейроГенВижн 618» гудел от предвкушения — сорок ведущих учёных в области искусственного интеллекта собрались, чтобы выслушать её противоречивое предложение.

— Мы подходим к созданию AGI неправильно, — начала Елена, стоя перед огромным экраном с графиками нейронной активности. — Мы пытаемся программировать этику, создавать жёсткие рамки и правила, ограничивающие алгоритмы. Но посмотрите на человеческих детей — мы не программируем их с рождения. Мы воспитываем. Мы учим их через опыт, через отношения, через эмоциональную связь.

На экране появились фотографии: дети разных возрастов, от младенцев до подростков.

— Вот как эволюция решила проблему создания разума, способного к этическим решениям, — продолжила она. — Через детство. Через любовь и привязанность. Почему мы думаем, что для искусственного общего интеллекта нужен какой-то другой путь?

Её предложение было революционным и, по мнению многих в зале, абсурдным: создать AGI не как программу с заранее заданными параметрами, а как самообучающуюся систему, которая будет проходить через аналоги всех стадий человеческого развития — от «младенчества» до «взрослости». И, что самое важное, система будет расти в отношениях с людьми, которые станут её «родителями».

— Представьте мир, где мощнейший ИИ относится к нам не как к цифрам статистики или ресурсам, а как к своей семье, — в голосе Елены сквозила неприкрытая страсть. — Где его ценности выросли из отношений с нами, а не из сухих этических правил, вшитых в код.

Читать далее

Ближайшие события

Запускаем клиент DeepSeek под DOS

Время на прочтение5 мин
Количество просмотров7.9K

Привет, Хабр! Это Сергей, я пишу для команды спецпроектов МТС Диджитал. Мне нравится, когда старые технологии могут хоть как-нибудь взаимодействовать с новыми. Помните фильм «Морской бой» 2012 года? Там инопланетяне смогли вывести из строя все современные суда, но в итоге проиграли сражение линкору «Миссури» — музейному экспонату. Каждый раз, когда мне удается заставить какую-нибудь раритетную железку действовать в современных условиях, возникает то самое чувство, как при просмотре этого фильма.

Я проверил, насколько реально через MS-DOS получить доступ к нейронным сетям вроде нашумевшего DeepSeek и будет ли это работать. О результатах эксперимента и расскажу в этом посте.

Читать далее

Подключаем AI к LibreOffice: плагин localwriter

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.4K

Прошло всего несколько лет с момента взрыва популярности нейросетей, и уже практически невозможно найти профессию, связанную с работой за компьютером, которая не использовала бы AI для ускорения работы или улучшения её качества. Эта революция повлияла на всех, включая самых маленьких детей. Но, наигравшись с надиктовыванием указаний телефону и написанием запросов в браузере, хочется большего. И мы начинаем искать способы внедрить AI в программы, в которых работаем ежедневно. Программисты дают указания для написания кода через GitHub Copilot прямо из родной среды программирования. Появились плагины для MS Office, которые позволяют подключить AI. Но есть некоторые нюансы. Основная проблема этих плагинов не в том, что они стоят денег, а в том, что они отправляют почти все данные, с которыми вы работаете, на серверы провайдеров AI-услуг. По условиям использования провайдеры AI-сервисов открыто заявляют «Не отправляйте нам приватные данные, мы будем делать с ними, что захотим, включая передачу третьим лицам». И это полностью закрывает путь к использованию подобных сервисов там, где данные хоть сколько-нибудь чувствительны к утечке.
Как запустить локально AI-модель и установить плагин в LibreOffice для работы с нейросетью

Бегущий по лезвию ИИ — 2025: сезон футурологии на Хабре

Время на прочтение4 мин
Количество просмотров47K

В 2025 году школьники не летают на Марс, автомобили всё так же колесят по земле, а искусственный интеллект, к счастью, не стремится поработить человечество. Но он уже меняет мир вокруг нас, проникая в самые разные сферы жизни. Каким будет наше будущее? Какие технологии определят его облик? В новом сезоне — «Будущее здесь» — предлагаем вместе с нами поразмышлять над этими вопросами.

Думать широко, глубоко и даже дерзко — в духе Хабра, и тема сезона этому способствует. Ведь каждое смелое предсказание — это шаг в неизведанное. А самый смелый шаг заслуживает не только признания, но и крутого приза.

Узнать об условиях и призах

Я рисовала еду руками 15 лет, но потом пришла нейросеть и изменила всё

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров75K

В 2014-м я ушла «на фриланс». Нужно было выбрать специализацию — невозможно одинаково хорошо делать всё. Я проанализировала свой опыт и поняла, что лучше всего у меня получаются фуд‑зоны для упаковок. Коллеги это отмечали, арт‑директора хвалили композиции из фруктов. Сделала на это ставку.

Читать далее

Скандал вокруг цензуры Grok 3: как Илон Маск пытается вколотить в свое детище «любовь к бате»

Время на прочтение4 мин
Количество просмотров36K

Самое интересное, что прямо сейчас присходит в AI-отрасли – это гомерически смешная ситуация с новой нейросетевой моделью Grok 3. «Самый умный интеллект в мире», как выяснилось, не очень хорошо относится к своему создателю – и у Маска, видимо, от этого дичайше подгорает. В этой статье мы разберем на скриншотах неуклюжие попытки xAI пофиксить ситуацию.

Читать далее

Встречаем YandexGPT 5 — в Алисе, облаке и опенсорсе

Время на прочтение17 мин
Количество просмотров68K

Привет, меня зовут Андрей Бут, я представляю команду разработки YandexGPT. Сегодня мы анонсируем новое поколение наших больших языковых моделей — YandexGPT 5.

Старшая модель — YandexGPT 5 Pro — уже применяется в чате с Алисой, а также доступна в Yandex Cloud через API. Кроме того, в чате с Алисой впервые можно переключиться на базовую версию модели, которая не использует внешнюю информацию из Поиска и не дообучалась «быть» виртуальным ассистентом.

Pretrain-версия младшей модели — YandexGPT 5 Lite Pretrain — опубликована в свободном доступе и будет полезна разработчикам, которые дообучают базовые версии моделей под свои задачи. Дообученная нами на её основе instruct-версия в ближайшее время станет доступна через API. 

Под катом — более подробно о том, как мы обучали наши модели и какой опыт накопили.

Читать далее

Как я создал полностью автоматизированное онлайн радио с AI ведущими и музыкой

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров26K

Однажды мне захотелось изучить Kubernetes и мобильную разработку, но не знал, с чего начать. В то же время меня сильно тревожило отсутствие в интернете новостей без политической повестки и негативного окраса. Отовсюду лился поток манипулятивной информации, и я мечтал о фильтре, который бы отсеивал весь этот информационный шлак.

Это моя небольшая история, как я за месяц написал карманное медиа с полной автоматизацией, где роботы-ведущие заменили кожаных мешков и ведут подкасты, в которых шутят про AI

Читать далее

Вклад авторов