Статьи / Закладки / Профиль Xom / Хабр

Александр Хомяков@Xom

AI-agents, RAG, NLP, Philosophy AI

Хабр Карьера

ПрофильСтатьи12ПостыНовостиКомментарии362

@AleksandrTallinn 26 авг в 05:53

Субъективное первично, объективное — вторично

Средний

47 мин

ФизикаНаучно-популярноеЧитальный зал

На мой взгляд, противоречия, накопившиеся в современной науке, невозможно разрешить, не изменив самого мировоззрения научного сообщества. Которое основано на идее, что существует некая окончательная истина, верная для всех, и задача науки — найти её, чтобы понять, как всё устроено «на самом деле».

Новое мировоззрение предполагает, что любое восприятие Мира субъективно и ограниченно. То есть никто и никогда не сможет воспринять Мир всесторонне полно и глубоко, а любая «истина» относительна и условна. Однако эти условные «истины» можно успешно применять, не претендуя на их окончательность и универсальность. В таком подходе выражение «на самом деле» теряет смысл, ведь абсолютного, совершенного восприятия не существует.

-2

@dmitrifriend 7 июл в 15:22

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

Средний

13 мин

4.3K

Блог компании BotHubПрограммирование * Машинное обучение * Искусственный интеллектБазы данных *

Обзор

В первой части мы разобрали теорию text‑to‑SQL: как LLM заменяют разработчиков, почему RAG и CoT спасают от галлюцинаций и зачем Scale AI дообучает ChatGPT-4. Но теория неполна без практики! В этом материале — жёсткое тестирование моделей (ChatGPT o3-mini‑high, ChatGPT 4.1, Claude Sonnet 4, ChatGPT o3, Gemini 2.5 Pro, DeepSeek R1–0528) на бенчмарке LiveSQLBench.

6 моделей, 10 задач, сложность от ★★ до ★★★★★★★★★★. Проверим, как они считают лунные помехи, генерируют SQL для криптобирж и ищут артефакты в музеях.

+18

@redmadrobot 6 июн в 16:44

Continuous Thought Machine: как Sakana AI научила модель думать тиками

12 мин

1.4K

Блог компании red_mad_robotИскусственный интеллектИсследования и прогнозы в IT *

Аналитический центр red_mad_robot продолжает следить за архитектурными прорывами в мире AI. В этот раз — экспериментальная модель от команды Sakana AI, которая предлагает мыслить не в терминах слоёв, а в терминах времени. Их Continuous Thought Machine (CTM) — попытка встроить в нейросеть внутреннюю динамику, вдохновлённую человеческим мозгом.

Разбираем, как устроена архитектура, что такое «внутренние тики» и зачем нейросети синхронизировать собственные мысли — на примерах из CV, сортировки, Q&A и RL.

+14

@21_copilots 26 дек 2024 в 12:33

11 способов принимать решения без стресса и сомнений

Простой

16 мин

12K

Блог компании MinervasoftУправление персоналом * Управление продуктом * Управление проектами * Удалённая работа

Обзор

Новый год — время когда хочется подводить итоги и планировать то, что никогда не воплотится в реальность. Как принимать решения, чтобы они реально меняли жизнь к лучшему?

+13

@EddyLan 13 окт 2024 в 06:20

ИИ без иллюзий. Развенчивание мифов

Простой

5 мин

23K

Natural Language Processing * Машинное обучение * Искусственный интеллект

Мнение

В своем подкасте я грозился сам почитать статью GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models ученых из Apple и разобраться. Почитал. Разобрался. Забавная статья. Забавная не по содержанию, а по выводам, которые можно сделать, если читать между строк и выйти за границы статьи.

+68

179

@PatientZero 21 авг 2024 в 11:12

Стала ли AlphaGeometry прорывом в ИИ?

Средний

10 мин

7.4K

Алгоритмы * Математика * Искусственный интеллект

Мнение

Перевод

Примерно полгода назад математическое сообщество услышало новость о том, что исследователи DeepMind создали ИИ-систему, решающую геометрические задачи с Международной математической олимпиады на уровне, близком к золотым медалистам ММО. (Эту новость обсуждали в сабреддите \math, см., например, здесь и здесь.) За этими новостями, как часто бывает с новостями о прогрессе ИИ, последовала волна страха и ужаса, усиленная множеством громких газетных статей с картинками (разумеется, сгенерированными ИИ), на которых искусственные мозги решают ужасно сложные уравнения. По коллективной спине математического сообщества побежали мурашки, снова всплыли на поверхность обычные экзистенциальные вопросы о будущем человеческого интеллекта, а Интернет заполнили мемы о грядущем восстании машин.

Я бы хотел взглянуть на эту тему под новым углом. (Предупреждение: возможно, для вас он не будет новым. Если вы имели дело с евклидовой геометрией, понимаете основы линейной алгебры и внимательно читаете журнал Nature, то могли прийти ко всем этим выводам самостоятельно. Но поскольку некоторые критичные аспекты изложены мелким шрифтом (вероятно, намеренно), я всё равно считаю, что их нужно сделать более очевидными.)

Я узнал об этих исследованиях, когда кто-то выложил ссылку на пресс-релиз DeepMind в групповом чате моих друзей, любящих математику. Один мой друг с небольшими нотками паники рассказывал, что какой-то ИИ смог решить какую-то сложную задачу с ММО при помощи рассуждений, состоящих примерно из двухсот логических шагов. Вскоре все в чате начали грустно шутить о своём неизбежном увольнении и безработице.

+51

@myops 16 авг 2024 в 10:11

Что не так с ИИ-картинками

Простой

24 мин

19K

Блог компании Альфа-БанкДизайнИскусственный интеллект

Мнение

«Китайский мудрец, сидя на берегу реки, сетует на расплодившиеся вокруг технологии», — такой текст я вбила в какую-то из многочисленных нейросетей, генерирующих картинки. Судя по всему, вместо расплодившихся вокруг технологий китайский мудрец случайно получил расплодившиеся ноги.

ИИ, с ним такое бывает.

+50

@pestich 20 окт 2023 в 11:41

Классификация текстов в spaCy: пошаговая инструкция

Простой

5 мин

Python * Машинное обучение *

Из песочницы

Вы узнаете, как реализовать классификатор текстов при помощи библиотеки spaCy, а также несколько полезных лайфхаков, которые помогут ускорить обработку данных.

@Kouki_RUS 31 янв 2022 в 12:47

Retrieval Transformer в картинках

6 мин

Машинное обучение *

Перевод

Резюме: Новые языковые модели могут быть намного меньше GPT-3, но при этом достигать сравнимых результатов благодаря использованию запросов к базе данных или поиску информации в Интернете. Ключевая идея заключается в том, что построение все более и более крупных моделей — не единственный способ повысить качество.

Последние несколько лет ознаменовались появлением больших языковых моделей (Large Language Models, LLM) — моделей машинного обучения, которые способствовали быстрому развитию сферы машинной обработки и генерации естественного языка. Некоторые из основных вех развития области с 2017 года включают в себя:

Читать дальше →

@AyratGil 19 янв 2021 в 20:01

Глубокие нейронные деревья принятия решений

17 мин

13K

Машинное обучение * TensorFlow * Python *

Перевод

Глубокие нейронные сети доказали свою эффективность при обработке данных таких, как изображения и аудио. Однако для табличных данных более популярны древовидные модели. Хорошим свойством древовидных моделей является их естественная интерпретируемость. В этой работе мы представляем Deep Neural Decision Trees (DNDT) –древовидные модели, реализованные нейронными сетями. DNDT внутренне интерпретируем. Тем не менее, поскольку это также нейронная сеть (NN), ее можно легко реализовать с помощью инструментария NN и обучить по алгоритму градиентного спуска, а не по «жадному» алгоритму. Мы проводим оценку DNDT на нескольких табличных наборах данных, проверяем его эффективность и исследуем сходства и различия между DNDT и обычными деревьями решений. Интересно, что DNDT самообучается как на разделенном, так и на функциональном уровне.

@oulenspiegel 22 окт 2020 в 07:00

Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ

10 мин

180K

Блог компании SberDevicesБлог компании СберNatural Language Processing * Искусственный интеллектМашинное обучение *

Последнее десятилетие в области компьютерных технологий ознаменовалось началом новой «весны искусственного интеллекта». Впрочем, ситуацию в индустрии в наши дни можно, наверное, охарактеризовать уже не как весну, а полноценное «лето ИИ». Судите сами, за последние неполные 10 лет только в области обработки естественного языка (Natural language processing, NLP) произошли уже две настоящие технологические революции. Появившаяся в результате второй из них модель GPT-3 произвела настоящий фурор не только в технологических медиа, но стала знаменитой далеко за пределами научного сообщества. Например, GPT-3 написала для издания «The Guardian» эссе о том, почему ИИ не угрожает людям. GPT-3 сочиняет стихи и прозу, выполняет переводы, ведёт диалоги, даёт ответы на вопросы, хотя никогда специально не училась выполнять эти задачи. До недавних пор все возможности GPT-3 могли по достоинству оценить лишь англоязычные пользователи. Мы в Сбере решили исправить эту досадную оплошность. И сейчас расскажем вам, что из этого получилось.

Источник изображения

Читать дальше →

+152

241

@DesertFlow 16 фев 2019 в 21:04

GPT-2 нейросеть от OpenAI. Быстрый старт

9 мин

150K

Машинное обучение * Искусственный интеллект

Не успели отшуметь новости о нейросети BERT от Google, показавшей state-of-the-art результаты на целом ряде разговорных (NLP) задач в машинном обучении, как OpenAI выкатили новую разработку: GPT-2. Это нейронная сеть с рекордным на данный момент числом параметров (1.5 млрд, против обычно используемых в таких случаях 100-300 млн) оказалась способна генерировать целые страницы связного текста.

Генерировать настолько хорошо, что в OpenAI отказались выкладывать полную версию, опасаясь что эту нейросеть будут использовать для создания фейковых новостей, комментариев и отзывов, неотличимых от настоящих.

Тем не менее, в OpenAI выложили в общий доступ уменьшенную версию нейросети GPT-2, со 117 млн параметров. Именно ее мы запустим через сервис Google Colab и поэкспериментруем с ней.

Читать дальше →

+47

@DanAnastasyev 25 июл 2017 в 05:26

Как научить свою нейросеть генерировать стихи

10 мин

57K

Natural Language Processing * Машинное обучение * Python *

Из песочницы

Умоляю перестань мне сниться
Я люблю тебя моя невеста
Белый иней на твоих ресницах
Поцелуй на теле бессловесном

Когда-то в школе мне казалось, что писать стихи просто: нужно всего лишь расставлять слова в нужном порядке и подбирать подходящую рифму. Следы этих галлюцинаций (или иллюзий, я их не различаю) встретили вас в эпиграфе. Только это стихотворение, конечно, не результат моего тогдашнего творчества, а продукт обученной по такому же принципу нейронной сети.

Вернее, нейронная сеть нужна лишь для первого этапа — расстановки слов в правильном порядке. С рифмовкой справляются правила, применяемые поверх предсказаний нейронной сети. Хотите узнать подробнее, как мы это реализовывали? Тогда добро пожаловать под кат.

Читать дальше →

+71

@SLY_G 18 мар 2017 в 21:20

Что исследователи искусственного интеллекта думают о возможных рисках, связанных с ним

18 мин

20K

Искусственный интеллектБудущее здесь

Перевод

Рисками, связанными с ИИ, я заинтересовался ещё в 2007 году. В то время реакция большинства людей на эту тему была примерно такой: «Очень смешно, возвращайся, когда в это будет верить кто-нибудь, кроме интернет-придурков».

В последовавшие годы несколько чрезвычайно умных и влиятельных фигур, среди которых Билл Гейтс, Стивен Хокинг и Илон Маск, публично поделились своими опасениями по поводу рисков ИИ, а за ними повторяли сотни других интеллектуалов, от оксфордских философов до космологов из MIT и инвесторов из Кремниевой долины. И мы вернулись.

Затем реакция поменялась на: «Ну ладно, парочка каких-то учёных и бизнесменов могут в это верить, но вряд ли это будут настоящие эксперты в этой области, реально разбирающиеся в ситуации».

Отсюда появились такие заявления, как статья в Popular Science "Билл Гейтс боится ИИ, но исследователям ИИ лучше знать":

Поговорив с исследователями ИИ – настоящими исследователями, с трудом заставляющими такие системы вообще как-то работать, не говоря уже о том, чтобы работать хорошо, становится понятно, что они не боятся, что сверхинтеллект вдруг подкрадётся к ним, ни сейчас, ни в будущем. Несмотря на все пугающие истории, рассказываемые Маском, исследователи не спешат строить защитные комнаты и самоуничтожение с обратным отсчётом.

Читать дальше →

+11

155

@marks 9 фев 2017 в 17:07

Google DeepMind изучает вопросы сотрудничества нескольких ИИ-агентов

4 мин

6.8K

Искусственный интеллектБудущее здесь

Искусственный интеллект — сфера, в которой сейчас занято большое количество инженеров и ученых. Практически каждый день появляются новости о разработке той либо иной формы слабого ИИ, выполняющей определенные функции, которые могут оказаться полезными человеку. Сейчас разработчики из DeepMind, подразделения холдинга Alphabet Inc., занимаются решением интересной и актуальной для современного общества проблемы. А именно — выясняют, при каких условиях несколько ИИ-агентов будут сотрудничать или конкурировать друг с другом.

Проблема, которую пытаются решить специалисты из DeepMind, схожа по сути с так называемой «дилеммой заключенного». Ее можно сформулировать следующим образом. Практически во всех странах наказание участников преступной группировки гораздо жестче, чем наказание преступников-одиночек, совершающих одинаковые преступления. Что, если полиция схватила двух преступников, которые попались примерно в одно и то же время за совершение сходных преступлений, и есть основания полагать, что преступники действовали по сговору? Дилемма появляется в том случае, если предположить, что оба преступника хотят минимизировать собственный срок заключения.

@ragequit 18 фев 2017 в 14:42

Исследователи визуализировали вычисления нейронной сети

2 мин

23K

Визуализация цикла обучения нейронной сети

Команда инженеров проекта Graphcore построила графы активности узлов нейронной сети и их связи в процессе обучения по распознаванию образов, о чем исследователи рассказали в своем блоге.

Изображение выше демонстрирует полный цикл обучения и распознавания нейронной сети Microsoft Research RESNET-34 в декабре 2016 года. Саму систему развернули на базе IPU — интеллектуального графического процессора, как его называют создатели, еще в середине 2016 года. Полученные данные раскрасили для того, чтобы выделить различную плотность вычислений, производящиеся нейронной сетью.

Читать дальше →

+24

@SLY_G 28 фев 2017 в 20:44

Становясь умнее, машины начинают обучаться почти так же, как мы

10 мин

17K

Перевод

Исследования показывают, что компьютерные модели, известные, как нейронные сети, используемые во всё возрастающем числе приложений, могут учиться распознавать последовательности в данных по тем же алгоритмам, что и человеческий мозг.

Мозг решает свою каноническую задачу – обучение – подстраивая множество своих соединений по неизвестному набору правил. Чтобы раскрыть эти правила, учёные 30 лет назад начали разрабатывать компьютерные модели, пытающиеся воспроизвести процесс обучения. Сегодня в растущем числе экспериментов становится видно, что эти модели ведут себя очень похожим на реальный мозг образом при выполнении определённых задач. Исследователи говорят, что эта похожесть говорит о базовом соответствии между алгоритмами обучения мозга и компьютера.

Алгоритм, используемый компьютерной моделью, называется машиной Больцмана. Он изобретён Джеффри Хинтоном и Терри Сейновски в 1983 году [на самом деле, в 1985 – прим. перев.]. Он выглядит весьма многообещающим в качестве простого теоретического объяснения нескольких процессов, происходящих в мозгу – развития, формирования памяти, распознавания объектов и звуков, цикла сна и бодрствования.

Читать дальше →

+14

101

@alizar 25 фев 2017 в 09:02

Нейросеть DeepCoder учится программировать, заимствуя код у других программ

4 мин

49K

Искусственный интеллект

Условная матрица неточностей для нейросети и тестового набора из 500 программ длиной в 3 строчки. Каждая ячейка содержит среднюю вероятность ложно-положительного результата (крупным шрифтом) и количество тестовых программ, из которых это значение выведено (меньшим шрифтом, в скобках). Насыщенность цвета коррелирует с вероятностью ложно-положительного результата

У программистов скоро появится хороший помощник: умная нейросеть, которая способна выполнять рутинные задачи. Более того, с помощью такой нейросети люди могут создавать программы, даже не зная синтаксиса конкретного языка и фактически не умея программировать. Нужно составить алгоритм и поставить задачи — а нейросеть напишет код для их решения.

Читать дальше →

+17

146

@alizar 7 апр 2017 в 12:47

Google изобрела распределённый ИИ для миллиарда смартфонов

3 мин

34K

СмартфоныИскусственный интеллектНаучная фантастикаБудущее здесь

Только подумайте, какова совокупная вычислительная мощность всех смартфонов в мире? Это огромнейший вычислительный ресурс, который вполне может эмулировать даже работу человеческого мозга. Нельзя, чтобы такой ресурс простаивал без дела, тупо прожигая киловатты энергии на чатики и ленты социальных сетей. Если отдать эти вычислительные ресурсы единому распределённому мировому ИИ, да ещё снабдить его данными с пользовательских смартфонов — для обучения — то такая система может осуществить качественный скачок в данной области.

Читать дальше →

+17

@SLY_G 12 апр 2017 в 14:56

Искусственный интеллект против докторов: когда диагноз будет ставить компьютер

22 мин

15K

Искусственный интеллектМозгБиотехнологии

Перевод

В некоторых тестах глубинное обучение уже работает лучше людей-экспертов

В один из вечеров прошлого ноября 54-летняя женщина из Бронкса прибыла в отделение скорой помощи медицинского центра Колумбийского университета с жалобой на сильную головную боль. У неё всё расплывалось перед глазами, а левая рука онемела и ослабла. Врачи осмотрели её и порекомендовали сделать компьютерную томографию головы.

Через несколько месяцев, утром одного из январских дней, четыре будущих рентгенолога собрались перед экраном компьютера на третьем этаже госпиталя. В комнате не было окон, и её освещал лишь включённый экран. Анджела Линели-Дипл [Angela Lignelli-Dipple], заведующая отделом нейрорентгенологии университета, стояла за интернами с карандашом и планшетом. Она учила их разбираться в КТ-снимках.

Читать дальше →

+16

В рейтинге: Не участвует

Откуда: Санкт-Петербург, Санкт-Петербург и область, Россия

Дата рождения: 30 марта 1968

Зарегистрирован: 28 февраля 2012

Активность: сегодня в 07:33

Директор по продукту, ИИ агенты

Ведущий

От 500 000 ₽

Управление проектами

Управление людьми

Управление разработкой

Субъективное первично, объективное — вторично

Топ LLM для задач text‑to‑SQL: результаты теста DeepSeek R1-0528, Gemini 2.5 Pro, o3 (и ещё трёх моделей)

Continuous Thought Machine: как Sakana AI научила модель думать тиками

11 способов принимать решения без стресса и сомнений

ИИ без иллюзий. Развенчивание мифов

Стала ли AlphaGeometry прорывом в ИИ?

Что не так с ИИ-картинками

Классификация текстов в spaCy: пошаговая инструкция

Retrieval Transformer в картинках

Глубокие нейронные деревья принятия решений

Сбер выложил русскоязычную модель GPT-3 Large с 760 миллионами параметров в открытый доступ

GPT-2 нейросеть от OpenAI. Быстрый старт

Как научить свою нейросеть генерировать стихи

Что исследователи искусственного интеллекта думают о возможных рисках, связанных с ним

Google DeepMind изучает вопросы сотрудничества нескольких ИИ-агентов

Исследователи визуализировали вычисления нейронной сети

Становясь умнее, машины начинают обучаться почти так же, как мы

Нейросеть DeepCoder учится программировать, заимствуя код у других программ

Google изобрела распределённый ИИ для миллиарда смартфонов

Искусственный интеллект против докторов: когда диагноз будет ставить компьютер

В некоторых тестах глубинное обучение уже работает лучше людей-экспертов

Информация

Специализация