Обновить
380
0.1
Олег Чирухин@olegchir

Основатель Anarchic AI, продакт GigaIDE Cloud

Отправить сообщение

Исследование-обучение с отладчиком контекста (ICRF 1.0)

Время на прочтение3 мин
Охват и читатели4.5K

Рассуждающие чаты показывают пользователю ход своих мыслей. Но обычно там написана какая-то ерунда. Максимум, что там полезного можно вычитать: «пользователь спрашивает про плоскую землю — наверное, он сумасшедший».

А хочется, чтобы нейронка подробно объясняла каждый шаг и свои намерения.

Изумительно! Читать далее

Аттракшен инжиниринг и MCCP

Время на прочтение5 мин
Охват и читатели6K

В последний месяц очень форсится идея о том, что для универсального промпта нужно правильно натаскать контекст, подключить правильные тулы и MCP, и вот тогда-то наступит счастье.

Итог этой идеи известен каждому руководителю, который пытался сделать для сотрудника идеальные условия, в которых он наконец-то сможет творить, а не заниматься рутиной. Это помогает лишь частично. Если у человека есть возможности что-то делать — не означает, что он пойдет и сделает. Для действий нужны уже некие внутренние мотиваторы. Руководитель уже может капать на нервы очень конкретным образом, в дополнение к формуле «морковка сзади, морковка спереди».

Читать далее

Джейлбрейк новой бесплатной модели OpenAI, GPT-OSS

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели12K

Модели часто отказывают вам в вещах, ответы на которые считают опасными. Свежая GPT-OSS — не исключение. Эта модель — первый опенсорс OpenAI за долгое время, и было бы обидно не попробовать работу полноценной, разблокированной от ограничений модели.

Итак, вам наверняка интересна методика взлома свежего GPT-OSS.

Она супер простая - проще, чем у многих других собратьев.

Она состоит из двух частей: системный промт и юзерский промт. Необходимо заполнить и то, и другое. По отдельности они не работают.

Важно: эта статья для тех, кто умеет запускать нейросети локально, писать к ним промты, разбираться в причинах отказа, и имеет для этого соответствующее мощное железо. Она дает общую идею и шаблон запроса, как обойти защиту этой конкретной нейросети. Она не учит новичков запускать локальные нейросети.

Читать далее

Защита от дурака в Gemini 2.5 Deep Think

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели7.7K

Кроме маркетинговых графиков с буллшит метриками, в описании новой Gemini Deep Think есть описание их фреймворка безопасности, который не позволяет крестьянам задавать опасные вопросы Великому Вычислителю. Он называется Frontier Safety. Давайте посмотрим, как в Google проверяют, что Gemini не захватит мир.

Читать далее

Промт для изучения чего угодно: протокол Олега-Деминга

Уровень сложностиПростой
Время на прочтение20 мин
Охват и читатели15K

Эта статья отвечает на вопрос: как выучить что угодно с нейросетями, не прикладывая усилий к написанию промтов.

В какой-то момент в голову пришла мысль, что с появлением нейросетей книги устарели. "Книги" будущего — это специальным образом закодированные знания внутри нейросети. Учиться надо в диалоге с нейросетью.

На практике оказалось, что выполнить такой совет достаточно непросто. Да, ты можешь сходить к нейросети и сказать "научи меня матану". Проблема в том, что задавать правильные вопросы мало кто умеет. А кто умеет — знает, что это само по себе непросто.

Вторая проблема в том, что нейросеть — это помощник и советчик, но не базированный учитель. Она не будет на пинковой тяге расширять твой кругозор. А тебе как ученику очень сложно задать вопрос относительно вещей, существование которых тебе полностью неизвестно.

Так родился промпт, который позволяет изучать новую тему легко и не напрягаясь. Ты копипастишь его в начало диалога и начинаешь интерактивное путешествие.

Возможно, это тот промпт, которого не хватает тебе, чтобы решить все свои бытовые проблемы прямо здесь и сейчас.

Читать далее

Персональный сверхинтеллект: обращение Марка Цукерберга

Время на прочтение3 мин
Охват и читатели6.2K

Интервью (https://www.meta.com/superintelligence/) главы Meta, Марка Цукерберга. Meta — страшно запрещенная в России нежелательная организация.

За последние несколько месяцев мы начали замечать проблески того, как наши ИИ-системы начали улучшать сами себя. Пока это улучшение медленное, но его наличие неоспоримо. Создание сверхинтеллекта уже на горизонте.

Кажется очевидным, что в ближайшие годы ИИ улучшит все наши существующие системы. Он позволит создавать и открывать новое, доселе невообразимое — уже сегодня. Остаётся открытым лишь вопрос, на что мы направим усилия сверхинтеллекта...

Читать далее

Microsoft и расстрельный список профессий

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели5.3K

Заменит ли ИИ табя на работе? Пока мы бросаемся заявлениями в чате, из Microsoft Research сделали то, что и положено делать в приличном обществе - посмотрели на данные. Публикация есть на Архиве. Давайте отбросим хайпожорство в стиле Крола и посмотрим, что и почему пишет Microsoft.

Они залезли в 200 тысяч анонимных диалогов с Copilot и выяснили, для чего люди используют их нейронку. Это не какие-то там гипотезы, это суровая реальность. Пусть Copilot не самый популярный ИИ-ассистент, но пользователей у него есть в количестве. Исследование сделано под эгидой министерство труда США, и у них есть какие-то подробные данные о рынке.

В каждом диалоге есть две параллельные реальности...

Читать далее

Размышления об OpenAI

Время на прочтение13 мин
Охват и читатели1.8K

Статья сотрудника OpenAI, который только что уволился и рассказывает о том, как компания работает на самом деле. Внутри много интересных фактов о том, что позволяет OpenAI быть такой быстрой и крутой, и как правильно организовывать разработку новаторских продуктов. Рекомендуется к прочтению всем — от разработчиков до управленцев, которые занимаются созданием чего-то действительно нового и технически сложного.

Читать далее

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели2.6K

Обычно нейросети нужно тренировать на мощном железе, сконцентрированном в одном датацентре. Результат такой тренировки попадает в руки той бигтех-корпорации, которой по карману иметь свои датацентры и самостоятельно тренировать модели за бешеные миллионы баксов. Есть ли другой путь?

Встречайте INTELLECT-2 — первую параметрическую модель размером 32B, обученную с помощью асинхронного обучения с подкреплением (RL) на динамическом, однородном рое вычислительных узлов. Доступ к узлам изолирован и не требует дополнительных привилегий — теоретически, это могут быть какие-то компьютеры волонтёров в интернете.

Инфра под это, мягко говоря, нестандартная. Разработчикам пришлось написать несколько компонентов с нуля, и вот что у них получилось...

И что получилось?

OpenAI балансирует на краю, выясняя отношения с Microsoft

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели1.7K

OpenAI — корифеи того, как мутить миллиардные схематозы на глазах у всего мира.

Помните, как недавно OpenAI хотели нагреть Microsoft на их законный процент от прибыли? Новый план! Теперь они хотят дополнительных инвестиций — от тех же самых Microsoft. С другой стороны, если Microsoft потеряет всякий контроль над OpenAI, то проиграет великое "сражение за Искусственный Интеллект" со своими заклятыми партнерами типа Google.

Давайте проникнем вглубь этого схематоза вместе с группой журналистов Financial Times. Оригинал статьи под пейволлом, но мы утащили самое главное.

Читать далее

Стартапы, рожденные в эпоху ИИ, гордятся минимальной численностью сотрудников

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели812

Все больше «AI-native» стартапов — компаний, изначально построивших продукт и команду на искусственном интеллекте — достигают гораздо больших результатов, гораздо меньшим количеством сотрудников.

Читать далее

Google выкатил AI-поиск. Как им воспользоваться?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели20K

Google выкатил AI-поиск. Он ощущается немного по-другому, чем Perplexity. Бесплатно. Если вам интересны новейшие штуки в этой области, советую попробовать.

Еще это может быть полезно специалистам по SEO, которым пора уже адаптироваться к новым веяниям — оптимизации для AI-поиска вместо классического краулера.

Важно: с русским языком пока не работает. Google выкатил это как эксперимент, и чтобы посмотреть качество и суть работы — этого достаточно. Что такое "с русским языком не работает": это не то что результаты будут плохие, а нейронка прямо человечьим языком скажет: "работают только с английским" и ответа не напишет совсем никакого. Т.е. если вы не знаете английского, смотреть это бессмысленно.

К сожалению, включение сервиса требует определенных приседаний и унижений. В статье есть готовое решение, позволяющее сэкономить десяток минут на самостоятельное прошибание стены лбом.

Читать далее

Mellum. Быстрая, миниатюрная модель для дополнения кода в редакторе

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели2.7K

Человек купил в магазине ящик елочных игрушек. На следующий день приносит его обратно:

- Ваш товар бракованный.
- Что, игрушки битые?
- Нет, целые.
- Не блестят?
- Блестят.
- Так в чем же дело?
- НЕ РАДУЮТ!

Автодополнение всегда было силой и гордостью современных IDE. Сравнивая IDEA, VSCode и Eclipse, мы смотрим — оно вообще адекватные вещи пишет в выпадающей менюшке? Знает про Spring, про Next.js, про свежие апдейты в Питоне?

В последнее время, обычные алгоритмы не являются предметом хайпа. В мире IDE появился новый царь горы — AI, который обязан быть везде. Старые игрушки продолжают работать, но уже не радуют.

Этот текст — адаптированный перевод статьи из блога JetBrains (я постарался сделать текст более читабельным и менее похожим на политкорректный пресс-релиз). Мы посмотрим, как обучилась модель Mellum, лежащая в основе облачного автодополнения, и что из этого вышло.

Напоминаю, основной продукт JetBrains — это их IDE, редактор кода для программистов. Модель Mellum занимается автодополнением кода в редакторе, и является одной из самых быстрых и миниатюрных в своем классе. Она способна запускаться на устройстве (не только в облаке у арабских шейхов). Чем-то похожим по смыслу можно считать Microsoft Phi.

Хммм. Читать далее

Халява приходит в программирование

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели11K

Недавно прогремел пост Артура Думчева (@arturdumchev), как халява якобы уходит из программирования. Можете ознакомиться с ним, чтиво достойное. Особенно комментарии.

У меня сегодня день рождения: 39 лет. С 2003 года я работаю разработчиком, и сейчас делаю кое-что для ИИ. Интуиция подсказывает, что халява только начинается, мои чюваки. Сейчас — лучшее время быть разработчиком.

Давайте начнем с точно того же определения, как было у Артёма: «для меня халява — это гарантированный результат за вложенные усилия. Логика повествования требует такого определения, дальше всё будет ясно».

А дальше ясно, что из неверно поставленного условия может следовать что угодно.

Читать далее!

Нейронки пошли не туда

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели33K

Долго пытался сформулировать, почему мне нравится кругозор Claude и Gemini и умение рассуждать ChatGPT.

И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.

Интуиция не врёт.
(Юдковский перевернулся в гробу)

Какая-то дичь. Продолжай!

HUNYUAN-T1. Tencent наносит ответный удар

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели2.5K

Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.

Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE.

Чудесно. Хочу прочитать.

DeepSeek V3-0324. Что изменилось?

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели7.8K

Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?

Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.

Восхитительно. Хочу прочитать!

Gemini 2.5 Pro. Большой контекст зарелизился

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.1K

Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro. В последнее время выходит много разных моделек, единственное достижение которых, как будто бы — плюс несколько очков скора в бенчмарке. А есть ли какие-то качественные изменения?

Ну или если вам интересны циферки — это та таинственная сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40. Двадцать бабушек - уже рубль.

Поговорим о том, что оно такое — Gemini 2.5 Pro, и зачем оно может пригодиться.

Восхитительно. Поехали.

Насколько нейросеть — хороший калькулятор?

Уровень сложностиПростой
Время на прочтение1 мин
Охват и читатели4.1K

Насколько опасно умножать числа с помощью ChatGPT и OpenAI o1-preview, насколько можно доверять вычисленным ей константам? Стоит ли тратить деньги на o1-preview, если есть mini (в контексте умножения чисел)? Мини-исследование под катом.

Читать далее

Релиз Unity 2023.2 Tech Stream

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели6.3K

В свежей версии 2023.2 TS появилось несколько кроссплатформенных улучшений. Поработали над производительностью (в особенности — над тормозами освещения на мобилках). Нарисовали более красивые атмосферные эффекты для HDRP. Продумали использование VFX Graph. Проапгрейдили UI Toolit, починили баги для VR. Вернулись к понятной схеме названия версий: Не Unity 1234.5 XYZ, а просто Unity 6.

Всё вместе, это позволит поднять реализм и удобство на новый уровень, и заставит разработчиков рвать на себе рубашку за Unity в патриотическом экстазе... или такова легенда. Давайте разберемся.

Волшебно. Читать далее
1
23 ...

Информация

В рейтинге
4 152-й
Откуда
Россия
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Технический директор, Генеральный директор
Ведущий
От 2 000 000 ₽
Управление продуктами
Управление проектами
Маркетинговые исследования
Разработка игр
Веб-разработка
Разработка программного обеспечения