Статья сотрудника OpenAI, который только что уволился и рассказывает о том, как компания работает на самом деле. Внутри много интересных фактов о том, что позволяет OpenAI быть такой быстрой и крутой, и как правильно организовывать разработку новаторских продуктов. Рекомендуется к прочтению всем — от разработчиков до управленцев, которые занимаются созданием чего-то действительно нового и технически сложного.
Продакт GigaIDE Cloud, фаундер Anarchic
INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Обычно нейросети нужно тренировать на мощном железе, сконцентрированном в одном датацентре. Результат такой тренировки попадает в руки той бигтех-корпорации, которой по карману иметь свои датацентры и самостоятельно тренировать модели за бешеные миллионы баксов. Есть ли другой путь?
Встречайте INTELLECT-2 — первую параметрическую модель размером 32B, обученную с помощью асинхронного обучения с подкреплением (RL) на динамическом, однородном рое вычислительных узлов. Доступ к узлам изолирован и не требует дополнительных привилегий — теоретически, это могут быть какие-то компьютеры волонтёров в интернете.
Инфра под это, мягко говоря, нестандартная. Разработчикам пришлось написать несколько компонентов с нуля, и вот что у них получилось...
OpenAI балансирует на краю, выясняя отношения с Microsoft

OpenAI — корифеи того, как мутить миллиардные схематозы на глазах у всего мира.
Помните, как недавно OpenAI хотели нагреть Microsoft на их законный процент от прибыли? Новый план! Теперь они хотят дополнительных инвестиций — от тех же самых Microsoft. С другой стороны, если Microsoft потеряет всякий контроль над OpenAI, то проиграет великое "сражение за Искусственный Интеллект" со своими заклятыми партнерами типа Google.
Давайте проникнем вглубь этого схематоза вместе с группой журналистов Financial Times. Оригинал статьи под пейволлом, но мы утащили самое главное.
Стартапы, рожденные в эпоху ИИ, гордятся минимальной численностью сотрудников
Все больше «AI-native» стартапов — компаний, изначально построивших продукт и команду на искусственном интеллекте — достигают гораздо больших результатов, гораздо меньшим количеством сотрудников.
Google выкатил AI-поиск. Как им воспользоваться?

Google выкатил AI-поиск. Он ощущается немного по-другому, чем Perplexity. Бесплатно. Если вам интересны новейшие штуки в этой области, советую попробовать.
Еще это может быть полезно специалистам по SEO, которым пора уже адаптироваться к новым веяниям — оптимизации для AI-поиска вместо классического краулера.
Важно: с русским языком пока не работает. Google выкатил это как эксперимент, и чтобы посмотреть качество и суть работы — этого достаточно. Что такое "с русским языком не работает": это не то что результаты будут плохие, а нейронка прямо человечьим языком скажет: "работают только с английским" и ответа не напишет совсем никакого. Т.е. если вы не знаете английского, смотреть это бессмысленно.
К сожалению, включение сервиса требует определенных приседаний и унижений. В статье есть готовое решение, позволяющее сэкономить десяток минут на самостоятельное прошибание стены лбом.
Mellum. Быстрая, миниатюрная модель для дополнения кода в редакторе

Человек купил в магазине ящик елочных игрушек. На следующий день приносит его обратно:
- Ваш товар бракованный.
- Что, игрушки битые?
- Нет, целые.
- Не блестят?
- Блестят.
- Так в чем же дело?
- НЕ РАДУЮТ!
Автодополнение всегда было силой и гордостью современных IDE. Сравнивая IDEA, VSCode и Eclipse, мы смотрим — оно вообще адекватные вещи пишет в выпадающей менюшке? Знает про Spring, про Next.js, про свежие апдейты в Питоне?
В последнее время, обычные алгоритмы не являются предметом хайпа. В мире IDE появился новый царь горы — AI, который обязан быть везде. Старые игрушки продолжают работать, но уже не радуют.
Этот текст — адаптированный перевод статьи из блога JetBrains (я постарался сделать текст более читабельным и менее похожим на политкорректный пресс-релиз). Мы посмотрим, как обучилась модель Mellum, лежащая в основе облачного автодополнения, и что из этого вышло.
Напоминаю, основной продукт JetBrains — это их IDE, редактор кода для программистов. Модель Mellum занимается автодополнением кода в редакторе, и является одной из самых быстрых и миниатюрных в своем классе. Она способна запускаться на устройстве (не только в облаке у арабских шейхов). Чем-то похожим по смыслу можно считать Microsoft Phi.
Халява приходит в программирование

Недавно прогремел пост Артура Думчева (@arturdumchev), как халява якобы уходит из программирования. Можете ознакомиться с ним, чтиво достойное. Особенно комментарии.
У меня сегодня день рождения: 39 лет. С 2003 года я работаю разработчиком, и сейчас делаю кое-что для ИИ. Интуиция подсказывает, что халява только начинается, мои чюваки. Сейчас — лучшее время быть разработчиком.
Давайте начнем с точно того же определения, как было у Артёма: «для меня халява — это гарантированный результат за вложенные усилия. Логика повествования требует такого определения, дальше всё будет ясно».
А дальше ясно, что из неверно поставленного условия может следовать что угодно.
Нейронки пошли не туда

Долго пытался сформулировать, почему мне нравится кругозор Claude и Gemini и умение рассуждать ChatGPT.
И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.
Интуиция не врёт. (Юдковский перевернулся в гробу)
HUNYUAN-T1. Tencent наносит ответный удар

Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.
Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE.
DeepSeek V3-0324. Что изменилось?

Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?
Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.
Gemini 2.5 Pro. Большой контекст зарелизился

Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro. В последнее время выходит много разных моделек, единственное достижение которых, как будто бы — плюс несколько очков скора в бенчмарке. А есть ли какие-то качественные изменения?
Ну или если вам интересны циферки — это та таинственная сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40. Двадцать бабушек - уже рубль.
Поговорим о том, что оно такое — Gemini 2.5 Pro, и зачем оно может пригодиться.
Насколько нейросеть — хороший калькулятор?

Насколько опасно умножать числа с помощью ChatGPT и OpenAI o1-preview, насколько можно доверять вычисленным ей константам? Стоит ли тратить деньги на o1-preview, если есть mini (в контексте умножения чисел)? Мини-исследование под катом.
Релиз Unity 2023.2 Tech Stream

В свежей версии 2023.2 TS появилось несколько кроссплатформенных улучшений. Поработали над производительностью (в особенности — над тормозами освещения на мобилках). Нарисовали более красивые атмосферные эффекты для HDRP. Продумали использование VFX Graph. Проапгрейдили UI Toolit, починили баги для VR. Вернулись к понятной схеме названия версий: Не Unity 1234.5 XYZ, а просто Unity 6.
Всё вместе, это позволит поднять реализм и удобство на новый уровень, и заставит разработчиков рвать на себе рубашку за Unity в патриотическом экстазе... или такова легенда. Давайте разберемся.
Эта неделя в мире Java (21 ноября)

Все сенсации, интриги, расследования, которые вам нужны 21 ноября.
Брайан Гёц — гриб (видео под катом, интервью с @boomburum)
jHipster требует Java 21 и не согласен на меньшее
Живой мастер-класс по JUnit от JUnit-джедая
Депо поездов имени В.В. Спринга
Тонна фиксов CVE уязвимостей
Первые попытки поддержать CRaC
Новая поделка: Penna для логов в JSON
Обновы в Quarkus, Micronaut, Payara, OpenLiberty, Mojarra, Grails, Tomcat...
Java-инспекции в IDEA 2023.2

Это ретроспективный пост про Java-инспекции IntelliJ IDEA 2023.2, в преддверии 2023.3 (которая сейчас в состоянии Beta 2). Несмотря на то, что эта версия вышла еще в июле, не все в точности помнят, что же там произошло, и какую версию они вообще используют.
А между тем, там не всё хорошо. Например, баги с тэгом @snippet
до сих пор не поправили.
Чтобы самому воспроизвести новости из ченжлога - нужно набирать много кода и проверять их. Это лень, это мы не делаем. Вместо этого, мы смотрим этот короткий пост с PNG-картинками, показывающими основные фишки.
Залетайте под кат и погнали!
IntelliJ IDEA 2023.2. Долгожданный LSP, встроенный AI-чат, апгрейд до Windows 10 и -Xmx2G

Это ретроспективный пост фичей IntelliJ IDEA 2023.2, в преддверии 2023.3 (которая сейчас в состоянии Beta 2). Несмотря на то, что эта версия вышла еще в июле, не все в точности помнят, что же там произошло, и какую версию они вообще используют.
Идея раздулась до 2 гигабайт хипа, появилась поддержка LSP-серверов, и теперь вам нужно проапгрейдиться с Windows 7 минимум до Windows 10.
Из мелочей: появился чата с нейронкой "AI Assistant". Профилировщик научился отображать подсказки прямо в редакторе, а интеграция с GitLab позволяет меньше переключаться между браузером и IDE.
Хотите узнать подробней?
Эта неделя в мире Java (13 ноября)

Если вам лень читать три тысячи тредов в рассылке OpenJDK и ленты с новостями сотен обновлений фреймворков, то этот дайджест - для вас.
Java-дайджест за последнюю неделю (3 ноября):
• Обзор статей на Хабре
• Новости OpenJDK
• Spring, Jakarta, Web
• IDE, Gradle, тулинг
• Странные фреймворки
Helidon 4 вышел, а никто и не заметил

Те, кто использует Helidon в проде, наверняка точно знают, зачем им это нужно. Что делать остальным? Основная задача хомячка — объяснить детям концепцию смерти. Кажется, точно так же основная задача Helidon для широких народных масс — посмотреть на самые новые фишки Java и понять, нужно вам это или нет. Посмотрим, что же произошло в версии 4.0.0...
Эта неделя в мире Java (3 ноября)

Java-дайджест за последнюю неделю (3 ноября):
• Spring, Jakarta, Web
• IDE и редакторы
• Тестирование
• Статьи и подкасты
• Обзор статей на Хабре
IntelliJ IDEA 2023.2. Language Server Protocol, AI Assistant, IntelliJ Profiler в редакторе, GitLab merge requests, ftw

Только что вышла IntelliJ IDEA 2023.2. В этом релизе в IDE появилась куча интересных фичей и важных улучшений.
Вы можете скачать последнюю сборку с официального сайта, или из бесплатного приложения Toolbox, или из snap-пакетов для Ubuntu.
Этот релиз IntelliJ IDEA 2023.2 представляет вам AI-ассистента, вооруженного набором инструментов машинного обучения. IntelliJ Profiler показывает подсказки в редакторе, делая профилирование более интуитивным и иформативным. Еще, в этом релизе появилась интеграция с GitLab.
В том посте мы пробежимся по всем основным фичам IntelliJ IDEA 2023.2. В отличие от официального анонса, вся европейская политкорректность выкинута на свалку, автор перевода не видит никакой ценности в соблюдении повесточки.
Кроме того, в этот четверг в Питере будет встреча Javawatch, посвященная Java 21. Я прочитаю мини-доклад минут на 30 о новых фичах, и потом мы сможем все вместе собраться и за кружкой пива это обсудить. Анонс события в телеге, обсуждение в чате. Я бывший PMM в JetBrains Big Data и тимлид в Remote Development/Projector, а сейчас работаю над российским дистрибутивом Java - Axiom JDK.