Как стать автором
Обновить
389
0
Олег Чирухин @olegchir

Продакт GigaIDE Cloud, фаундер Anarchic

Отправить сообщение

INTELLECT-2: Первая большая (32B) параметрическая модель с распределенным обучением

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров3.7K

Обычно нейросети нужно тренировать на мощном железе, сконцентрированном в одном датацентре. Результат такой тренировки попадает в руки той бигтех-корпорации, которой по карману иметь свои датацентры и самостоятельно тренировать модели за бешеные миллионы баксов. Есть ли другой путь?

Встречайте INTELLECT-2 — первую параметрическую модель размером 32B, обученную с помощью асинхронного обучения с подкреплением (RL) на динамическом, однородном рое вычислительных узлов. Доступ к узлам изолирован и не требует дополнительных привилегий — теоретически, это могут быть какие-то компьютеры волонтёров в интернете.

Инфра под это, мягко говоря, нестандартная. Разработчикам пришлось написать несколько компонентов с нуля, и вот что у них получилось...

И что получилось?

OpenAI балансирует на краю, выясняя отношения с Microsoft

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.7K

OpenAI — корифеи того, как мутить миллиардные схематозы на глазах у всего мира.

Помните, как недавно OpenAI хотели нагреть Microsoft на их законный процент от прибыли? Новый план! Теперь они хотят дополнительных инвестиций — от тех же самых Microsoft. С другой стороны, если Microsoft потеряет всякий контроль над OpenAI, то проиграет великое "сражение за Искусственный Интеллект" со своими заклятыми партнерами типа Google.

Давайте проникнем вглубь этого схематоза вместе с группой журналистов Financial Times. Оригинал статьи под пейволлом, но мы утащили самое главное.

Читать далее

Стартапы, рожденные в эпоху ИИ, гордятся минимальной численностью сотрудников

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров1.2K

Все больше «AI-native» стартапов — компаний, изначально построивших продукт и команду на искусственном интеллекте — достигают гораздо больших результатов, гораздо меньшим количеством сотрудников.

Читать далее

Google выкатил AI-поиск. Как им воспользоваться?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров25K

Google выкатил AI-поиск. Он ощущается немного по-другому, чем Perplexity. Бесплатно. Если вам интересны новейшие штуки в этой области, советую попробовать.

Еще это может быть полезно специалистам по SEO, которым пора уже адаптироваться к новым веяниям — оптимизации для AI-поиска вместо классического краулера.

Важно: с русским языком пока не работает. Google выкатил это как эксперимент, и чтобы посмотреть качество и суть работы — этого достаточно. Что такое "с русским языком не работает": это не то что результаты будут плохие, а нейронка прямо человечьим языком скажет: "работают только с английским" и ответа не напишет совсем никакого. Т.е. если вы не знаете английского, смотреть это бессмысленно.

К сожалению, включение сервиса требует определенных приседаний и унижений. В статье есть готовое решение, позволяющее сэкономить десяток минут на самостоятельное прошибание стены лбом.

Читать далее

Mellum. Быстрая, миниатюрная модель для дополнения кода в редакторе

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров4.1K

Человек купил в магазине ящик елочных игрушек. На следующий день приносит его обратно:

- Ваш товар бракованный.
- Что, игрушки битые?
- Нет, целые.
- Не блестят?
- Блестят.
- Так в чем же дело?
- НЕ РАДУЮТ!

Автодополнение всегда было силой и гордостью современных IDE. Сравнивая IDEA, VSCode и Eclipse, мы смотрим — оно вообще адекватные вещи пишет в выпадающей менюшке? Знает про Spring, про Next.js, про свежие апдейты в Питоне?

В последнее время, обычные алгоритмы не являются предметом хайпа. В мире IDE появился новый царь горы — AI, который обязан быть везде. Старые игрушки продолжают работать, но уже не радуют.

Этот текст — адаптированный перевод статьи из блога JetBrains (я постарался сделать текст более читабельным и менее похожим на политкорректный пресс-релиз). Мы посмотрим, как обучилась модель Mellum, лежащая в основе облачного автодополнения, и что из этого вышло.

Напоминаю, основной продукт JetBrains — это их IDE, редактор кода для программистов. Модель Mellum занимается автодополнением кода в редакторе, и является одной из самых быстрых и миниатюрных в своем классе. Она способна запускаться на устройстве (не только в облаке у арабских шейхов). Чем-то похожим по смыслу можно считать Microsoft Phi.

Хммм. Читать далее

Халява приходит в программирование

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров18K

Недавно прогремел пост Артура Думчева (@arturdumchev), как халява якобы уходит из программирования. Можете ознакомиться с ним, чтиво достойное. Особенно комментарии.

У меня сегодня день рождения: 39 лет. С 2003 года я работаю разработчиком, и сейчас делаю кое-что для ИИ. Интуиция подсказывает, что халява только начинается, мои чюваки. Сейчас — лучшее время быть разработчиком.

Давайте начнем с точно того же определения, как было у Артёма: «для меня халява — это гарантированный результат за вложенные усилия. Логика повествования требует такого определения, дальше всё будет ясно».

А дальше ясно, что из неверно поставленного условия может следовать что угодно.

Читать далее!

Нейронки пошли не туда

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров48K

Долго пытался сформулировать, почему мне нравится кругозор Claude и Gemini и умение рассуждать ChatGPT.

И наоборот, не нравится (точнее, кажется по большей части бесполезной на практике) умение ChatGPT написать точный, с первого раза работоспособный код. Или там, решить задачки из олимпиады по математике, выдавая потрясающий балл на экзаменах в MIT.

Интуиция не врёт.
(Юдковский перевернулся в гробу)

Какая-то дичь. Продолжай!

HUNYUAN-T1. Tencent наносит ответный удар

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров3.2K

Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.

Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE.

Чудесно. Хочу прочитать.

DeepSeek V3-0324. Что изменилось?

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров11K

Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?

Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.

Восхитительно. Хочу прочитать!

Gemini 2.5 Pro. Большой контекст зарелизился

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.6K

Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro. В последнее время выходит много разных моделек, единственное достижение которых, как будто бы — плюс несколько очков скора в бенчмарке. А есть ли какие-то качественные изменения?

Ну или если вам интересны циферки — это та таинственная сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40. Двадцать бабушек - уже рубль.

Поговорим о том, что оно такое — Gemini 2.5 Pro, и зачем оно может пригодиться.

Восхитительно. Поехали.

Насколько нейросеть — хороший калькулятор?

Уровень сложностиПростой
Время на прочтение1 мин
Количество просмотров6K

Насколько опасно умножать числа с помощью ChatGPT и OpenAI o1-preview, насколько можно доверять вычисленным ей константам? Стоит ли тратить деньги на o1-preview, если есть mini (в контексте умножения чисел)? Мини-исследование под катом.

Читать далее

Релиз Unity 2023.2 Tech Stream

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров5.3K

В свежей версии 2023.2 TS появилось несколько кроссплатформенных улучшений. Поработали над производительностью (в особенности — над тормозами освещения на мобилках). Нарисовали более красивые атмосферные эффекты для HDRP. Продумали использование VFX Graph. Проапгрейдили UI Toolit, починили баги для VR. Вернулись к понятной схеме названия версий: Не Unity 1234.5 XYZ, а просто Unity 6.

Всё вместе, это позволит поднять реализм и удобство на новый уровень, и заставит разработчиков рвать на себе рубашку за Unity в патриотическом экстазе... или такова легенда. Давайте разберемся.

Волшебно. Читать далее

Эта неделя в мире Java (21 ноября)

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров4.8K

Все сенсации, интриги, расследования, которые вам нужны 21 ноября.

Брайан Гёц — гриб (видео под катом, интервью с @boomburum)

jHipster требует Java 21 и не согласен на меньшее

Живой мастер-класс по JUnit от JUnit-джедая

Депо поездов имени В.В. Спринга

Тонна фиксов CVE уязвимостей

Первые попытки поддержать CRaC

Новая поделка: Penna для логов в JSON

Обновы в Quarkus, Micronaut, Payara, OpenLiberty, Mojarra, Grails, Tomcat...

Ничоси. Читать далее

Java-инспекции в IDEA 2023.2

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров4K

Это ретроспективный пост про Java-инспекции IntelliJ IDEA 2023.2, в преддверии 2023.3 (которая сейчас в состоянии Beta 2). Несмотря на то, что эта версия вышла еще в июле, не все в точности помнят, что же там произошло, и какую версию они вообще используют.

А между тем, там не всё хорошо. Например, баги с тэгом @snippet до сих пор не поправили.

Чтобы самому воспроизвести новости из ченжлога - нужно набирать много кода и проверять их. Это лень, это мы не делаем. Вместо этого, мы смотрим этот короткий пост с PNG-картинками, показывающими основные фишки.

Залетайте под кат и погнали!

Читать далее

IntelliJ IDEA 2023.2. Долгожданный LSP, встроенный AI-чат, апгрейд до Windows 10 и -Xmx2G

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров15K

Это ретроспективный пост фичей IntelliJ IDEA 2023.2, в преддверии 2023.3 (которая сейчас в состоянии Beta 2). Несмотря на то, что эта версия вышла еще в июле, не все в точности помнят, что же там произошло, и какую версию они вообще используют.

Идея раздулась до 2 гигабайт хипа, появилась поддержка LSP-серверов, и теперь вам нужно проапгрейдиться с Windows 7 минимум до Windows 10.

Из мелочей: появился чата с нейронкой "AI Assistant". Профилировщик научился отображать подсказки прямо в редакторе, а интеграция с GitLab позволяет меньше переключаться между браузером и IDE.

Хотите узнать подробней?

Восхитительно! Читать далее

Эта неделя в мире Java (13 ноября)

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров7.2K

Если вам лень читать три тысячи тредов в рассылке OpenJDK и ленты с новостями сотен обновлений фреймворков, то этот дайджест - для вас.

Java-дайджест за последнюю неделю (3 ноября):

• Обзор статей на Хабре

• Новости OpenJDK

• Spring, Jakarta, Web

• IDE, Gradle, тулинг

• Странные фреймворки

Волшебно! Читать далее

Helidon 4 вышел, а никто и не заметил

Время на прочтение5 мин
Количество просмотров8.5K

Те, кто использует Helidon в проде, наверняка точно знают, зачем им это нужно. Что делать остальным? Основная задача хомячка — объяснить детям концепцию смерти. Кажется, точно так же основная задача Helidon для широких народных масс — посмотреть на самые новые фишки Java и понять, нужно вам это или нет. Посмотрим, что же произошло в версии 4.0.0...

Интересно. Читать далее

Эта неделя в мире Java (3 ноября)

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров8.8K

Java-дайджест за последнюю неделю (3 ноября):

• Spring, Jakarta, Web

• IDE и редакторы

• Тестирование

• Статьи и подкасты

• Обзор статей на Хабре

Волшебно. Читать далее

IntelliJ IDEA 2023.2. Language Server Protocol, AI Assistant, IntelliJ Profiler в редакторе, GitLab merge requests, ftw

Время на прочтение8 мин
Количество просмотров12K

Только что вышла IntelliJ IDEA 2023.2. В этом релизе в IDE появилась куча интересных фичей и важных улучшений.

Вы можете скачать последнюю сборку с официального сайта, или из бесплатного приложения Toolbox, или из snap-пакетов для Ubuntu.

Этот релиз IntelliJ IDEA 2023.2 представляет вам AI-ассистента, вооруженного набором инструментов машинного обучения. IntelliJ Profiler показывает подсказки в редакторе, делая профилирование более интуитивным и иформативным. Еще, в этом релизе появилась интеграция с GitLab.

В том посте мы пробежимся по всем основным фичам IntelliJ IDEA 2023.2. В отличие от официального анонса, вся европейская политкорректность выкинута на свалку, автор перевода не видит никакой ценности в соблюдении повесточки.

Кроме того, в этот четверг в Питере будет встреча Javawatch, посвященная Java 21. Я прочитаю мини-доклад минут на 30 о новых фичах, и потом мы сможем все вместе собраться и за кружкой пива это обсудить. Анонс события в телеге, обсуждение в чате. Я бывший PMM в JetBrains Big Data и тимлид в Remote Development/Projector, а сейчас работаю над российским дистрибутивом Java - Axiom JDK.

Волшебно. Читать далее.

Прожарка java.lang.String

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7.7K

Давайте абьюзить баг в java.lang.String, который позволит делать очень странные строки. Мы сделаем "Hello World", который не начинается с "Hello" и покажем, что не все пустые строки равны между собой. Научимся прожаривать строки в чужих классах.

Вкуснотища. Читать далее.
1
23 ...

Информация

В рейтинге
1 443-й
Откуда
Россия
Работает в
Дата рождения
Зарегистрирован
Активность

Специализация

Технический директор, Генеральный директор
Ведущий
От 2 000 000 ₽
Управление продуктами
Управление проектами
Маркетинговые исследования
Разработка игр
Веб-разработка
Разработка программного обеспечения