Обновить
256K+

Data Engineering *

Обсуждаем вопросы сбора и подготовки данных

63,04
Рейтинг
Сначала показывать
Порог рейтинга

AIRI представил ELMUR — архитектуру памяти для роботов на базе ИИ

Время на прочтение2 мин
Охват и читатели1.5K

Ученые института AIRI представили ELMUR — архитектуру управления для роботов и ИИ-агентов, которым нужно принимать решения с учетом событий из далекого прошлого. Это важная задача для робототехники: агент может увидеть полезную информацию задолго до того, как она понадобится для действия.

Обычные трансформеры с этой задачей справляются ограниченно. Если расширять окно внимания, резко растут вычислительные затраты. Если сжимать прошлый опыт, появляется риск потерять важные детали. А внешняя память фиксированного размера не всегда позволяет надежно учитывать давние события при текущем решении.

В ELMUR память встроена прямо в слои модели. Каждый слой содержит фиксированное количество слотов, которые параллельно взаимодействуют с основным потоком данных. Система может читать нужную информацию из этих ячеек и записывать туда новые данные. Если память заполняется, обновляются те слоты, которые использовались реже всего, по принципу LRU — Least Recently Used.

Читать далее

Новости

Седиментация для памяти ИИ-агентов: помнить главное, даже забывая детали

Время на прочтение4 мин
Охват и читатели5.6K

Ложку нашли, а осадочек остался. Как этот принцип может повлиять на память ИИ-агента? Делимся концептом одной из самых ярких частей архитектуры Metabolic AI

Читать далее

Замена огромных ЦОД-ов на коробочные решения

Время на прочтение2 мин
Охват и читатели5.7K

Мощные ПК с дорогими картами nVidia - безусловно универсальное решение для любых задач. Но бизнесу чаще нужны не любые, а конкретные. А российскому бизнесу еще и чтоб без Интернет.

Дешевые нейрочипы справляются с адаптированными к ним моделям компьютерного зрения, например, как YOLO 26, гораздо эффективнее в плане получаемого результата. Вот такая коробочка не требует ни комнат для серверов, ни охлаждения, ни обслуживания, ни даже больших затрат электричества - потребляет всего 20 Вт. При этом отрабатывает именно те задачи, которые требуются пользователю.

Журнал Forbes публикует Интервью с Олегом Витальевичем Гришаниным из компании Спецлаб (SpesLab)

Читать...

Anthropic может начать разработку собственных AI-чипов

Время на прочтение2 мин
Охват и читатели3.6K

AI-лаборатория Anthropic рассматривает возможность разработки собственных чипов для искусственного интеллекта. По данным источников, проект находится на ранней стадии, и компания пока не приняла окончательного решения — она может как пойти в собственный дизайн, так и продолжить закупки у партнёров.

Сейчас Anthropic использует инфраструктуру сторонних игроков: в частности, TPU от Google и решения Amazon для обучения и работы своих моделей, включая Claude. Параллельно компания недавно усилила сотрудничество с Google и Broadcom в рамках развития вычислительной инфраструктуры.

Интерес к собственным чипам объясняется растущим дефицитом AI-железа. На фоне взрывного спроса на вычисления компании всё чаще задумываются о контроле над инфраструктурой, а не только о закупках. Аналогичные инициативы уже есть у крупных игроков — включая Meta и OpenAI.

Читать далее

Google и Intel расширяют партнерство по AI-инфраструктуре и совместной разработке чипов

Время на прочтение2 мин
Охват и читатели3.6K

Google Cloud и Intel объявили о расширении многолетнего партнерства в области AI-инфраструктуры. Компании продолжат совместную разработку серверных решений и процессоров для дата-центров, а также углубят работу над кастомными чипами.

В рамках соглашения Google Cloud сохранит ставку на процессоры Intel Xeon, включая новое поколение Xeon 6, для задач облака и AI — прежде всего inference и обработки данных. Несмотря на доминирование GPU в обучении моделей, именно CPU остаются базовым слоем инфраструктуры, на котором выполняется большая часть рабочих нагрузок.

Отдельное направление — развитие инфраструктурных процессоров (IPU), которые разгружают CPU, беря на себя сетевые, storage и другие операции внутри дата-центров. Компании расширяют коразработку таких решений на базе ASIC — это кастомные чипы, оптимизированные под конкретные задачи Google Cloud.

Читать далее

Google добавила в Gemini API режимы Flex и Priority для управления ценой и надёжностью

Время на прочтение2 мин
Охват и читатели7.6K

Google представила два новых режима работы в Gemini API — Flex и Priority. Они позволяют разработчикам выбирать, что важнее для конкретного запроса: минимальная стоимость или максимальная надёжность. Главное изменение в том, что теперь и фоновые, и критичные пользовательские задачи можно обслуживать через один и тот же синхронный интерфейс, без отдельной асинхронной логики через Batch API.

Flex Inference — это новый экономичный режим для задач, где не нужна мгновенная реакция. Google заявляет, что он даёт до 50% экономии по сравнению со Standard API, но за счёт этого запросы получают меньший приоритет, могут выполняться медленнее и обслуживаться менее стабильно. Такой режим предлагают использовать для фоновых процессов: суммаризации больших объёмов текста, CRM-обновлений, исследовательских прогонов и агентных сценариев, где модель «думает» в фоне.

Priority Inference, наоборот, рассчитан на критичные сценарии — например, пользовательские чатботы, модерацию в реальном времени и другие latency-sensitive задачи. В этом режиме запросы получают более высокий приоритет. Если нагрузка превышает лимиты Priority, запросы не падают с ошибкой, а автоматически уходят в Standard tier. Google подаёт это как механизм для сохранения работоспособности приложения даже в пиковые моменты.

Читать далее

В российских кафе и ресторанах начнут внедрять ИИ-кассиров

Время на прочтение2 мин
Охват и читатели5.7K

Компания inno clouds, резидент «Сколково», представила ИИ-кассира для заведений общепита. По словам разработчика, система умеет вести диалог с посетителем, помогать с выбором блюд и ускорять обслуживание. До конца 2026 года её планируют внедрить более чем в 350 кафе, ресторанах и фуд-кортах в России.

От обычного киоска самообслуживания решение отличается тем, что вместо навигации по меню на экране посетитель может просто описать, что хочет заказать, а система предложит подходящие позиции. Разработчик утверждает, что ИИ-кассир может рассказывать о составе блюда, его пищевой ценности, возможных модификациях и аллергенах.

В компании говорят, что продукт лучше всего подходит для фастфуда, кофеен и фуд-кортов, где особенно важна скорость обработки заказа. По их оценке, внедрение такого формата может ускорять обслуживание до 35%, а в отдельных сценариях — почти вдвое. Также разработчик заявляет о потенциальном росте выручки заведений на 15–30% за счёт более быстрого оформления заказов и AI-допродаж.

Читать далее

Китайские производители заняли 41% рынка AI-ускорителей для серверов в КНР, доля Nvidia снизилась

Время на прочтение2 мин
Охват и читатели4.3K

Китайские производители GPU и AI-чипов заметно усилили позиции на домашнем рынке. По данным IDC, с которыми ознакомилось Reuters, в 2025 году они заняли 41% китайского рынка AI-ускорителей для серверов, тогда как Nvidia сохранила лидерство, но сократила долю до 55%. Прямого дубля этой новости на Хабре я не нашёл.

Всего за год в Китае было поставлено около 4 млн AI-ускорительных карт. Из них Nvidia отгрузила примерно 2,2 млн, AMD — около 160 тыс., а китайские вендоры суммарно — 1,65 млн. Reuters связывает этот сдвиг с экспортными ограничениями США и курсом Пекина на замещение зарубежных чипов локальными решениями.

Лидером среди китайских производителей стала Huawei, которая поставила около 812 тыс. AI-чипов — примерно половину всех локальных поставок. На втором месте — T-Head от Alibaba с 265 тыс. карт. Далее идут Kunlunxin от Baidu и Cambricon — примерно по 116 тыс. у каждой компании.

Читать далее

Salesforce анонсировала крупное AI-обновление Slack с 30 новыми функциями

Время на прочтение2 мин
Охват и читатели4.2K

Salesforce представила крупное обновление Slack с акцентом на ИИ. Компания анонсировала около 30 новых функций, которые появятся в ближайшие месяцы. Главный фокус — развитие Slackbot: теперь его хотят превратить не просто в чат-ассистента, а в инструмент для выполнения рабочих задач внутри корпоративной среды.

Одно из ключевых нововведений — reusable AI-skills, то есть переиспользуемые AI-навыки. Пользователи смогут задавать для Slackbot конкретные сценарии работы, а затем вызывать их в разных контекстах. Например, бот сможет по команде собрать данные из каналов Slack, подключённых приложений и внутренних источников, чтобы подготовить план задачи, а затем сам предложит следующие шаги и создаст встречу с нужными участниками.

Slackbot также получит роль MCP-клиента. Это означает, что он сможет подключаться к внешним сервисам и координировать работу с другими приложениями и агентами, включая Agentforce — платформу Salesforce для создания ИИ-агентов. В компании говорят, что это позволит передавать задачи между системами без ручного участия пользователя.

Читать далее

«Ростелеком» сообщил о 50%-й автоматизации клиентской поддержки в чатах с помощью ИИ

Время на прочтение2 мин
Охват и читатели3.7K

«Ростелеком» рассказал о внедрении двух внутренних продуктов для автоматизации клиентского сервиса и рабочих процессов: чат-бота «Омнибот» и базы знаний «ProЗнания». По данным компании, эти решения уже используются в ее собственной инфраструктуре и позволяют автоматизировать до половины обращений в клиентскую поддержку.

Внутри связки роли разделены так: «ProЗнания» отвечает за формирование и актуализацию базы контента, поиск информации с учетом контекста и генерацию ответов, а «Омнибот» определяет интент обращения и обрабатывает запросы в разных текстовых каналах без участия оператора.

Заявленные цифры выглядят так: до 300 тысяч запросов в сутки в текстовых каналах, более 500 сценариев обращений и свыше 400 интентов, обученных на собственных данных компании. В «Ростелекоме» утверждают, что это позволило сократить время обработки типовых запросов, снизить нагрузку на первую линию поддержки и ускорить онбординг новых сотрудников.

Читать далее

Bluesky показала Attie — AI-приложение для создания собственных алгоритмов и лент

Время на прочтение2 мин
Охват и читатели5.3K

Команда Bluesky представила новый продукт под названием Attie. Это не очередная соцсеть, а отдельное AI-приложение, которое позволяет пользователю собирать собственные алгоритмы рекомендаций и создавать кастомные ленты обычными текстовыми командами, без кода.

Attie работает поверх AT Protocol, на котором построена сама Bluesky, а внутри использует модель Claude от Anthropic. Пользователь сможет войти через аккаунт своей atproto-экосистемы, после чего ассистент начнет помогать собирать персональные ленты, подбирать интересные посты и настраивать выдачу под себя.

Читать далее

Huawei продвигает новый AI-чип 950PR, а ByteDance и Alibaba готовятся к заказам

Время на прочтение2 мин
Охват и читатели5.8K

Huawei, похоже, смогла сделать то, что раньше давалось ей тяжело: заинтересовать крупные китайские IT-компании своим новым AI-чипом. По данным Reuters, ByteDance и Alibaba планируют размещать заказы на новый 950PR, который должен стать более серьезным конкурентом Nvidia на китайском рынке.

Для Huawei это важный сдвиг. Предыдущий флагманский чип Ascend 910C не получил по-настоящему массового спроса у крупных частных техкомпаний, несмотря на курс Китая на импортозамещение в полупроводниках. С новым поколением ситуация, судя по всему, меняется.

Главная причина — не столько рост «сырой» вычислительной мощности, сколько более практичная доработка. Новый 950PR оказался лучше совместим с экосистемой Nvidia CUDA, на которой уже завязано множество китайских разработчиков. То есть переход на чип Huawei становится менее болезненным, а для рынка это, возможно, даже важнее, чем формальное сравнение по производительности.

Читать далее

На Урале и в Сибири откроются первые студенческие лаборатории для обучения вайб-кодингу

Время на прочтение1 мин
Охват и читатели4.4K

В российских вузах начинают открывать первые студенческие лаборатории по вайб-кодингу. Первая площадка заработает летом в Омском государственном техническом университете, а до конца 2026 года еще одну лабораторию планируют открыть в Уральском государственном университете путей сообщения.

Проект запускается вместе с компанией «АрхиТех ИИ», которая развивает отечественную ИИ-среду для вайб-кодинга Kodik. Студентов технических направлений собираются учить безопасной работе с ИИ при разработке ПО, а также тому, как внедрять ИИ-инструменты в реальные бизнес-процессы.

Читать далее

Ближайшие события

OpenAI покупает разработчика Python-инструментов Astral, чтобы усилить позиции против Anthropic

Время на прочтение1 мин
Охват и читатели6.7K

OpenAI объявила в четверг о приобретении разработчика инструментов для Python — компании Astral. Таким образом владелец ChatGPT стремится усилить свои позиции в конкуренции с Anthropic и увеличить долю на рынке инструментов для программирования на базе ИИ.

Финансовые условия сделки не раскрываются. Компании сообщили, что после завершения сделки инструменты Astral будут интегрированы в систему для ИИ-кодинга Codex, которую развивает OpenAI при поддержке Microsoft.

OpenAI, возглавляемая Сэмом Альтманом, усиливает конкуренцию на фоне того, что Anthropic набирает популярность среди разработчиков со своим инструментом Claude Code.

Читать далее

СИБУР и Центральный университет открывают кафедру искусственного интеллекта

Время на прочтение1 мин
Охват и читатели5K

Мы договорились с Центральным университетом готовить ИТ- и инженерных специалистов и развивать прикладные решения в области ИИ. Запустим совместные образовательные программы и создадим кафедру технологий ИИ в корпоративном университете СИБУРИНТЕХ.

И туда, кстати, ищем заведующего новой кафедрой.

Узнать детали

ML-митап от команды MAGNIT TECH

Время на прочтение1 мин
Охват и читатели4K

Эксперты из ML/AI Хаба «Магнита» зовут на митап, чтобы поделиться реальным опытом применения машинного обучения в бизнес-процессах.

19.02 | Москва | Офлайн + онлайн

Читать далее

Новинки AMD, еще одно исследование про ИИ-агентов и другие события из мира ML

Время на прочтение2 мин
Охват и читатели5.2K

Рассказываем, что происходило с ML-технологиями в январе: кто кого купил, какие вышли новинки и куда все движется.

Читать далее

AiConf 2026: нам нужен именно ты! Что нового?

Время на прочтение1 мин
Охват и читатели4.4K

Привет, трудяга! На носу одно из самых волнующих мероприятий этой весны — AiConf 2026, которое традиционно проходит в Москве. Кто был на наших конференциях, тот знает, что это кладезь полезной информации, нетворкинга и вдохновения.

В новом году пришло время перемен: мы проанализировали отзывы и предложения наших участников, докладчиков и партнёров, и пришли к выводу, что AiConf 2026 года будет другой. С этого момента AiConf становится конференцией развития.

Читать далее

Рациональное зерно

Время на прочтение1 мин
Охват и читатели5.2K

Эта новость является продолжением моей гипотезы - "Механизм движения физических тел". https://habr.com/ru/articles/563610/ Гипотеза, как физическая гипотеза о дискретности классического механического движения и её астрофизическое заключение, на мой взгляд «со стороны», имеют рациональное зерно.   Суть "рационального зерна": согласно моей гипотезе, классическое движение состоит из квантов. Каждый квант характеризуется элементарным изменением скорости движения.   Во вселенной все звёзды и планеты движутся приблизительно по круговым орбитам, то есть квант их движения (по расчетам гипотезы и параметрам их орбит) по направлению характеризуется элементарным изменением направления скорости, а её модуль постоянен и равен ~ 1,86E-11 м/с.   Подробнее: https://habr.com/ru/articles/563610/ https://zenodo.org/records/14769147 https://zenodo.org/records/14273976

Читать далее

Первый Data Sapience Data Day объединил экспертов data-индустрии

Время на прочтение6 мин
Охват и читатели7.5K

DSDD стал площадкой для открытого диалога о настоящем и будущем на ИТ-рынке данных.

О чем говорили? CDO ведущих игроков российского рынка в рамках панельной дискуссии поделились своим видением развития дата-ландшафта. Особый интерес у аудитории вызвали реальные кейсы внедрений от лидеров IT-индустрии. Спикеры говорили не только о преимуществах, но и о подводных камнях, с которыми столкнулись в процессе. Кроме того, команда Data Sapience приоткрыла завесу над планами развития продуктов.

В обзоре рассказываем о деталях выступлений и обсуждаемых тем.

Читать далее
1
23 ...