Как стать автором
Обновить
1380.96

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Неделя жизни продакт-лида с ИИ

Время на прочтение5 мин
Количество просмотров1.4K

17 конкретных способов применения ИИ в течение рабочей недели для продакт-лида, демонстрируя как превратить искусственный интеллект из модного инструмента в реального помощника, взаимодействуя с ним как с "вторым пилотом", а не автономным агентом.

Читать далее

Как я «взломал» популярное приложение и добыл корпоративный токен OpenAI

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров9.1K

Благодаря искусственному интеллекту, все больше энтузиастов запускают свои продукты без команды профессиональных разработчиков.


Но давайте взглянем на ситуацию с другой стороны: какое качество у таких проектов и какие уязвимости они могут нести? Здесь я хочу разобрать реальный кейс - уязвимость в одном очень популярном ИИ-приложении, которая открыла мне доступ к корпоративному токену OpenAI.

Читать далее

Бутылочный эпизод (на литературный конкурс «Будущее здесь»)

Время на прочтение7 мин
Количество просмотров872

«Ну, вот, твоей любимой воды нет!», - торжествующе сказал весёлый парень своему товарищу, с которым они стояли перед стеллажами с водой в магазине - «А ведь ты говорил, что бигдата позволяет анализировать наши потребности, чтобы эффективно их удовлетворять». Тот был расстроен, но старался не подавать виду. Ещё мгновение назад на полке стояла та самая бутылка воды, за которой они зашли в магазин. Если бы не дурацкие ящики стоящие в проходе, они бы подошли к стеллажу с водой на несколько секунд раньше, а теперь их опередил какой-то здоровенный двухметровый мужик.

Читать далее

HUNYUAN-T1. Tencent наносит ответный удар

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров3.2K

Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.

Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE.

Чудесно. Хочу прочитать.

DeepSeek V3-0324. Что изменилось?

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров11K

Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?

Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.

Восхитительно. Хочу прочитать!

Gemini 2.5 Pro. Большой контекст зарелизился

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7.7K

Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro. В последнее время выходит много разных моделек, единственное достижение которых, как будто бы — плюс несколько очков скора в бенчмарке. А есть ли какие-то качественные изменения?

Ну или если вам интересны циферки — это та таинственная сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40. Двадцать бабушек - уже рубль.

Поговорим о том, что оно такое — Gemini 2.5 Pro, и зачем оно может пригодиться.

Восхитительно. Поехали.

Claude 3.7 Sonnet: Пора сдвинуть ChatGPT и Deepseek с лидирующих позиций

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров24K

Последние месяцы рынок генеративного AI буквально кипит — одна за другой выходят мощные новинки. ChatGPT-4.5 от OpenAI, GROK-3 от X, свежие релизы от Google Gemini — и Anthropic не осталась в стороне, представив свою разработку: Claude 3.7 Sonnet. Как заявляют разработчики, новый AI не просто стал быстрее и умнее своих предшественников, он первым внедрил «гибридную модель рассуждений». 

В этой статье я хочу оценить способности новой модели и, разумеется, выяснить на практике, действительно ли Claude 3.7 Sonnet соответствует всему, что наобещали разработчики.

Приятного прочтения :-)

Читать далее

DeepSeek и сын ошибок трудных: китайский стартап, в котором всё не как у «нормальных» людей

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров14K

На длинной дистанции все решают не технологии, а люди. Ракеты могут взлетать, сервера — гудеть, отчеты — пухнуть от графиков, но если внутри компании вместо живого организма — вялый салат из формальностей, то ничего не поможет. Именно поэтому так важны культура и устройство команды. Главное — подобрать нужных людей и построить из них систему, которая не скрипит на поворотах. Организация, как и музыкальный коллектив, может играть и как оркестр, и как школьная дисгармония. Все зависит от дирижера и подборки инструментов.

Мы видим это повсюду — от SpaceX и Telegram до ЧВК «Вагнер», который не просто так называли «Оркестром». Разные миссии, разные методы, но одно общее: все решают люди и культура.

Китайские технологические компании редко служат примером для подражания. В умах сразу встает образ безжалостного трудового дня, выстроенной иерархии и KPI, которые мерцают в глазах HR-отдела.

Команда DeepSeek выбивается из общего строя. Ее организация не характерна для того, что мы ожидаем от китайских компаний.

Я начинал карьеру в журнале «Игромания», потом долго работал в ИТ-корпорации и в нескольких российских и зарубежных стартапах. Сейчас руковожу агентством контент-маркетинга, но наши клиенты — в основном технологические и финансовые компании, для многих из них мы пишем на Habr. Мне всегда было интересно, как устроены лучшие технологические компании.

В этой статье я собрал все, что известно о культуре и внутренней организации DeepSeek. Источники — интервью с представителями компании и публикации в китайских медиа. Часть информации может быть неточной — перепроверить ее на 100% сложно. Но даже то, что можно увидеть сквозь туман, вызывает интерес.

Читать далее

Как интегрировать Gemini 2.0 Flash в ваше веб-приложение

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров3.7K

Компания Google выпустила Gemini 2.0 Flash со встроенными возможностями редактирования изображений, и это одна из самых революционных моделей, выпущенных Google в этом году. Я немного необъективен, потому что меня очень интересуют модели изображений с тех пор, как я запустил свое веб-приложение для генерации изображений.

Известно, что технологический гигант плохо разбирается в документации по API, поэтому последние несколько дней я испытывал трудности с интеграцией Gemini 2.0 Flash в Flux Labs. К счастью, Логан Килпатрик, ведущий инженер по продуктам Google AI Studio, недавно опубликовал обновленную документацию, которая значительно облегчает работу.

Так что если вы планируете создавать приложения с нуля или интегрировать Gemini 2.0 Flash в существующее веб-приложение, то сейчас я расскажу вам, как это сделать.

Читать далее

Спикеры AiConf 2025 получат бонусы

Время на прочтение2 мин
Количество просмотров408

Представьте недалёкое будущее. ИИ везде и во всём помогает человеку. Коллеги разговаривают в офисе перед обедом. Автоматическая кухня на основе их предпочтений, интенсивности тренировок, особенностей повседневной жизни и эмоционального состояния готовит им подходящий набор блюд. Виртуальные помощники отбирают и сообщают только нужные и полезные новости, а рабочие консультанты суммаризируют данные по проектам и выстраивают прогноз занятости и нагрузок. Коллеги ведут неспешный small talk, чтобы отвлечься от рабочего процесса...

Читать далее

Создание игры с помощью LLM более полугода назад и этой же игры теперь. Что изменилось?

Уровень сложностиПростой
Время на прочтение16 мин
Количество просмотров10K

И вот прошло 9 месяцев, модели стали значительно совершеннее, и качество написания кода улучшилось в разы, если не на порядок.

Тогда в своей статье «Кажется, LLM программирует лучше меня» я с изрядной долей самоиронии описал в подробностях пошагово написание кода игры «Шарики», Lenes (Color Lines).

Это вызвало самые разные отклики, но и большой интерес к новой парадигме программирования, в которой кодированием занимается LLM, а программист выступает в роли аналитика, управляющего процессом выполнения поставленной задачи. При этом задача выполняется пошагово, от простого к сложному методом последовательных улучшений кода.

Поэтому проведем такой же эксперимент с новейшей моделью такого же размера и попробуем на экспертном уровне оценить степень прогресса в данной области.

Что изменилось за это время?

Для тех, кто хочет сразу получить конечный ответ: в прошлый раз эта игра была создана за 15 шагов, теперь за 2 шага.

Читать далее

Новая уязвимость в GitHub Copilot и Cursor: как хакеры могут превратить AI-агентов в оружие

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров5.7K

Исследователи Pillar Security обнаружили новый опасный вектор атак на цепочку поставок, который назвали «Бэкдор файла правил» («Rules File Backdoor»). Этот метод позволяет хакерам незаметно компрометировать код, сгенерированный ИИ, путем внедрения скрытых вредоносных инструкций в, казалось бы, безобидные файлы конфигурации, используемые Cursor и GitHub Copilot — ведущими в мире редакторами кода на базе ИИ.

Читать далее

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров5.5K

Иногда надо что-то быстро оцифровать - время работы магазина с его таблички, визитную карточку, квитанцию почтового отправления. Приходится делать фотографию, которая потом теряется в куче других фотографий, и не может быть найдена по контексту.

Идея — сделать фото, перевести в текст, сразу отформатировать/обработать/перевести как надо и сохранить уже куда хочешь — в Telegram избранное, Google Keep, Google Контакты, Obsidian и т. д. И чтоб всё было быстро и удобно.

Так появился Argus — телеграм бот, в котором можно сделать фото (или кинуть ему изображение), он распознает и выведет текст, который повторно можно пропустить через обычную chat completion LLM.

Читать далее

Ближайшие события

Мифы и реальность: GitHub звезды, трафик и продвижение продукта

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.9K

В этой статье я делюсь реальным опытом продвижения Open Source проекта на GitHub за 2 года. Мы развенчаем мифы о быстром наборе звезд и узнаем из моего опыта, как я на самом деле привлекал трафик и продвигал проект Wunjo. Поговорим о том, что реально работает для увеличения видимости на GitHub и как маркетологи, разработчики пет-проектов и владельцы продуктов могут применить эти методы для продвижения.

Погрузиться в детали

Как дистилляция меняет индустрию искусственного интеллекта

Время на прочтение5 мин
Количество просмотров3.2K

Всем привет! Меня зовут Миша, я руковожу центром R&D Big Data в МТС Диджитал. В прошлый раз делился с вами подборкой книг по базам данных. Сегодня хочу обсудить, как дистилляция влияет на индустрию ИИ.

Крупнейшие компании в области ИИ, включая OpenAI, Microsoft и Meta*, используют технологию дистилляции — это позволяет им задействовать меньше ресурсов для разработки мощных языковых моделей. Конечно, дистилляция не новинка. Но игроки ИИ-отрасли особенно заинтересовались ею, как только китайская компания DeepSeek создала с ее помощью производительные модели на основе открытых решений конкурентов.

Последствия проявились сразу. После анонса DeepSeek R1 фондовый рынок США потерял за несколько дней свыше 1 трлн $. О причинах тут уже писали — китайцы заявили, что на обучение ушло всего 5,6 млн $. Потом стали известны нюансы, и эту цифру поставили под сомнение. Но в любом случае успех DeepSeek привел к внимательному изучению технологий, используемых китайской компанией, игроками отрасли. Обо всем этом и поговорим в посте.

Читать далее

NVIDIA DGX Spark: карманный суперкомпьютер для ИИ, который переворачивает рынок

Время на прочтение5 мин
Количество просмотров5.9K

Помните, как мы когда-то удивлялись первым мини-ПК размером с ладонь? Тогда казалось, что компактнее уже не придумаешь. Но NVIDIA придумала. Компания буквально перевернула наши представления о том, что такое мощный мини-компьютер, представив DGX Spark. На выходе получилось устройство размером с небольшую книгу, которое получило звание самого маленького суперкомпьютера в мире. И это не просто маркетинговый ход. Внутри этой крохи скрывается настоящий монстр вычислительной мощности, способный обрабатывать сложнейшие модели искусственного интеллекта прямо у вас на столе.

Читать далее

Какой no-code инструмент для автоматизации выбрать в 2025

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров8.2K

В статье рассказываю про то, какую платформу no-code автоматизации можно выбрать в 2025 году

А именно
Таблица сравнения основных платформ
Как выглядят интерфейсы конструкторов
Сравнение цен на тарифы
Рекомендации по выбору платформы в зависимости от целей, уровня и бюджета
Как понять, достаточно ли бесплатного лимита?

Сам для себя делал обзор, решил поделиться результатами

Читать далее 💫

Мой опыт вайб-кодинга. Сервис за выходные

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров16K

Я занимаюсь разработкой уже больше пятнадцати лет. Наверное, меня можно отнести к “прошлому” поколению разработчиков — тем самым старперам, которые вручную писали код на высокоуровневых языках вроде Java, PHP, JavaScript, Go. Уже давно замечаю за собой, что становлюсь всё более консервативным в вопросах выбора инструментов и технологий для проектов, за которые отвечаю. Поэтому к AI-хайпу, копилотам, агентам и прочему отношусь с осторожностью и скепсисом.

Но всё же решил попробовать — и делюсь с вами своими наблюдениями: что работает, а что нет.

Сразу скажу: мне в целом понравилось. Я бы даже сказал, что впечатлён.

Читать далее

Картель влиятельных датасетов в обучении ИИ

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.4K


В последнее время такие компании, как OpenAI и Google, заключают эксклюзивные соглашения об обмене данными с издателями, крупными форумами вроде Reddit и социальными медиаплатформами, что становится для них ещё одним способом сконцентрировать власть.

Такая тенденция выгодна крупнейшим игрокам на рынке ИИ, которые могут позволить себе такие сделки, в отличие от исследователей, некоммерческих организаций и небольших компаний. Крупнейшие корпорации располагают лучшими ресурсами для сбора датасетов. В результате эталонные датасеты для бенчмарков (и для обучения) моделей ИИ всё больше концентрируются в руках малого количества корпораций и академических учреждений.

По мнению некоторых исследователей, это «новая волна асимметричного доступа», которой ещё не было в истории открытого интернета в таком масштабе.
Читать дальше →

Всё, что вам нужно знать о MCP (Model Context Protocol) от Anthropic

Время на прочтение7 мин
Количество просмотров7.7K

Почему хаос интеграции данных в LLM-приложениях мешает масштабированию AI-агентов?
Model Context Protocol от Anthropic решает три критические проблемы: стандартизацию взаимодействия моделей с окружением, четкое разделение управления компонентами и упрощение интеграции источников данных.

Узнайте, как MCP позволяет разным командам работать над единой системой, не мешая друг другу, и почему это важно для будущего агентных AI-систем.

Читать далее

Вклад авторов