
17 конкретных способов применения ИИ в течение рабочей недели для продакт-лида, демонстрируя как превратить искусственный интеллект из модного инструмента в реального помощника, взаимодействуя с ним как с "вторым пилотом", а не автономным агентом.
AI, ANN и иные формы искусственного разума
17 конкретных способов применения ИИ в течение рабочей недели для продакт-лида, демонстрируя как превратить искусственный интеллект из модного инструмента в реального помощника, взаимодействуя с ним как с "вторым пилотом", а не автономным агентом.
Благодаря искусственному интеллекту, все больше энтузиастов запускают свои продукты без команды профессиональных разработчиков.
Но давайте взглянем на ситуацию с другой стороны: какое качество у таких проектов и какие уязвимости они могут нести? Здесь я хочу разобрать реальный кейс - уязвимость в одном очень популярном ИИ-приложении, которая открыла мне доступ к корпоративному токену OpenAI.
«Ну, вот, твоей любимой воды нет!», - торжествующе сказал весёлый парень своему товарищу, с которым они стояли перед стеллажами с водой в магазине - «А ведь ты говорил, что бигдата позволяет анализировать наши потребности, чтобы эффективно их удовлетворять». Тот был расстроен, но старался не подавать виду. Ещё мгновение назад на полке стояла та самая бутылка воды, за которой они зашли в магазин. Если бы не дурацкие ящики стоящие в проходе, они бы подошли к стеллажу с водой на несколько секунд раньше, а теперь их опередил какой-то здоровенный двухметровый мужик.
Когда-нибудь задумывались, почему большинство моделей ИИ либо умные, ЛИБО быстрые, но никогда не сочетают оба качества? Над этим подумали в Tencent.
Tencent только что перевернул эту парадигму с Hunyuan-T1 – ПЕРВОЙ в мире ультра-супер-сверхбольшой моделью, использующей гибридную архитектуру Transformer + Mamba MoE.
Все пишут, что Deep Seek V3-0324 ВНЕЗАПНО СТАЛ СИЛЬНО ЛУЧШЕ. И в чем именно?
Ночью, без объявления войны, DeepSeek вырос на 19.8 баллов в математике и 10 баллов в кодировании. Также официально заявлены некоторые улучшения в понимании фронтенда и вызова тулов. Напоминаю, речь идет о нерассуждающей версии - она не рассказывает о своих мыслях как DeepSeek R1, зато работает более быстро и стабильно.
Никогда такого не было, и вот опять. Новый прорыв - Gemini 2.5 Pro. В последнее время выходит много разных моделек, единственное достижение которых, как будто бы — плюс несколько очков скора в бенчмарке. А есть ли какие-то качественные изменения?
Ну или если вам интересны циферки — это та таинственная сетка, которая недавно висела в топе LMArena под названием Nebula с разницей в скоре +40. Двадцать бабушек - уже рубль.
Поговорим о том, что оно такое — Gemini 2.5 Pro, и зачем оно может пригодиться.
Последние месяцы рынок генеративного AI буквально кипит — одна за другой выходят мощные новинки. ChatGPT-4.5 от OpenAI, GROK-3 от X, свежие релизы от Google Gemini — и Anthropic не осталась в стороне, представив свою разработку: Claude 3.7 Sonnet. Как заявляют разработчики, новый AI не просто стал быстрее и умнее своих предшественников, он первым внедрил «гибридную модель рассуждений».
В этой статье я хочу оценить способности новой модели и, разумеется, выяснить на практике, действительно ли Claude 3.7 Sonnet соответствует всему, что наобещали разработчики.
Приятного прочтения :-)
На длинной дистанции все решают не технологии, а люди. Ракеты могут взлетать, сервера — гудеть, отчеты — пухнуть от графиков, но если внутри компании вместо живого организма — вялый салат из формальностей, то ничего не поможет. Именно поэтому так важны культура и устройство команды. Главное — подобрать нужных людей и построить из них систему, которая не скрипит на поворотах. Организация, как и музыкальный коллектив, может играть и как оркестр, и как школьная дисгармония. Все зависит от дирижера и подборки инструментов.
Мы видим это повсюду — от SpaceX и Telegram до ЧВК «Вагнер», который не просто так называли «Оркестром». Разные миссии, разные методы, но одно общее: все решают люди и культура.
Китайские технологические компании редко служат примером для подражания. В умах сразу встает образ безжалостного трудового дня, выстроенной иерархии и KPI, которые мерцают в глазах HR-отдела.
Команда DeepSeek выбивается из общего строя. Ее организация не характерна для того, что мы ожидаем от китайских компаний.
Я начинал карьеру в журнале «Игромания», потом долго работал в ИТ-корпорации и в нескольких российских и зарубежных стартапах. Сейчас руковожу агентством контент-маркетинга, но наши клиенты — в основном технологические и финансовые компании, для многих из них мы пишем на Habr. Мне всегда было интересно, как устроены лучшие технологические компании.
В этой статье я собрал все, что известно о культуре и внутренней организации DeepSeek. Источники — интервью с представителями компании и публикации в китайских медиа. Часть информации может быть неточной — перепроверить ее на 100% сложно. Но даже то, что можно увидеть сквозь туман, вызывает интерес.
Компания Google выпустила Gemini 2.0 Flash со встроенными возможностями редактирования изображений, и это одна из самых революционных моделей, выпущенных Google в этом году. Я немного необъективен, потому что меня очень интересуют модели изображений с тех пор, как я запустил свое веб-приложение для генерации изображений.
Известно, что технологический гигант плохо разбирается в документации по API, поэтому последние несколько дней я испытывал трудности с интеграцией Gemini 2.0 Flash в Flux Labs. К счастью, Логан Килпатрик, ведущий инженер по продуктам Google AI Studio, недавно опубликовал обновленную документацию, которая значительно облегчает работу.
Так что если вы планируете создавать приложения с нуля или интегрировать Gemini 2.0 Flash в существующее веб-приложение, то сейчас я расскажу вам, как это сделать.
Представьте недалёкое будущее. ИИ везде и во всём помогает человеку. Коллеги разговаривают в офисе перед обедом. Автоматическая кухня на основе их предпочтений, интенсивности тренировок, особенностей повседневной жизни и эмоционального состояния готовит им подходящий набор блюд. Виртуальные помощники отбирают и сообщают только нужные и полезные новости, а рабочие консультанты суммаризируют данные по проектам и выстраивают прогноз занятости и нагрузок. Коллеги ведут неспешный small talk, чтобы отвлечься от рабочего процесса...
И вот прошло 9 месяцев, модели стали значительно совершеннее, и качество написания кода улучшилось в разы, если не на порядок.
Тогда в своей статье «Кажется, LLM программирует лучше меня» я с изрядной долей самоиронии описал в подробностях пошагово написание кода игры «Шарики», Lenes (Color Lines).
Это вызвало самые разные отклики, но и большой интерес к новой парадигме программирования, в которой кодированием занимается LLM, а программист выступает в роли аналитика, управляющего процессом выполнения поставленной задачи. При этом задача выполняется пошагово, от простого к сложному методом последовательных улучшений кода.
Поэтому проведем такой же эксперимент с новейшей моделью такого же размера и попробуем на экспертном уровне оценить степень прогресса в данной области.
Что изменилось за это время?
Для тех, кто хочет сразу получить конечный ответ: в прошлый раз эта игра была создана за 15 шагов, теперь за 2 шага.
Исследователи Pillar Security обнаружили новый опасный вектор атак на цепочку поставок, который назвали «Бэкдор файла правил» («Rules File Backdoor»). Этот метод позволяет хакерам незаметно компрометировать код, сгенерированный ИИ, путем внедрения скрытых вредоносных инструкций в, казалось бы, безобидные файлы конфигурации, используемые Cursor и GitHub Copilot — ведущими в мире редакторами кода на базе ИИ.
Иногда надо что-то быстро оцифровать - время работы магазина с его таблички, визитную карточку, квитанцию почтового отправления. Приходится делать фотографию, которая потом теряется в куче других фотографий, и не может быть найдена по контексту.
Идея — сделать фото, перевести в текст, сразу отформатировать/обработать/перевести как надо и сохранить уже куда хочешь — в Telegram избранное, Google Keep, Google Контакты, Obsidian и т. д. И чтоб всё было быстро и удобно.
Так появился Argus — телеграм бот, в котором можно сделать фото (или кинуть ему изображение), он распознает и выведет текст, который повторно можно пропустить через обычную chat completion LLM.
В этой статье я делюсь реальным опытом продвижения Open Source проекта на GitHub за 2 года. Мы развенчаем мифы о быстром наборе звезд и узнаем из моего опыта, как я на самом деле привлекал трафик и продвигал проект Wunjo. Поговорим о том, что реально работает для увеличения видимости на GitHub и как маркетологи, разработчики пет-проектов и владельцы продуктов могут применить эти методы для продвижения.
Всем привет! Меня зовут Миша, я руковожу центром R&D Big Data в МТС Диджитал. В прошлый раз делился с вами подборкой книг по базам данных. Сегодня хочу обсудить, как дистилляция влияет на индустрию ИИ.
Крупнейшие компании в области ИИ, включая OpenAI, Microsoft и Meta*, используют технологию дистилляции — это позволяет им задействовать меньше ресурсов для разработки мощных языковых моделей. Конечно, дистилляция не новинка. Но игроки ИИ-отрасли особенно заинтересовались ею, как только китайская компания DeepSeek создала с ее помощью производительные модели на основе открытых решений конкурентов.
Последствия проявились сразу. После анонса DeepSeek R1 фондовый рынок США потерял за несколько дней свыше 1 трлн $. О причинах тут уже писали — китайцы заявили, что на обучение ушло всего 5,6 млн $. Потом стали известны нюансы, и эту цифру поставили под сомнение. Но в любом случае успех DeepSeek привел к внимательному изучению технологий, используемых китайской компанией, игроками отрасли. Обо всем этом и поговорим в посте.
Помните, как мы когда-то удивлялись первым мини-ПК размером с ладонь? Тогда казалось, что компактнее уже не придумаешь. Но NVIDIA придумала. Компания буквально перевернула наши представления о том, что такое мощный мини-компьютер, представив DGX Spark. На выходе получилось устройство размером с небольшую книгу, которое получило звание самого маленького суперкомпьютера в мире. И это не просто маркетинговый ход. Внутри этой крохи скрывается настоящий монстр вычислительной мощности, способный обрабатывать сложнейшие модели искусственного интеллекта прямо у вас на столе.
В статье рассказываю про то, какую платформу no-code автоматизации можно выбрать в 2025 году
А именно
• Таблица сравнения основных платформ
• Как выглядят интерфейсы конструкторов
• Сравнение цен на тарифы
• Рекомендации по выбору платформы в зависимости от целей, уровня и бюджета
• Как понять, достаточно ли бесплатного лимита?
Сам для себя делал обзор, решил поделиться результатами
Я занимаюсь разработкой уже больше пятнадцати лет. Наверное, меня можно отнести к “прошлому” поколению разработчиков — тем самым старперам, которые вручную писали код на высокоуровневых языках вроде Java, PHP, JavaScript, Go. Уже давно замечаю за собой, что становлюсь всё более консервативным в вопросах выбора инструментов и технологий для проектов, за которые отвечаю. Поэтому к AI-хайпу, копилотам, агентам и прочему отношусь с осторожностью и скепсисом.
Но всё же решил попробовать — и делюсь с вами своими наблюдениями: что работает, а что нет.
Сразу скажу: мне в целом понравилось. Я бы даже сказал, что впечатлён.
Почему хаос интеграции данных в LLM-приложениях мешает масштабированию AI-агентов?
Model Context Protocol от Anthropic решает три критические проблемы: стандартизацию взаимодействия моделей с окружением, четкое разделение управления компонентами и упрощение интеграции источников данных.
Узнайте, как MCP позволяет разным командам работать над единой системой, не мешая друг другу, и почему это важно для будущего агентных AI-систем.