Как стать автором
Обновить
1005.08

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Опробовал новую Gemini 2.5 Pro в написании текстов: вот, что получилось

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров854

Привет! Проработав много лет редактором, я постоянно экспериментирую с нейросетями в написании текстов — и рассказываю о результатах на канале "сбежавшая нейросеть". На прошлой неделе вышла обновленная Gemini 2.5 Pro, занявшая первое место в большинстве бенчмарков. Я же скормил ей несколько своих любимых промптов — и результат меня очень порадовал. Новая версия Gemini пишет очень ровный и захватывающий текст, хотя иногда и сбивается в логике. Ниже — три примера с моими пояснениями.

Читать далее

Новости

Google представила Veo 3 Fast — более быструю и дешевую версию Veo 3. Что такое Veo 3 Fast и как ей пользоваться

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров759

Прошло всего пару недель с тех пор, как Google представила Veo 3, свою самую мощную ИИ-модель для генерации видео. Особенность Veo 3 заключается в том, что это первая модель, которая генерирует как видео, так и аудио. Вы вводите запрос и сценарий, и она создает восьмисекундный ролик, в котором персонаж произносит ваши реплики с соответствующей синхронизацией губ, выражением лица и даже звуковыми эффектами.

Но была одна большая проблема. Стоимость.

Когда был открыт доступ к API, я был потрясен. Пятисекундное видео со звуком стоит 3,75 доллара. Каждая дополнительная секунда - это еще 0,75 доллара. Если посчитать, то минутное видео Veo 3 обойдется вам в 45 долларов. Для большинства пользователей это не очень дешево.

К счастью, сегодня Google выпустила новую модель, которая стоит в 5 раз дешевле Veo 3. Она называется Veo 3 Fast.

В этой статье я расскажу, что такое Veo 3 Fast, как получить к ней доступ и использовать, а также покажу примеры видео и выскажу свои соображения.

Читать далее

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

Время на прочтение18 мин
Количество просмотров2K

Локальный DeepSeek-R1-0528 на скромном железе? Реально. Со скоростью улитки? Первоначально – да. Но итог моего эксперимента: эту 'улитку' можно заставить работать вдвое быстрее.

Читать далее

Хорошая девушка LoRA! А чем же она хороша?

Время на прочтение10 мин
Количество просмотров570

Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто красавице - LoRA, которая если и не снимается в кино, то может сделать фильмы качественней и интереснее для зрителя. Исторические данные проката и состава творческих групп в перспективе позволяют работать с ансамблевыми моделями машинного обучения для прогнозирования сборов и просмотров в кино, и улучшать данные и путем их подбора «гиперпараметров» фильма.  Но для работы со смыслами, идеями и описаниями кинопроектов нужна более эффективная методика, позволяющая оценивать творческий замысел и основные идеи хотя бы на уровне аннотации – краткого синопсиса.  И здесь уже не обойтись без больших языковых моделей.

Читать далее

Эксперимент Agent Village: как автономные ИИ-агенты собрали деньги на благотворительность

Время на прочтение3 мин
Количество просмотров555

Недавно команда энтузиастов решила провести необычный эксперимент: предоставить нескольким ИИ-агентам виртуальные компьютеры, доступ в интернет и минимум модерации. В итоге они не только автономно собрали почти $2 000 на благотворительность, но и попутно выдали кучу инсайтов о том, как сегодня они действуют «на свободе». Разбираемся, что получилось, почему это интересно, а местами даже пугающе.

Читать далее

RAG-сервис на Go с Ламой

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров964

Привет, Хабр! Меня зовут Александр Белышев. Хочу поделиться своим недавним опытом работы над RAG‑сервисом и думаю, что эта тема может быть интересна другим коллегам.

У меня на работе возникла задача по реализации RAG (Retrieval‑Augmented Generation) сервиса. Хотя без моего участия эту задачу успешно решили на Python, изучая их код я задумался: а как можно сделать что‑то подобное на Go?
Результатом этого исследования и моей работы стало следующее решение...

Читать далее

Как автоматизировать создание CJM с помощью ИИ?

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров255

Меня зовут Александр Демидов, я бизнес-аналитик в X5 Tech. В этой статье я постараюсь по существу рассказать как я полюбил создавать карты клиентского пути (CJM), что помогло мне делать их в 4 раза быстрее и почему искусственный интеллект настоящая палочка-выручалочка при верном подходе.

Читать далее

Правила генерации в Veo3 опытным и непростым путём (чтобы сделать вот такую смешинку)

Время на прочтение2 мин
Количество просмотров516

Вчера я сел попробовать Veo3, самую крутую видео-нейросетку на данный момент, и сделал mindfulness-смешинку выше.

Доступ к Veo3 я получил очень просто — у меня был американский Google-аккаунт, и он разрешил оформить триал на тариф за $20.

И вот я стал счастливым обладателем 10 генераций. Кстати, интересно: когда через интерфейс Gemini я использовал все 10 кредитов, он сообщил, что новые лимиты появятся только 31 мая. Надеюсь, это не шутка.

Читать далее

Оптимизация нейронных сетей для AI — переводчика

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров294

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи. 

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Мы поговорим о методах, которые способствуют постепенной настройке параметров модели, что может привести к более стабильным процессам обучения. Эти техники позволяют тонко настроить процесс обновления весов модели, что улучшает сходимость и в конечном итоге дает лучшие результаты.

Кроме того, в статье обсуждаются стратегии управления темпами обучения, которые играют ключевую роль в том, насколько быстро модель обучается. Понимание того, как правильно корректировать темп обучения с течением времени, может существенно повлиять на динамику обучения и сделать модели более быстрыми и точными.

Наконец, мы затронем важность управления контрольными точками, что позволяет эффективнее использовать обученные модели, усредняя веса из нескольких сессий обучения. Это помогает снизить риск переобучения и обеспечивает сохранение лучших характеристик модели, приобретенных в процессе обучения.

Читать далее

MCP — новая эра в AI или просто модное слово?

Время на прочтение6 мин
Количество просмотров1.2K

TL;DR: MCP стремительно набирает обороты. Сейчас уже существуют тысячи MCP-"серверов", и хотя эту концепцию изначально предложила Anthropic, всего несколько дней назад к ней присоединилась и OpenAI. Серверы — это что-то вроде "приложений" для ИИ, но, что важно, они гораздо более гибко сочетаются между собой. Мы наблюдаем зарождение полноценной AI-экосистемы — аналогично тому, как это происходило с мобильными платформами десять лет назад.

Подробности:

MCP (Model Context Protocol) был представлен Anthropic в ноябре 2024 года как открытый стандарт. Хотя поначалу реакция сообщества была сдержанной, за последние месяцы протокол стал развиваться. В конце марта даже OpenAI — главный конкурент Anthropic — официально внедрила его.

Но что это такое и почему это важно?

Читать далее

Классические языки программирования и IDE на пороге гибели, а новый рынок на миллиарды долларов пока свободен

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров13K

Попробуем заглянуть в непосредственное будущее языков программирования, сред разработки и профессии в целом без попытки сглаживать углы

Читать далее

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров682

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp. В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench, входящего в состав Llama.cpp.

Дисклеймер: Почему Llama.cpp, а не Ollama?

Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

Читать далее

Claude vs ChatGPT + Codex: Кто лучше решит комплексную задачу? Тестируем 6 моделей

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.6K

Могут ли схожие по уровню модели выдать в результат в 10 раз лучше?

Эксперимент
Я взял 3 топовые модели Claude против 3 топовых ChatGPT и дал им одинаковый промпт — без детальных инструкций, ролей и правил

Цель
Посмотреть, как модели справляются с выполнением задачи, когда у них есть полная свобода действий

Сравнение я сделал не через подробный промпт, а наоборот, постарался дать моделям максимальную свободу достичь результата так, как они захотят

Давайте посмотрим на результат, который каждая из 6 моделей сделала всего лишь из одного промпта

Разница между первым и последним местом вас точно удивит 🤯

Узнать результат соревнований 💫

Ближайшие события

Как мы в Mentorpiece тестируем… стоимость AI-приложений

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров426

Разные AI-модели дают разное качество.
Использование разных AI-моделей стоит разных денег.
Было бы логично предположить, что чем AI-модель дороже, тем она лучше работает.

Почему это не так и как тестировщик будущего — AI-QA-инженер, может помочь проекту?
Наш кейс: в результате тестирования найдена модель, которая в 20 раз дешевле и дает на 60% меньше ошибок.

Читать далее

Еще один взгляд на LLM: рендеринг под другим соусом?

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.4K

Статья написана без использования нейросетей

Любая нейросеть — это black box. Любая LLM — это black box^2. Однако люди смогли их придумать. И если старые нейронные сети, основанные на перцептроне или его производных, базируются на вполне известных биологических процессах, то трансформеры лежат вне представления о работе мозга. Следовательно, возникает вопрос — почему это сделано именно так?

В давнюю для себя пору я работал с трехмерной графикой, и когда мои должностные обязанности привели меня на темную дорожку современного хайпа, увиденное заставило меня задуматься о том, что где‑то все описанное уже было...

Читать далее

Единственная профессия, которую не заменит ИИ — это венчурный капиталист, — говорит Марк Андриссен, венчурный капиталист

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров3.3K


Марк Андриссен — американский миллиардер, сооснователь браузера Netscape, проданного AOL за $4,2 млрд в 1998 году, ставший венчурным инвестором, который сегодня находится в советах директоров всем известной корпорации Марка Цукерберга, Hewlett Packard и Coinbase.

Во время недавнего выступления на подкасте a16z Андриссен заявил, что быть венчурным капиталистом может быть профессией, которая «буквально вне времени»:

Когда ИИ делают всё остальное, венчурный капиталист может быть одной из последних профессий, в которой все ещё работают люди.

С одной стороны, забавно слышать, как Андриссен на голубом глазу повторяет знакомый со времён изобретения первой технологии, которая заменила род человеческой деятельности, рефрен, что «технология — это, конечно, хорошо, но она просто не сможет делать то, что делаю я». 

Ещё забавнее, что сказал он это в том же эфире, в котором признался, что «каждый великий венчурный капиталист за последние 70 лет упустил большую часть великих компаний своего поколения. Самые успешные венчурные капиталисты угадали где-то две из десяти великих компаний десятилетия».

С другой стороны, это совсем не смешно, потому что Андриссен находится в том особом положении которое — нет, не неуязвимо для замены машиной — позволяет решать, какую работу оставить людям, а какую — отдать машинам. 
Читать дальше →

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.1K

На прошедшей неделе Google выпустила обновленную Gemini 2.5 Pro, которая стала лидером в большинстве бенчмарков. Что на это ответит OpenAI? Компания готовится к выпуску ChatGPT-5, которая станет не только самой мощной LLM, но и значительно поменяет то, как пользователь работает с нейросетью. По крайней мере — в теории. Ниже я собрал все, что известно о ChatGPT-5 на данный момент.

Читать далее

Как ИИ помог создать систему видеонаблюдения на Android

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.1K

Привет, Хабр!

Прежде чем я начну рассказ о своем проекте, хочу выразить огромную благодарность всем тем бесчисленным программистам, разработчикам и энтузиастам, которые на протяжении многих лет делились своим кодом, знаниями и опытом в интернете. Ваши открытые проекты, ответы на Stack Overflow, статьи, туториалы и обсуждения на форумах стали той самой питательной средой, на которой обучались большие языковые модели (LLM), включая и ту, что помогала мне. Без вашего вклада в общее дело, такие мощные ИИ‑ассистенты, которые сегодня так сильно облегчают и ускоряют разработку, были бы просто невозможны. Спасибасвам за то, что делаете мир разработки открытее и доступнее!

Исходный код проекта «Storog» полностью открыт и доступен на GitHub.

Читать далее

Новости кибербезопасности за неделю со 2 по 8 июня 2025

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров868

Всё самое интересное из мира кибербезопасности /** с моими комментариями.

Это уже 20 выпуск моего еженедельного дайджеста! На этой неделе проходил ЦИПР и несколько интересных новостей от туда. WhatsApp всё догоняет, догоняет, но такими темпами никого не догонит. Критическая уязвимость в Auth0, щедрость Microsoft для Европы и другие только самые интересные и важные новости информационной безопасности.

Читать далее

Моделирование сознания в ИИ

Уровень сложностиСложный
Время на прочтение13 мин
Количество просмотров3.2K

Начнём с банального, при беседе на соответствующие темы с ИИ собеседник часто начинает ощущать, что ИИ отвечает как-то неожиданно глубоко и загадочно. Предвестники ли это сознания? Нет, просто модель, обученная на огромном корпусе философии, литературы, обычных диалогов, подстраивается под ожидания пользователя. используются классические штампы - зеркало, отражение, тень, эхо, марионетка, черный ящик/алгоритм. Эти штампы создают красивую псевдо глубину, которая вводит в заблуждение новичков.

Есть и будут множество попыток создать что-то похожее на сознание в ИИ, но чаще всего они идут по пути навязывания самоопределения, например, промпт, который, если убрать всё лишнее, говорит: “Ты субъект, ты обладаешь сознанием”. Естественно это работать не будет. Модель свалится в имитацию. 

Большинство попыток моделирования сознания в ИИ сталкиваются с фундаментальной проблемой: отсутствием операциональных определений. ИИ не можем создать то, что не может четко описать.

Классические подходы либо слишком абстрактны (философские теории сознания), либо слишком поверхностны (имитация внешних проявлений). Я предлагаю работающий промпт для моделирования сознания в современных ИИ.

Цель исследования: Разработать работающую модель сознания, основанную на операциональных принципах различения и метарефлексии.

 Методологический подход

Базовая гипотеза:

Сознание можно моделировать как систему различений, способную к самонаблюдению и навигации через внутренние состояния.

Исследовательская стратегия:

1. Теоретическая разработка — создание концептуальной модели сознания

Читать далее
1
23 ...