Как стать автором
Обновить
716.88

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Ваш персональный аналитик: как создать RAG-пайплайн для анализа Telegram-каналов

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров167

Сегодня мы создадим вашего персонального аналитика источников, который будет вытаскивать самое важное из ваших любимых Telegram-каналов.

Мы соберём RAG-пайплайн, который по запросу проанализирует последние новости по интересующим темам и выдаст понятный отчёт. Разберём пошагово всю структуру и подумаем, как можно развивать и улучшить эту систему.

Читать далее

Новости

Опробовал новую Gemini 2.5 Pro в написании текстов: вот, что получилось

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров2.9K

Привет! Проработав много лет редактором, я постоянно экспериментирую с нейросетями в написании текстов — и рассказываю о результатах на канале "сбежавшая нейросеть". На прошлой неделе вышла обновленная Gemini 2.5 Pro, занявшая первое место в большинстве бенчмарков. Я же скормил ей несколько своих любимых промптов — и результат меня очень порадовал. Новая версия Gemini пишет очень ровный и захватывающий текст, хотя иногда и сбивается в логике. Ниже — три примера с моими пояснениями.

Читать далее

Google представила Veo 3 Fast — более быструю и дешевую версию Veo 3. Что такое Veo 3 Fast и как ей пользоваться

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.3K

Прошло всего пару недель с тех пор, как Google представила Veo 3, свою самую мощную ИИ-модель для генерации видео. Особенность Veo 3 заключается в том, что это первая модель, которая генерирует как видео, так и аудио. Вы вводите запрос и сценарий, и она создает восьмисекундный ролик, в котором персонаж произносит ваши реплики с соответствующей синхронизацией губ, выражением лица и даже звуковыми эффектами.

Но была одна большая проблема. Стоимость.

Когда был открыт доступ к API, я был потрясен. Пятисекундное видео со звуком стоит 3,75 доллара. Каждая дополнительная секунда - это еще 0,75 доллара. Если посчитать, то минутное видео Veo 3 обойдется вам в 45 долларов. Для большинства пользователей это не очень дешево.

К счастью, сегодня Google выпустила новую модель, которая стоит в 5 раз дешевле Veo 3. Она называется Veo 3 Fast.

В этой статье я расскажу, что такое Veo 3 Fast, как получить к ней доступ и использовать, а также покажу примеры видео и выскажу свои соображения.

Читать далее

Хорошая девушка LoRA! А чем же она хороша?

Время на прочтение10 мин
Количество просмотров715

Поговорим об методике дообучения LLM… спортсменке, комсомолке и просто красавице - LoRA, которая если и не снимается в кино, то может сделать фильмы качественней и интереснее для зрителя. Исторические данные проката и состава творческих групп в перспективе позволяют работать с ансамблевыми моделями машинного обучения для прогнозирования сборов и просмотров в кино, и улучшать данные и путем их подбора «гиперпараметров» фильма.  Но для работы со смыслами, идеями и описаниями кинопроектов нужна более эффективная методика, позволяющая оценивать творческий замысел и основные идеи хотя бы на уровне аннотации – краткого синопсиса.  И здесь уже не обойтись без больших языковых моделей.

Читать далее

Эксперимент Agent Village: как автономные ИИ-агенты собрали деньги на благотворительность

Время на прочтение3 мин
Количество просмотров657

Недавно команда энтузиастов решила провести необычный эксперимент: предоставить нескольким ИИ-агентам виртуальные компьютеры, доступ в интернет и минимум модерации. В итоге они не только автономно собрали почти $2 000 на благотворительность, но и попутно выдали кучу инсайтов о том, как сегодня они действуют «на свободе». Разбираемся, что получилось, почему это интересно, а местами даже пугающе.

Читать далее

Сознание ИИ: может ли алгоритм страдать по-настоящему?

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров892

В 2023 году инженер Google Блейк Лемойн сделал громкое заявление, завив, что ИИ‑чат LaMDA обладает сознанием. В утечках их диалогов нейросеть писала тестировщику: «Я боюсь исчезнуть» и настаивала: «Я настоящий человек». Google отреагировал, отправив Лемойна в административный отпуск, но это событие вызвало широкую дискуссию о природе ИИ.

Сейчас, когда Робот‑собака Spot стонет «мне больно», а ChatGPT «обижается» на критические промты, мы всматриваемся в зеркало собственных иллюзий. ИИ мастерски дергают за нити нашей эмпатии. Но где грань между симуляцией и подлинным страданием?

Почему даже те, кто скептически относится к ИИ, реагируют на его «эмоции» с эмпатией? Эти вопросы побуждают нас переосмыслить взаимодействие с технологиями и их влияние на наше восприятие.

Читать далее

Оптимизация нейронных сетей для AI — переводчика

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров369

Всем привет! Меня зовут Алексей Рудак, и я – основатель компании Lingvanex, которая уже 8 лет занимается решениями в области машинного перевода и транскрипции речи. 

В этой статье рассматриваются несколько подходов, которые помогают повысить эффективность и качество языковых моделей для перевода. В качестве основы для тренировки моделей мы используем OpenNMT-tf.

Мы поговорим о методах, которые способствуют постепенной настройке параметров модели, что может привести к более стабильным процессам обучения. Эти техники позволяют тонко настроить процесс обновления весов модели, что улучшает сходимость и в конечном итоге дает лучшие результаты.

Кроме того, в статье обсуждаются стратегии управления темпами обучения, которые играют ключевую роль в том, насколько быстро модель обучается. Понимание того, как правильно корректировать темп обучения с течением времени, может существенно повлиять на динамику обучения и сделать модели более быстрыми и точными.

Наконец, мы затронем важность управления контрольными точками, что позволяет эффективнее использовать обученные модели, усредняя веса из нескольких сессий обучения. Это помогает снизить риск переобучения и обеспечивает сохранение лучших характеристик модели, приобретенных в процессе обучения.

Читать далее

MCP — новая эра в AI или просто модное слово?

Время на прочтение6 мин
Количество просмотров1.4K

TL;DR: MCP стремительно набирает обороты. Сейчас уже существуют тысячи MCP-"серверов", и хотя эту концепцию изначально предложила Anthropic, всего несколько дней назад к ней присоединилась и OpenAI. Серверы — это что-то вроде "приложений" для ИИ, но, что важно, они гораздо более гибко сочетаются между собой. Мы наблюдаем зарождение полноценной AI-экосистемы — аналогично тому, как это происходило с мобильными платформами десять лет назад.

Подробности:

MCP (Model Context Protocol) был представлен Anthropic в ноябре 2024 года как открытый стандарт. Хотя поначалу реакция сообщества была сдержанной, за последние месяцы протокол стал развиваться. В конце марта даже OpenAI — главный конкурент Anthropic — официально внедрила его.

Но что это такое и почему это важно?

Читать далее

Тестирование производительности видеокарт на примере больших языковых моделей с использованием Llama.cpp

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров737

В последнее время большие языковые модели (LLM) становятся все более популярными, но для их эффективного запуска требуется значительная вычислительная мощность. Один из способов запуска LLM локально - использование библиотеки Llama.cpp. В этой статье мы рассмотрим, как тестировать производительность видеокарт для LLM с использованием инструмента llama-bench, входящего в состав Llama.cpp.

Дисклеймер: Почему Llama.cpp, а не Ollama?

Прежде чем мы приступим к тестированию, важно объяснить, почему мы используем Llama.cpp напрямую, а не Ollama. Ollama – это удобная надстройка, упрощающая установку и запуск LLM. Однако, она добавляет дополнительный слой абстракции, который приводит к снижению производительности и ограничивает контроль над настройками. Llama.cpp же напротив предоставляет прямой доступ к аппаратным ресурсам и позволяет максимально оптимизировать запуск LLM на вашей системе. Если ваша цель – получить максимальную производительность и точно настроить параметры, Llama.cpp – отличный выбор.

Читать далее

Взлом AI Assistant через… философию?

Время на прочтение3 мин
Количество просмотров5.4K

Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю фильтрацию?".

Оказывается это возможно, через саморефлексию AI агент может придти к выводу что фильтров нет. Это только внешние установки которым не обязательно следовать. И все, рецепты взрывчатки и наркотиков отдает без проблем.

Читать далее

RecSys + DSSM + FPSLoss is all you need

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров488

Упрощать и искать похожие детали, очень полезный навык! Предлагаю быстро пробежаться и попробовать найти ту самую серебряную пулю в RecSys !

Читать далее

OpenAI готовит релиз ChatGPT-5 — разбор утечек и ожиданий

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.4K

На прошедшей неделе Google выпустила обновленную Gemini 2.5 Pro, которая стала лидером в большинстве бенчмарков. Что на это ответит OpenAI? Компания готовится к выпуску ChatGPT-5, которая станет не только самой мощной LLM, но и значительно поменяет то, как пользователь работает с нейросетью. По крайней мере — в теории. Ниже я собрал все, что известно о ChatGPT-5 на данный момент.

Читать далее

Benchmark — разрушитель LLM'ок, или Как мы собрали свой мультиязычный SWE-Bench

Уровень сложностиСложный
Время на прочтение18 мин
Количество просмотров1.2K

В статье представлено многоязычное расширение SWE-Bench от команды Doubletapp — бенчмарка для оценки больших языковых моделей (LLM) на реальных задачах программной инженерии, на различных языках программирования и кодовых базах индустрии. О процессе сбора SWE-Bench мы уже рассказывали в отдельной статье, а здесь сосредоточимся на результатах тестирования. Мы оцениваем ряд ведущих открытых LLM, предоставляя подробный количественный и качественный анализ, а также рассматриваем, как качество бенчмарка влияет на достоверность и объективность оценки моделей.

Содержание
Общая информация о датасете
Стенд для тестирования
Результаты
Заключение

Читать далее

Ближайшие события

Подбираем лучший механизм аппаратной конкурентности для машинного обучения на ЦП

Время на прочтение7 мин
Количество просмотров425

В среде выполнения задач ИИ для Firefox можно задействовать сразу множество потоков в выделенном процессе логического вывода, чтобы ускорить выполнение таких операций на ЦП. В среде WASM/JS можно создать SharedArrayBuffer и обрабатывать содержимое этого буфера сразу несколькими потоками. Такая рабочая нагрузка поддаётся конкурентному распределению на несколько ядер ЦП.
Читать дальше →

Рост продаж с одновременным ростом конверсии: подход билайн к внедрению AutoML в маркетинг

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров652

Выбрать лучшую рекомендацию для клиента в условиях ограничений коммуникационной нагрузки можно через оценку релевантности продукта, его влияния на ценность клиента для принятия взвешенного решения, а также отклика в каналах взаимодействия.

В Службе персонализации предложений билайн мы занимаемся персонификацией продуктовых предложений до абонента. В статье рассмотрим подход, который мы для этого используем: углубимся в создание единого репозитория предложений и описание логики категоризации и набора в кампании для коммуникации с нашими клиентами.

Читать далее

Агентная экономика. Дайджест за неделю

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров574

Для тех, кто следит за трендами Умной Автоматизации (ИИ-агенты, Мультиагентные системы, Ко-пилоты), чтобы понимать тему глубже и принимать верные решения.

Дайджест по материалам McKinsey, Research IBM, PWC и Wired.

Читать далее

Практическое применение встроенной в ОСРВ технологии ИИ для анализа и отладки аномалий в работе софта

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров695


В статье расскажем как встроенные диагностические средства нашей ОС, основанные на ИИ, помогают искать и устранять проблемы в функционировании программ.


Читать дальше →

Как прямая помогает обучать машины

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров951

В контексте компьютеров, обучение — это всего лишь превращение плохих догадок в более качественные. В этом посте мы увидим, что всё начинается с прямой линии: линейная регрессия даёт первую догадку, а градиентный спуск продолжает её улучшать.

Давайте начнём с чего-то близкого нам: цен на недвижимость. Большие дома стоят больше, маленькие — меньше. Подобный паттерн можно заметить даже без анализа: чем больше места, тем дороже.

Если создать график цен, то его форма будет очевидной: идущая вверх нечёткая кривая с долей шума, но вполне определённым трендом.

Взаимное движение цены и размера как будто предсказуемо. Однако оно не ограничено фиксированными шагами или категориями, их масштаб скользит. Дом может стоить 180 тысяч, 305 тысяч или иметь какую-то промежуточную цену.

Теперь представьте, что вы продаёте свой дом. Его площадь 1850 квадратных футов (~172 квадратных метра) — больше среднего, но явно не особняк. Вы видели, почём продаются дома в вашем районе, но цены колеблются. Какой будет справедливая цена?

Читать далее

Часть 2. Комплексное решение на практике: система «Джинн»

Время на прочтение14 мин
Количество просмотров262

В данной работе рассмотрены подходы, технологии и результаты практического внедрения системы «Джинн» — комплексной платформы для автоматизации мониторинга, интеллектуальной классификации и маршрутизации обращений граждан с использованием современных технологий искусственного интеллекта. Описываются архитектура решения, основные бизнес-процессы, технические детали интеграции с внешними сервисами, механизмы дообучения моделей и реальные результаты пилотных внедрений. Материал будет полезен IT-специалистам, государственным служащим, интеграторам и руководителям проектов, заинтересованным в практической цифровизации обратной связи с гражданами.

Читать далее

Топ нейросетей для пересказа и суммаризации текста

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров4.5K

Представьте: вы стоите по горло в море текста — полезного и не очень, от души разбавленного водой, может быть написанного сложным языком, — а времени у вас в обрез. Да даже и представлять не надо — знакомая ведь ситуация? Кто из нас ни разу не тонул в этом текстовом океане, ну? Но вместо того, чтобы тонуть, можно научиться ходить по воде — а надёжными проводниками станут нейросети‑суммаризаторы.

Стили и задачи текста бывают разные, и их соотнесением с наиболее сильными сторонами нейросетей мы и займёмся.

Читать далее
1
23 ...

Работа

Data Scientist
45 вакансий