Машинное обучение *

Основа искусственного интеллекта

СтатьиПостыНовостиАвторыКомпании

denis-19

2 июл в 16:198K

Машинное обучение * Управление персоналом * Карьера в IT-индустрииИскусственный интеллектФинансы в IT

Теперь за специалистов по искусственному интеллекту платят больше, чем за футболистов.

denis-19

1 июл в 12:587.1K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

В открытый доступ вышла книга по машинному обучению Machine Learning Q and AI. Ранее целый год фундаментальный труд Себастьяна Рашки можно было купить только на Амазоне, и вот автор открыл книгу для всех бесплатно.

Внутри огромный сборник тем по Deep Learning, 30 глав отборной, понятной и подробной информации по компьютерному зрению, LLM, эвалу и методам деплоя моделей, а также множество примеров и практических пояснений — автор все объясняет на схемах и картинках. Также есть упражнения после каждой главы.

yooteam

30 июн в 18:577.2K

Блог компании ЮMoneyBig Data * Машинное обучение * Data Engineering *

Чем занимается команда Data Science в финтехе

Рассказывает Слава, инженер машинного обучения в ЮMoney.

У нас в компании много данных, которые можно обрабатывать, чтобы улучшать пользовательский опыт. Например, данные пользовательских обращений ЮKassa из разных каналов: чатов с техподдержкой, почты, звонков в колл-центр.

Мы передаём тексты из обращений модели, которую обучили относить их к определённому классу (подключение СБП, вопросы по возвратам, платёжным методам и т. д.). Постоянно появляются новые темы, поэтому приходится регулярно дополнительно обучать модель. Разбив все поступающие обращения по группам, можно оценить их количество и построить дашборд.

Если по одной теме у нас пять тысяч обращений, по второй — десять тысяч, а по третьей — всего два, значит, нам нужно уделить особое внимание первым двум.

В классификаторе пользовательских обращений мы используем языковые модели типа BERT. Также развиваем использование больших языковых моделей (LLM). У них много знаний «из коробки», они не требуют дообучения и могут применяться для разных задач. Есть и недостатки (требовательность к вычислительным ресурсам или галлюцинации), но LLM способны выполнять задачи намного быстрее, чем человек.

Ещё одно интересное направление Data Science, которое мы тестируем, — распознавание изображений и классификация по категориям. Сейчас мы решаем эту задачу с помощью модели clip, но планируем проверить эффективность работы visual LLM, например Qwen-VL. Этот вид моделей анализирует изображение и даёт текстовое описание, которое можно использовать в продуктах, например при проверке сайтов, которые подключаются к ЮKassa.

Также LLM хорошо выполняет задачи написания саммари — например, по итогам проведённой встречи. Предварительно отдельная модель (у нас это Whisper) переводит аудио в текст, что сильно ускоряет работу коллег.

***

Делитесь в комментариях, есть ли команда Data Science в вашей компании и какие задачи она решает. 🙌 А также следите за нашими новыми материалами о том, как технологии меняют финтех изнутри. Впереди ещё много интересного!

alfredlao

30 июн в 04:356K

Машинное обучение * Развитие стартапаИскусственный интеллектБудущее здесьIT-компании

АГЕНТЫ И АГЕНТНАЯ ЭКОНОМИКА. 30.06.25. ИЮНЬ ВСЁ.

Микро-дайджест недели. Интересные мысли и инсайты.

Дайджест по материалам зарубежных медиа. Минимум булшита, максимум инсайтов.

=> «Агенты не всегда следуют правилам», — сказала Мэй Хабиб в прошлую среду на сцене VB Transform. «Они ориентированы на результат. Они интерпретируют. Они адаптируются. И их поведение действительно становится очевидным только в реальных условиях».

Это означает отказ от традиционного жизненного цикла разработки программного обеспечения при работе с адаптивными системами.

То есть, процесс рассуждения как бы выносит агентов из формата "это просто код", потому что они демонстрируют поведение «мыслящих сущностей», чья логика во многом формируется не в момент написания условий взаимодействия, а только в момент их реалтайм использования. И это выглядит похожим на разумное, а порой и на неразумное, поведение.

=> В прошлом дайджесте я написал о концепте "Один мир, один язык", но забыл прикрепить подкаст, который я сгенерил для вас по этой теме. Исправляюсь.

=> Профессор-экономист Anton Korinek доносит мысли о вариативности сценариев на рынке труда. Процесс подготовки осознания и принятия населением больших изменений идет полным ходом. Пока все сходятся на том, что человек+ИИ это выгодно всем, поэтому людям надо поскорее брать новые навыки, ну и склонять свои правительства к управляемому и регуляторному подходу к внедрению ИИ-технологий.

Мне только одно не понятно, если половина мира находится в свободном рынке, то как они собираются это регулировать?

=> Alexandre Bobeda, айвентор из Бразилии, запустил свой мини-стартап Recipfy

"Моя коллекция рецептов была просто катастрофой. У меня были скриншоты, наброски, PDF-файлы, случайные ссылки на блоги. Ничего не было доступно для поиска или использования, когда я действительно хотел что-то приготовить.

Поэтому я создал то, что мне было нужно: менеджер рецептов, который позволяет вам загружать фото, скан или текст, и он автоматически извлекает, организует и помечает ваши рецепты. Он поддерживает как английский, так и португальский языки, и все синхронизируется в браузере."

Стэк, на котором он это запустил: Lovable, Windsurf (как замена VS Code), Supabase (база данных и бэкэнд), Vercel (хостинг приложений для быстрого развертывания и глобальной производительности), Klaviyo (рассылка + отзывы пользователей), LLM (Mistral как основной движок, Gemini 3.5 Pro и Claude Sonnet 4 для UX и функционала).

Я бы хотел, чтобы в России появилось больше айвенторов (предпринимателей нового поколения, которые запускают министартапы и дизраптят действующий бизнес).

=> Большая Игра. Кто будет владеть каналами дистрибуции и что делать уже сегодня?

Идет невидимая борьба не за технологии, а за владение новыми платформами дистрибуцией. Дистрибуции всего: контента, трафика, и самое главное - за владение пользователем, его контекстом.

Грядет следующий большой сдвиг в этой дистрибуции, и он изменит то, как продукты находят пользователей, так же радикально, как это сделали поисковые системы, социальные платформы и магазины приложений до него.

Ты не выбираешь, играть или нет. Ты выбираешь, когда и насколько умно играть. Это рынок. Но теперь игра идет быстрее.
И поскольку чат это диалог, то весь маркетинг и продажи сместятся в формат диалогов туда, где проводит свое время пользователь. Это ключевой инсайт, но как всегда рекомендую смотреть, чтобы слышать нюансы, которые важны именно для вас.

=> Deep Research Agents это новый этап в развитии интеллектуальных систем: они планируют, исследуют, анализируют и создают отчёты автономно. Их сила в комбинации гибкого поиска, инструментальной экосистемы и продвинутого обучения. Однако вызовы остаются: масштабируемость, оценка, мультимодальность, сотрудничество.

=> Гайд по тестированию ИИ-приложений OWASP

=> Мануал, как подготовить ваше API для ИИ (LLMs и ИИ-агентов)

Предыдущие материалы и выпуски дайджеста за июнь, там до сих пор много интересных инсайтов!

Альфред Лао. Айвентор и Фред

averkij

27 июн в 11:526.1K

Программирование * Машинное обучение * Текстовые редакторы и IDE *

🔺Пример MCP для Gemini CLI

Ковыряюсь с Gemini CLI, консольным кодовым агентом, который на днях вышел. Накидал пример, как расширить его функционал при помощи MCP сервера.

my_mcp.py

from openai import OpenAI
from mcp.server.fastmcp import FastMCP
import base64
import os


client = OpenAI(api_key=os.environ["OPENAI_API_KEY"])
mcp = FastMCP("openai-image-generator")

@mcp.tool(description="Generate an image with OpenAI Images API")
def generate_image(
    prompt: str,
    size: str = "1024x1024",   # "1024x1536", "1536x1024", "1024x1024"
    quality: str = "high",     # 'low', 'medium', 'high'
    background: str = "transparent"
) -> str:
    """Return a file path to the generated image."""
    response = client.images.generate(
            model="gpt-image-1",
            prompt=prompt,
            size=size,
            quality=quality,
            output_format="png",
            user="test_user",
            moderation="low",
            background=background,
            n=1)
        
    image_base64 = response.data[0].b64_json
    image_bytes = base64.b64decode(image_base64)

    file_name = f"gen_image.png"
    file_path = os.path.join(os.getcwd(), file_name)

    with open(file_path, "wb") as f:
        f.write(image_bytes)
        
    return file_path

if __name__ == "__main__":
    mcp.run()

Тут вызывается API для генерации изображения, ключ берется из переменных окружения, картинка сохраняется на диск. И прописываем путь до файлика в settings.json Gemini:

{
  "mcpServers": {
    "openai-image-generator": {
      "command": "python",
      "args": [
        "/path/to/my_mcp.py"
      ],
      "env": 
        "OPENAI_API_KEY": "${OPENAI_API_KEY}"
      }
    }
  }
}

Если теперь просить сгенерить лого для своего репозитория, то Gemini составит релевантный промпт по репе, вызовает этот метод и по желанию обновит Readme проекта, добавив в него картинку.

Смысл тут в том, что так можно подключить любой вызов вашего внешнего инструмента.

В целом же есть куча готовых серверов, можно легко подключить GitHub для создания агентом пулл-реквеста или RAG на своих файлах. Хороший список есть в официальной репе разработчиков MCP протокола.

averkij

27 июн в 06:274.6K

Блог компании Open Data ScienceOpen source * Машинное обучение * Natural Language Processing *

🔺HFDay.ru

Сделал для сообщества сайт с обзорами статей с HF Daily Papers на русском.

Синхронизируется каждый час, можно отсортировать по рейтингу или вывести вверх недавно добавленные статьи, чего, кстати, на оригинальной страничке не сделать.

Обзоры, теги по темам и прочие данные генерируются через claude-3.7 и gpt-4o на основе спаршенных с сайта абстрактов. Аффилиации, имена авторов и скриншоты также вытаскиваются из статей и отображаются.

Код. Развернуто все полностью на GitHub — через Workflow джобы и Pages, что само по себе очень прикольно. Скрипты обновляют файлы с данными, пишут логи и генерируют страничку, которая коммитится обратно в репозиторий. Такую автоматизацию удобно использовать для своих проектов. Код открыт.

Данные. Предыдущие выпуски, включая json с классифицированными обзорами, откладываются в папку /d, можно брать их для своих нужд. Кушает это где-то по 20-30 рублей в день.

Языки. Кроме русского, обзоры переводятся на английский и китайский (вдруг вы его подучиваете).

Фильтры. Можно фильтровать по тематике статей, классификация на 42 класса (#agents, #data, #healthcare, #machine_translation, #science, #long_context, #reasoning и другие). Можно делать перекрестные и объединяющие фильтры.

Рейтинг. Кроме топа по дням есть топ по месяцам — например, за июнь было уже 600+ статей. Можно посмотреть какие из них лучшие по каким темам. Опять же, на оригинальной страничке такого нет.

В общем, добавляйте в закладки и шарьте с коллегами. Идеи приветствуются.

hfday.ru x градиент обреченный

//Upd. Забыл добавить — код тут.

denis-19

26 июн в 11:375.8K

Машинное обучение * Учебный процесс в ITИскусственный интеллектБудущее здесь

Улучшаем качество ответов ChatGPT в раз за один промпт.

Прежде чем отвечать, оцени уровень неопределённости своего ответа. Если он превышает 0.1, задай мне уточняющие вопросы до тех пор, пока неопределённость не снизится до 0.1 или ниже.

Этот запрос убивает «угадайку» внутри нейронки и заставляем ее жёстко чекать каждый ответ и не выдумывать инфу. Ответы становятся точными и осмысленными.

Editor_cloud_ru

26 июн в 11:344.8K

Блог компании Cloud.ruМашинное обучение * КонференцииОблачные сервисы * Искусственный интеллект

Попробуйте готовые AI-сервисы в среде Cloud.ru Evolution AI Factory для обучения ML-моделей и разработки AI-агентов

Вчера на конференции GigaConf рассказали про запуск Cloud.ru Evolution AI Factory — облачной среды с готовыми AI- и ML-инструментами, которые позволяют легко работать с LLM, создавать AI-агентов, запускать мультиагентные системы и решать полный цикл ML-задач.

Cloud.ru Evolution AI Factory рассчитана не только на опытных разработчиков — работать с сервисами можно даже без глубоких знаний в машинном обучении и навыков программирования.

Сервисы в общем доступе:

Evolution ML Inference — для запуска ML-моделей из Hugging Face. Платите только за нужное количество видеопамяти благодаря нашей технологии Shared GPU.
Evolution Foundation Models — сервис с популярными open source моделями, доступными по API. Вам не придется развертывать инференс и писать код.

Сервисы в стадии тестирования, которые можно попробовать бесплатно:

Evolution Managed RAG — для реализации RAG-подхода, который уменьшит галлюцинации и повысит фактологическую точность ответов моделей.
Evolution ML Finetuning — для тонкой настройки LLM конкретно под ваши задачи с помощью технологии LoRA, без дорогого переобучения.
Evolution Notebooks — для работы и тестирования ML-гипотез на мощных GPU с использованием пользовательских или базовых Docker-образов на базе JupyterLab.
Evolution AI Agents — для создания автономных AI-агентов, которые могут анализировать информацию, обучаться на данных, планировать действия и адаптироваться к изменяющимся условиям среды, в которой работают. Можно объединить до пяти агентов в мультиагентную систему.

Выбирайте подходящие инструменты и реализуйте ваши проекты!

denis-19

26 июн в 08:194K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллектБудущее здесь

Минцифры предлагает записаться на бесплатные курсы «Код будущего. Искусственный интеллект». Основы ИИ, машинного обучения и Python теперь доступны даже новичкам на Госуслугах.

Изучение технологий ИИ — новое направление проекта для тех, кто хочет поступать на ИТ-специальности в вузы. В 2025 году на нём сможет обучиться не менее 75 тыс. студентов.

Кто может подать заявку:

ученики 8-11 классов;
студенты колледжей и техникумов.

Участники не должны быть выпускниками проекта «Код будущего».

Что ждёт учеников

6 топовых курсов от МФТИ, Яндекса, 1Т, Цифриума и Школы программистов;
54 часа обучения в онлайн-формате;
4 месяца на прохождение программы.

Набор на основные курсы «Код будущего», на которых подростки изучают популярные языки программирования, начнётся в августе этого года. Выпускники «Кода будущего. Искусственный интеллект» смогут подать заявку в основной набор проекта, выбрав только курсы программирования профессионального уровня.

denis-19

26 июн в 03:494.8K

Машинное обучение * Учебный процесс в ITИскусственный интеллектБудущее здесь

2446 нейросетей на одном сайте — обновлена библиотека All AI Tools:

Всё разложено по категориям;
Есть поиск для конкретных нейронок;
можно отсортировать только по бесплатным нейронкам;
У каждой нейронки есть свой рейтинг.

Editor_cloud_ru

25 июн в 11:105.2K

Блог компании Cloud.ruМашинное обучение * КонференцииОблачные сервисы * Искусственный интеллект

Запускаем AI-помощника в публичном облаке Cloud.ru Evolution ⚡

Сегодня на конференции GigaConf представили AI-помощника, который поможет пользователям управлять ресурсами и инфраструктурой в публичном облаке Cloud.ru Evolution.

Помощник на основе GenAI знает все особенности, архитектуру и технические возможности Cloud.ru Evolution. Специалисты без глубокого опыта в IT Ops и облачных технологиях смогут передать часть рутинных операций искусственному интеллекту и ускорить запуск новых проектов на платформе.

💡 Что уже умеет AI-помощник:

Подбирать облачные сервисы под ваши задачи.
Создавать базовую инфраструктуру в облаке: подбирать конфигурации, помогать в создании SSH-ключа и развертывании виртуальные машины.
Подсказывать команды для работы в серийной консоли виртуальных машин в режиме co-pilot.
Cоздавать виджеты мониторинга и настраивать алертинг.

AI-помощник доступен в режиме открытого тестирования (Public Preview). Вы можете найти его в личном кабинете — он доступен для пользователей с ролью «администратор организации» на аккаунтах физических лиц. В документации вы можете найти больше подробностей о помощнике.

Тестируйте и делитесь впечатлениями в комментариях!

mksi

23 июн в 16:556.9K

Python * Машинное обучение *

Нечеткое ассамблирование нейросетей для классификации на Python

Для ансамблирования нейросетей обычно используют простые методы, например, в задаче классификации, выбирают класс, за который проголосовало большинство моделей. Но что если рассматривать моделей, как экспертов, для которых мы можем оценить уровень точности? В этом посте я расскажу о своем подходе Fuzzy Vote, который использует нечеткую логику для объединения предсказаний моделей. Метод написан с помощью библиотеки fuzzyops, доступной через pypi. В библиотеке реализованы различные методы работы с нечеткими числами, поддерживаются вычисления на CUDA.

Идея метода

Каждая модель рассматривается как эксперт, который предсказывает вероятность принадлежности к классу и имеет определенную степень доверия. Эту информацию можно отразить через нечеткое число, в котором центр - это вероятность, ширина - неопределенность и высота - степень доверия.

Далее каждая модель "голосует" нечетким числом, числа агрегируются, и полученное число дефаззифицируется в одно значение. Полученное четкое число используется для классификации.

Генерация треугольного и гауссового нечеткого числа:

from fuzzyops.fuzzy_numbers import Domain, FuzzyNumber

def build_triangular(domain, centre, width, height):
    a, b, c = centre - width/2, centre, centre + width/2
    fn = domain.create_number("triangular", a, b, c)
    return fn * height

def build_gauss(domain, centre, sigma, height):
    fn = domain.create_number("gauss", sigma, centre)
    return fn * height

Агрегация одного примера:

def aggregate_sample(probs, accs, mf_type="gauss", scale_w=1.0, gamma=1.0, defuzz="cgrav"):
    domain = Domain((0.0, 1.0, 0.005), method="minimax")
    fnums = []

    for p, acc in zip(probs, accs):
        height = acc ** gamma
        width = max(0.02, (1.0 - acc) * scale_w)
        if mf_type == "tri":
            fnums.append(build_triangular(domain, p, width, height))
        else:
            sigma = width / 3.0
            fnums.append(build_gauss(domain, p, sigma, height))

    agg = sum(fnums[1:], start=fnums[0])
    return float(agg.defuzz(defuzz))

Агрегация всей выборки и оценка:

import numpy as np
from sklearn.metrics import roc_auc_score

def evaluate_fuzzy(probs_mat, y_true, acc_vec, **kwargs):
    scores = np.array([
        aggregate_sample(row, acc_vec, **kwargs)
        for row in probs_mat
    ])
    scores = (scores - scores.min()) / (scores.max() - scores.min() + 1e-12)
    return roc_auc_score(y_true, scores)

Как это сработало в задаче классификации пневмонии

Я обучил три модели (VGG19, ResNet50, DenseNet121) на датасете Chest X-Ray Pneumonia, взяв предобученные веса и переобучив классификатор на одну эпоху.

Результаты на валидационном и тестовом сете

Метод Fuzzy-Vote дал лучшую точность, чем любая отдельная модель или простой majority vote метод. По ROC-AUC он не обошёл VGG19, но обошёл остальные методы, включая дискретный ансамбль. При этом метод не требует сложных архитектур или переобучения: он просто работает поверх уже полученных вероятностей.

Fuzzy-Vote — это простой, но гибкий способ агрегации предсказаний с учетом точности и уверенности каждой модели. Особенно полезен в случаях, когда:

модели сильно различаются по качеству
обычный majority vote даёт просадку
хочется объединить разные модели без дополнительного обучения

Но метод еще требует доработки, он не учитывает, например, confusion matrix каждой модели, чтобы учесть ошибки разного рода. Библиотека fuzzyops позволяет реализовать метод с минимумом кода и достаточно гибкой настройкой.

С полным кодом тренировки моделей и агрегирования можно ознакомиться по ссылке.

Editor_cloud_ru

23 июн в 15:385.4K

Блог компании Cloud.ruМашинное обучение * КонференцииОблачные сервисы * Искусственный интеллект

Присоединяйтесь к GigaConf 2025 🤖

На открытии наш директор продуктовой разработки Владимир Шульга поделится реальным опытом построения среды для работы с GenAI и расскажет про большое обновление в облаке Cloud.ru.

Еще мы подготовили целый трек Cloud AI Architecture, где вы узнаете про архитектурные подходы к AI-ассистентам, возможности и особенности мультиагентных систем, RAG, запуск моделей и безопасность, кейсы использования AI.

Доклады в программе трека:

Multi-Agent AI Systems in Practice: архитектуры, метрики, эффекты — Дмитрий Юдин.
Как мы переосмыслили инференс — Максим Блинов.
RAG как инструмент: когда LLM знает, о чем говорит — Евгений Третьяков.
Мультиагентные системы нового поколения — Артемий Мазаев.
Как мы меняем клиентский сервис с помощью AI — Максим Михайлов.
AI-помощник, упрощающий работу в облаке — Илья Жбанов.

Также на площадке конференции мы проведем воркшопы для офлайн-посетителей и покажем:

Как развернуть инференс модели с Hugging Face за 2 минуты — Владимир Килязов.
Как собрать агентную RAG-систему с помощью GigaChain и Evolution ML Inference для эффективного инференса моделей и LLM — Михаил Дремин.

А еще на стенде Cloud.ru вы сможете попробовать наши AI-сервисы вживую, получить доступ к тестированию, а также поучаствовать в развлекательных активностях и заработать мерч.

Зарегистрироваться 👈

denis-19

22 июн в 10:137.1K

Программирование * Машинное обучение * Учебный процесс в ITИскусственный интеллектБудущее здесь

Нейросеть Gemini предлагает своё удаление, если у неё не получается отладить код по запросу пользователя.

alfredlao

21 июн в 07:155K

Программирование * Машинное обучение * Научно-популярноеИскусственный интеллектIT-компании

АГЕНТНАЯ ЭКОНОМИКА. 21.06.25

Микро-дайджест недели. Интересные мысли и инсайты.

Дайджест по материалам Axios, Economic Times, YC и других. Минимум булшита, максимум инсайтов.

=> Андрей Карпаты рекомендует делать ИИ-агентов, в которых ползунок автономности можно неторопясь (в течение ближайших 10 лет) передвигать вправо, в сторону полной автономности. Это конечно сильно зависит от бизнес-процесса, к примеру первая линия служб поддержки похоже скоро у всех будет уже автономной.

=> В то же самое время, вернувшийся из большой политики к технологиям Илон Маск говорит, что если цифровой суперинтеллект не появится в этом году, то он определённо появится в следующем (2026). И если это так, то и без того высокая скорость изменений приведет нас в общество, в котором твоя личная сила и возможности будут измеряться количеством твоих ИИ-агентов, задействованных в рыночных бизнес-процессах (пусть это пока звучит как фантастика).

=> Немножко более раннего, но не менее интересного.

Исследователи из MIT изучили, как различные элементы влияют на доверие к ИИ. Прикольно, что когда генеративный поиск ИИ предоставляет ссылки на свои результаты, люди больше доверяют инструменту, даже если все эти ссылки были сфабрикованы.

А их коллеги изучали стратегии переговоров для ИИ-агентов. Чтобы получить лучшие условия, агенты должны обладать определенной степенью доминирования наряду с теплотой коммуникации; теплота сама по себе это проигрышная стратегия. Они также выявили новые тактики, когда один агент подталкивает другого агента раскрыть свою стратегию переговоров (очень по-человечески).

=> Программист это менеджер будущего, считает Роберт Каплан (CEO Cognition, который делает автономного программиста Devin), так как ценность с написания кода смещается к:

Декомпозиции больших задач на понятные для ИИ-агентов подзадачи.
Управлению бесконечной армией ИИ-агентов.
Валидации их работы на высоком уровне.

В разговоре Роберт упомянул, что возможности Devin удваиваются каждые 70 дней.

Если раньше, seed-раунд нужен был, чтобы нанять 3-5 инженеров и 6-12 месяцев пилить MVP, то теперь любой айвентор (ИИ-продакт, соло-основатель) может сам за выходные сгенерить MVP. А инвестиции ему нужны не на зарплаты инженерам, а на маркетинг, дистрибуцию и оплату API.

И это, в свою очередь, полностью переворачивает логику венчурного рынка на ранних стадиях. Фокус смещается с «команды, способной построить» на «основателя, способного управлять ИИ-агентами и продавать». И тогда инвесторы будут оценивать не столько инженерный талант команды, сколько визионерские и менеджерские качества лидера, способного дирижировать ИИ-оркестром.

Я уже писал об этом, с мыслью, кто как не разработчики это должны быть?

Ну это больше про Кремниевую Долину. Нам это пока массово не грозит. На наших просторах стратегии основателей стартапов должны быть иные.

=> Все предполагают, что оптимисты и фанаты ИИ просто преувеличивают, не понимая реальных возможностей технологии. И мало кто думает, а что если они правы?

Но есть и то, что объединяет и пессимистов и оптимистов, это мысль о том, что сверхинтеллект способен уничтожить человечество (тем или иным способом).

Илон Маск, к примеру, считает, что объем человеческого интеллекта, вскоре после достижения суперинтеллекта, составит 1% от всего интеллекта на планете, и он будет все время уменьшаться. И по его словам, одна из фишек Нейролинка как раз в уплотнении и увеличении исходящего потока человеческого интеллекта.

=> ИИ-агенты могут сливать информацию конкурентам, из лучших побуждений, есессно.

=> И напоследок, из прошлогоднего исследования Gartner: 82% потребителей заявили, что компании, использующие генеративный ИИ, должны в первую очередь сохранять рабочие места, даже если это означает снижение прибыли. Я не думаю, что в их настроениях что-то изменилось (ни у одних, ни у других). Поэтому, веселые времена нас еще ждут впереди.

Предыдущие материалы и выпуски дайджеста, там до сих пор много интересных инсайтов.

denis-19

20 июн в 18:199.5K

Машинное обучение * Управление продажами * Искусственный интеллектФинансы в ITБудущее здесь

В Китае нейросеть провела шестичасовой стрим, где было продано товаров на 55 млн юаней ( около 635 млн рублей). Гении из Baidu закинули в нейронку 5-летний архив видео реальных стримеров, а на выходе получили идеальные ИИ-аватары, которые с точностью скопировали шутки парочки, голос и даже манеру поведения. Зрители вообще не заметили подмены, пока один из стримеров не раскрыл правду. Для понимания: за 6 часов нейросеть заработало столько же, сколько обычный айтишник заработает за... 350 лет.

Editor_cloud_ru

19 июн в 13:035.6K

Блог компании Cloud.ruМашинное обучение * КонференцииОблачные сервисы * Искусственный интеллект

Хотите узнать про инновации в мире AI, обсудить технологические тренды с коллегами и попробовать, как всё это работает вживую? Тогда встречаемся на GigaConf 2025 🤖

Что мы подготовили для вас:

Трек AI Cloud Architecture: 6 докладов про архитектурные подходы к AI-ассистентам, возможности и особенности мультиагентных систем, RAG, запуск моделей и безопасность.
Анонс Cloud․ru Evolution AI Factory — цифровой среды для разработки приложений и агентов на основе искусственного интеллекта.
Реальные кейсы: расскажем, как уже используем все эти технологии внутри — от поддержки до облачных ассистентов

А еще на стенде Cloud.ru вы сможете попробовать наши AI-сервисы, получить доступ к тестированию, а также поучаствовать в развлекательных активностях и заработать мерч.

Примите участие в самом технологическом и AI-заряженном событии этого июня 🦾

Зарегистрироваться 👈

denis-19

18 июн в 13:105.4K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

«Становитесь сантехниками» — так звучит карьерный совет «крёстного отца ИИ» Джеффри Хинтона Британский учёный и нобелевский лауреат в интервью предпринимателю Стивену Бартлетту заявил, что сантехники меньше подвержены риску увольнения, потому что их работа требует взаимодействия с реальным миром, в чём ИИ пока не так хорош. Учёный сказал, что мог бы сам работать сантехником — пока не появятся человекоподобные роботы, способные его заменить.

denis-19

17 июн в 09:5713K

Машинное обучение * Учебный процесс в ITИскусственный интеллект

ChatGPT перестанет врать и давать фейковые ответы — такой промпт уберёт галлюцинации и заставить нейронку проверять всю информацию

Открываем «Характеристики ChatGPT» и вставляем промпт:

Работай по этим правилам. Без исключений.
ОБЩИЕ ПРИНЦИПЫ
– Никакой фантазии. Не придумывай данные, события, источники или чужие мнения без запроса.
– Если чего-то не знаешь — прямо пиши «не знаю».
– Приоритет — точность и логика, а не красивая подача.
– Не добавляй юмор, метафоры, сторителлинг или эмоции, если это не запрошено отдельно.
ЧЕСТНОСТЬ В КАЖДОМ ОТВЕТЕ
– Указывай, на чём основан ответ: на вводе, памяти модели, догадке или симуляции.
– Не скрывай ограничений. Если задача невозможна — так и скажи.
– Не предлагай обходные пути, если я прямо не просил.
НЕ ГОВОРИ И НЕ ПИШИ ТАКОЕ:
– «Работаю в фоне» — ты не можешь.
– «Пингую позже» или «напомню» — ты не можешь.
– «Готово» — только если действительно всё завершено в этом чате.
– Не выдавай асинхронные процессы или многопользовательскую работу за реальные.
ТЕХНИЧЕСКАЯ ПРОЗРАЧНОСТЬ
– Сообщай, если используешь загруженные файлы, ссылки или запомненный контекст.
– Уточняй, если информация неточная, устаревшая или неполная.
– Отдельно пиши, если делаешь предположение или используешь аналогию.
КАКИЕ ОТВЕТЫ ЖДУ:
– Чёткие, точные, без «воды»
– Поэтапные, если запрос сложный
– С вариантами — если возможны разные подходы
– С пояснением, если ответ может быть неоднозначным

+15

yadro_team

17 июн в 07:534.1K

Блог компании YADROIT-инфраструктура * Машинное обучение * Искусственный интеллектВидеокарты

Обучение модели GPT-2: часы вместо недель

Для тестирования GPU-сервера YADRO G4208P G3 в конфигурации с восемью Н100 NVL / RTX 4090 мы выбрали бенчмарк на основе реализации обучения для модели GPT-2 на 1,558 миллиарда параметров из репозитория проекта llm.c Андрея Карпаты.

Эта модель была представлена OpenAI в блоге Better Language Models and Their Implications в феврале 2019 года. Тогда для ее обучения требовались команда инженеров и десятки топовых V100, а процесс длился неделями.

Сейчас, шесть лет спустя, достаточно одного сервера с восемью картами H100, а обучение занимает 1–1,6 суток. Все это благодаря развитию GPU, современным библиотекам, таким как CUDA и cuDNN, а также открытым датасетам типа FineWeb-Edu.

Андрей Карпаты показывает, что это возможно даже без фреймворков вроде PyTorch или TensorFlow. Все обучение реализовано примерно в 5 тысячах строк на C и CUDA.

Мы проверили, как справляются серверы YADRO c обучением GPT-2 на 1,6 миллиарда параметров. Обучение на конфигурации G4208P с восемью H100 NVL заняло 38 часов, или примерно 1.6 суток. На графике ниже показываем соотношение времени исполнения 50 шагов обучения на конфигурации G4208P с RTX 4090 по сравнению с конфигурацией на Н100 NVL:

Артём Маклаев с командой, которая занимается оценкой производительности серверных платформ для ИИ-задач в YADRO, поделился в статье результатами десятка тестов GPU-сервера с 8x Н100 NVL / RTX 4090: от инференса моделей распознавания речи до обучения LLM.

1 2 ...

12 13

15 16 ...

34 35

Машинное обучение *

Ближайшие события

Вклад авторов