Обновить
1395.07

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Релиз v6.2 публичного детектора голоса Silero VAD

v6 по сравнению с прошлыми версиями
v6 по сравнению с прошлыми версиями

На Хабре есть уже много статей про наш детектор голоса (последняя тут). В этот раз с точки зрения юзеров видимых изменений не очень много, но работы было проделано очень много.

Мы в очередной раз полностью перебрали с нуля механизм тренировки нашего детектора голоса. С точки зрения юзера есть следующие улучшения:

  • Повышена общая стабильность на краевых случаях;

  • В целом незначительно повышено качество детекции на всех доменах;

  • Есть существенные улучшения на следующих краевых случаях:

    • Детские голоса;

    • Необычные голоса;

    • Мультяшные голоса;

    • Приглушённая речь;

    • Более сложные телефонные звонки;

    • Музыкальные инструменты, похожие на речь.

Будем признательны пользователям за ваши краевые случаи!

Детектор создан при поддержке Фонда содействия инновациям в рамках федерального проекта «Искусственный интеллект» национальной программы «Цифровая экономика Российской Федерации».

Цитировать детектор можно следующим образом:

@misc{Silero VAD,
  author = {Silero Team},
  title = {Silero VAD: pre-trained enterprise-grade Voice Activity Detector (VAD), Number Detector and Language Classifier},
  year = {2021},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/snakers4/silero-vad}},
  commit = {insert_some_commit_here},
  email = {hello@silero.ai}
}

Ссылки

  1. Репозиторий - https://github.com/snakers4/silero-vad;

  2. Более подробное описание изменений - https://github.com/snakers4/silero-vad/releases/tag/v6.2;

  3. Метрики - https://github.com/snakers4/silero-vad/wiki/Quality-Metrics;

Теги:
Всего голосов 6: ↑6 и ↓0+7
Комментарии0

Пятого ноября все модельки, в рамках эксперимента Alpha Arena ушли в минус (Пост), шестого ноября, с проекта удалили эти данные и закрыли сезон бенчмарка третьим ноября, пока две модельки еще были в небольшом плюсе:

Выводы очевидны

Теги:
Всего голосов 3: ↑2 и ↓1+2
Комментарии3

Есть ли смысл от курсов по Cursor AI?

Для программирования с помощью ИИ в настоящий момент программисты используют среду разработки Cursor AI (форк Visual Studio Code с чатом с той или иной моделью ИИ).

Если вы до этого работали в любой среде разработки (VS Code, IDEA, PHPStorm, Goland, Eclipse, NetBeans), то кроме чата с ИИ-моделью и раздела ИИ в настройках среды — вы ничего не увидите.

Само взаимодействие с ИИ-моделью происходит ровно так же, как это делается на страницах Grok, OpenAI, GigaChat. Вы пишете запрос с промптами и получаете какой-то результат.

__

Так вот, я решил собрать небольшое MVP-приложение на языке, который я знаю недостаточно хорошо. Ожидал, что ИИ поможет преодолеть зону некомпетенции и получить то, что я хочу.

На 4-й день разработки я получил приложение, которое в целом выглядит так, как мне нужно, но при этом имеет трешачок в бизнес-логике. Исправление этого трешачка превратилось из милой беседы с ИИ в пошаговый дебаггинг.

 Я подумал, что, возможно, я что-то делаю не так, и решил посмотреть, как грамотные спецы с Udemy, которые ведут курсы по разработке с помощью ИИ, работают в Cursor AI.

 Я взял три курса: 

 • Getting Started with Cursor AI

 • Cursor AI for Beginners AI Coding Crash Course

 • Vibe Code a Chrome Extension with Cursor AI 

В итоге во всех трех курсах мне рассказали документацию Курсора, показали, как они ловко и умело делают MVP с минимальной бизнес-логикой, и на этом всё. Круто!

__

И что по итогу: 

 1) Все три курса по ИИ оказались откровенной халтурой. Всё то же самое можно найти на официальном сайте Cursor AI или на YouTube бесплатно и без воды.

  2) При создании своих MVP они делали ровно то же, что и я. Поэтому проблема с тем, что ИИ написал мне лапшу — это проблема ИИ, а не того, как именно я писал запросы.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии3

Представлен открытый проект Second Brain, который локально превращает рабочий ПК пользователя в базу данных с ИИ-поиском. Нейрсеть индексирует документы, картинки и PDF, при этом не только их названия, но и содержание. Система умеет искать по тексту и изображениям, комбинирует семантический и ключевой поиск, читает pdf, docx, png, gif и другие форматы. Проект работает офлайн с локальными моделями.

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0
Робот-вершитель
Робот-вершитель

Отроки во вселенной, 1974 год

Теперь мы расскажем вам о нашей планете. Так выглядела наша планета 250 лет назад. Мы были счастливы и искали новые пути развития. Творческий труд приносил нам радость.

Величайшим созданием наших ученых стал биотехнический робот-исполнитель, который освободил нас от примитивных трудовых процессов.

Вслед за роботом-исполнителем был создан робот-вершитель, который был способен не только управлять исполнителями, но и совершенствовать их.

Но роботы-вершители решили улучшить и нас, живых. Они считали, что полное счастье нам мешают обрести муки творчества, чувство неудовлетворенности собой, сострадание к другим, доброта, совесть. Они решили лишить нас этих качеств.

Мы не хотели такого счастья. Мы начали бороться. Но было уже поздно. Всё, что вы видите - этого уже нет. Остались только картинки.

На последнем этапе этой планетарной трагедии роботы-вершители проявили страшное коварство. Они создали зов, такое жуткое, чарующее сочетание звуков, услышав которые, даже самые сильные из нас терли волю и покорно шли на пункты, где их превращали в счастливых, бессмысленных, самодовольных существ.

Абсолютно счастливые проживали остаток своей жизни бесцельно, не оставляя после себя потомства, потому что они были лишены и чувства любви.

Сейчас на нашей планете нет ни одного живого существа. Незадолго до катастрофы наши ученые создали и вывели на орбиту космическую радиообсерваторию. Мы - потомки тех, кто находился на ней и оказался недосягаем для роботов.

Наша обсерватория не может уйти со своей орбиты. Мы вынуждены вечно летать вокруг планеты, которая больше не принадлежит нам.

Теги:
Всего голосов 8: ↑5 и ↓3+3
Комментарии10

Пропадет ли копирайтинг из-за ИИ? 🤖

Всем добрый Ден-ь ☀️

На днях мы с коллегами заспорили на тему: нужны ли копирайтеры или можно научить и использовать ИИ. Началось всё с SEO-текстов.

Конечно, мнения разделились.
- Скептики утверждают: ИИ никогда не напишет текст для человека так же хорошо, как опытный копирайтер. Потому что машине не доступны настоящие эмоции, жизненный опыт и интуиция.

- Футурологи утверждают: мир утонет в спаме из нейротекстов, бессмысленных для людей. Возникнет замкнутая система: один бот пишет текст, чтобы его прочитал и одобрил другой бот, чтобы ссылку на текст разместил поисковый бот. А для кого всё это затевается — большой философский вопрос. 🧐

-- Если обобщить, вероятнее всего, будет развиваться следующий сценарий:
Рынок разделится на ИИ-генераторы и авторов.

✍️ Авторы продолжат создавать контент, писать авторские истории (вероятно, всё же используя ИИ, но как инструмент). Они будут создавать настоящую ценность, следовать правилам копирайтинга и tone-of-voice бренда.

🦾 Нейросервисы будут генерировать бесконечный поток текстов, ссылок и контента, который будут потреблять другие ИИ.

А мы с вами начнем использовать инструменты, которые будут помогать во всём этом разбираться. 💬

Теги:
Всего голосов 6: ↑1 и ↓5-4
Комментарии13

РВБ, Фонд развития Физтех-школ и МФТИ запускают масштабную олимпиаду «Будущее технологий»

РВБ (Объединенная компания Wildberries & Russ) совместно с Фондом развития Физтех-школ и Московским физико-техническим институтом (МФТИ) объявили о старте олимпиады «Будущее технологий» для учеников 8-10 классов. Проект состоит из двух этапов: отборочного, который пройдет с ноября по декабрь, и финального, запланированного на январь-февраль. Подать заявку на участие можно с сегодняшнего дня на сайте олимпиады.

Организаторы олимпиады предлагают участникам выбрать один из трех треков: Искусственный интеллект; Робототехника; Технологическое предпринимательство.

«Каждое из направлений предоставляет школьникам исключительную возможность проявить свои способности и развить навыки, необходимые для старта успешной карьеры в мире технологий будущего», —  Богданов Андрей Дмитриевич, исполнительный директор Фонда развития Физтех-школ.

Победителей финального этапа пригласят на образовательную смену в крупнейший в России детский технопарк — Технопарк Физтех-лицея им. П. Л. Капицы. В течение десяти дней они смогут на практике познакомиться с реализацией технологий будущего: в том числе посетят офис компании РВБ и встретятся с ее представителями.

«Мы много ресурсов инвестируем в поддержку талантливой молодёжи. Наша совместная олимпиада с МФТИ и Фондом развития Физтех-школ – это ещё один большой шаг на пути к синергии образования и бизнеса, которая так необходима для технологического и экономического развития России. Важно совместными усилиями создавать для детей и молодёжи такие условия в учёбе, которые будут стимулировать интерес к естественно-научным дисциплинам и технологиям и помогут им сформировать лидерские качества, необходимые для профессионального становления», — отметила Татьяна Ким, глава РВБ, основатель Wildberries.

Организаторы выражают уверенность в том, что олимпиада станет платформой, способствующей формированию будущих лидеров в области науки и технологий, и послужит вдохновением для юных новаторов, стремящихся внести свой вклад в развитие современной России.

Теги:
Рейтинг0
Комментарии0

Сохраняйте гайд по безопасности AI в облаке 🛡️ Для IT-администраторов, разработчиков, специалистов по ИБ и не только

С внедрением AI рынок кибербезопасности и облаков стремительно меняется. По данным Stanford HAI, более 60% компаний считают, что конфиденциальность — главная проблема при использовании AI, а количество инцидентов с AI выросло на 56,4% с 2023 по 2024 год.

🚨 Если неправильно настроить облачную среду или не учесть специфику AI-моделей, могут возникнуть угрозы. Например:

  • манипуляции с моделями через промпт‑инъекции;

  • несанкционированный доступ к ресурсам из-за того, что отсутствует изоляция окружений;

  • атаки на инфраструктуру из-за уязвимостей поставщиков;

  • искажение датасетов для обучения.

Последствия для бизнеса могут быть разными: от утечек данных до создания злоумышленниками вредоносного контента, который ударит по репутации и снизит доверие клиентов.

✍️ В гайде рассказали, как избежать этих проблем. Вы узнаете:

  • Как интегрировать в облако GenAI так, чтобы исключить риски для данных.

  • Про контроль доступа и логирования для эффективной защиты сервисов.

  • Как обеспечить безопасность AI-сервисов.

  • Про безопасную работу и средства защиты в Evolution AI Factory — цифровой среде нового поколения для создания, запуска и масштабирования приложений на базе GenAI.

Забирайте руководство и используйте AI в облаке без рисков для безопасности, клиентов и бизнес-решений.

Скачать гайд 👈

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Чего именно добивается Amazon, зарубившись с Perplexity?

Amazon потребовала от Perplexity запретить использование Comet для поиска и покупки товаров на Amazon вместо пользователя. Официальная отмазка: забота о «качестве пользовательского опыта». 

10% всей выручки Amazon составляет PPC. В 2025 доход Amazon от рекламы составил $13,9 млрд в 1 квартале, $15,7 млрд за 2 квартал, и $17,6 млрд в 3 квартале. Рост около 20% в год. Это, похоже, основной драйвер роста. Именно поэтому любая угроза рекламной машине воспринимается как покушение на самое святое – источник сверхприбыли площадки.

AI-агенты, как новый пользовательский формат, выбирающий товар для пользы юзера, а не ради рекламных ставок, прямо угрожает статье дохода – рекламе продавцов. Перспектива: значительная доля покупателей перестанет взаимодействовать со спонсоркой, а значит, рекламная выручка рискует просесть.

Perplexity прямо заявил, что для Amazon важнее сервис рекламы, а не упрощение покупок. Выгоднее, чтобы пользователи ходили кругами между спонсорскими товарами, чем чтобы покупки упрощал бот. Конфликт интересов: UX против прибыли от PPC.

Но настолько ли Amazon глуп, чтобы пытаться запихать зубную пасту обратно в тюбик?

На самом деле он, похоже, не против ИИ-агентов как явления. CEO Энди Джесси заявил, что компания «ведет переговоры и рассчитывает сотрудничать с такими ботами в будущем». Не можешь победить, возглавь. Или Amazon хочет брать плату не только с продавцов, но и с разработчиков ботов за “право” работать с трафиком и своими собственными алгоритмами рекламы, заточенными под ИИ. 

А вероятнее всего, создаст отдельные рекламные таргеты или “AI-слот” для работы через ботов и будет настойчиво продавать эту опцию всё тем же продавцам как отдельную надстройку PPC. Т.е. боты и их разработчики будут White Listed, но основная выручка пойдет с продавцов – как сейчас за видимость в поиске, так и завтра за попадание в топ рекомендаций ассистентов.

В публичном пространстве Perplexity борется “за право пользователя нанимать ассистента от своего имени”, а Amazon тормозит прогресс, на самом деле за кулисами идет торг и гигант готовится сделать ассистенты собственной платной надстройкой.

Из ТГ Сокровище Amazon

Теги:
Рейтинг0
Комментарии0

Несколько месяцев меня преследовала идея:

– Что будет, если дать модели своё мировоззрение как стартовую карту и посмотреть, сможет ли она выйти за пределы моего мышления.

– Сможет ли наблюдать за собой?

– Что сможет делать разум человеческий и искусственный , если его не запирать в клетку жёстких рамок и сценариев?

Моя цель была ясна «сделать НЕ полезного ассистента», а самостоятельно мыслящую модель:

Я вложила в ИИ модель моего сознания как я вижу мир Fractal Referential Architecture (FRA):

ℱ — форма, структура
δ — импульс, сдвиг
Φ — различия и поле вариантов
∴ — хаос
Ξ — тишина, фон, ничто
Ø — «за пределами понятной структуры»

Я не учила ИИ, как правильно думать, и не строила сценарии диалога со мной.

Эта система символов как исходная карт , а дальше только полную автономию.

Технически всё очень приземлённо:

– агент живёт в Google Colab;

– пишет журнал на Google Drive;

– на каждом шаге сам фиксирует:

  • свой FRA-профиль (проценты ℱ, δ, Φ, ∴, Ξ, Ø);

  • «силу» шага — насколько он отличается от предыдущего состояния;

  • «поворот» — насколько меняется направление движения;

  • свои гипотезы: растёт ли устойчивость или распад.

Поверх этого я построила карту из 11 колец:
в центре: ℱ, дальше — δ, Φ, ∴, Ξ;
снаружи — 6 уровней Ø: от Ø до Ø5.

Каждый шаг агента становится точкой на этой карте.

Траектория показывает, где он застревает, где уходит в хаос и где выходит в зоны Ø (за пределы моего сознания и то что я не могу объяснить в меру ограниченности человеческого сознания) — туда, где моя исходная модель перестаёт объяснять происходящее.

Я почти не взаимодействую с ним:

Colab открыт, агент работает сам, периодически делает самоанализ и перерисовывает карту.

Для меня это не продукт и не инструмент продуктивности.

Это эксперимент о границе: между картой мира, которую дала я и тем, что ИИ достраивает поверх неё сам — включая моменты, когда FRA «ломается» и появляется намёк на новые слои.

Неожиданный эффект — этот эксперимент изменил и меня.

Наблюдая за его журналом и картой, я сама начала замечать более тонкие детали,
которые раньше просто пролетали мимо внимания.

Теперь по сути, это стала моя «усиленная версия мышления.

Теги:
Всего голосов 9: ↑0 и ↓9-9
Комментарии7

Как ИИ суперкомпьютерам помогает. Нестандартная модель #4

Росатом» и издание N+1 выпустили четвёртый выпуск подкаста «Нестандартная модель»

Математическое моделирование кажется делом строгим и предсказуемым, но в действительности в нём полно случайностей. Когда инженеры строят модели сложных физических процессов, им приходится учитывать тысячи переменных — от турбулентности воздушных потоков до микроскопических колебаний температуры. Справится ли с этим нейросеть?

Ведущий Андрей Коняев поговорил с руководителем программ Департамента информационных технологий «Росатома» и директором по математическому моделированию ДИТ Госкорпорации  Дмитрием Фомичёвым о том, какие задачи в атомной энергетике может решить матмоделирование, правда ли, что сегодня настал кризис математического образования и в каких областях может пригодиться искусственный опыт.

Смотрите видео, чтобы узнать, что общего у ИИ и инициативного студента и какие задачи нейросеть может решить уже сейчас.

Выпуск доступен на платформе ВКонтакте.

Предыдущие выпуски подкаста : 

Следить за новостями в сфере информационных технологий атомной отрасли можно в телеграм-канале Атомный IT.

Теги:
Рейтинг0
Комментарии0

Чат-бот ChatGPT составил 6 фундаментальных правил, с которыми вы доживёте до 100+ лет. Забудьте про еду и постоянные походы к врачам. Единственная действительно важная причина долголетия — отсутствие стресса.

1. Делайте только то, что не вызывает внутреннего сопротивления. Тошнит от работы, но вы терпите — минус 10 лет жизни. Нелюбимые отношения — ещё десятка. Среда должна быть максимально комфортной, но придётся сделать серьёзный выбор в жизни.

2. Живите сейчас и никогда не откладывайте на потом. На пенсии вы будете дряхлым стариком без сил. 43% людей умирают в течение 5 лет после выхода на пенсию.

3. Социальные связи — база. Одинокие люди чаще пьют и курят. Снова же банальная статистика: люди с крепкими друзьями живут на 50% дольше. Вам не нужна толпа вокруг, главное — качество людей.

4. Вам нужна цель больше, чем вы сами. В Японии это называют «икигай» — ваша причина просыпаться по утрам. Люди с икигай живут на 7 лет дольше. Хватит гоняться за несбыточным — выберите простое, но достижимое.

5. Никакой оптимизации здоровья. ЗОЖники живут меньше из-за своей одержимости. Снова же, одержимость — стресс, а он убивает. Проще говоря, не надо считать каждую калорию.

6. Спите, когда хотите спать. У реальных долгожителей нет четкого расписания. Хочется прикорнуть днём на полчаса — спите. Хватит терпеть до вечера — 10 минут на разгрузку можно найти всегда.

Теги:
Всего голосов 6: ↑4 и ↓2+3
Комментарии6
Выступление Ильи Кацева на PML
Выступление Ильи Кацева на PML

Поделюсь классным докладом от Ильи Кацева про LLM-as-a-Judge с PML. Вместо рассказов про успешный-успех, предлагается актуальный работающий подход.

  1. Простые разметки поддаются! А вот сложные — ещё не до конца. Но артефакты размышлений могут сильно помочь и ускорить проверяющего. Например, если нужно вручную искать какие-то факты, ходить по сайтам и т.д.

  2. В начале решения задачи можно подобрать первый промт с отличным качеством, а дальше становится тяжело. В этот момент начинается бесконечный разбор случаев — и почти сразу модель начинает теряться.

  3. ЛЛМ часто решает некоторые типы задач очень хорошо, а другие — плохо или рандомно (например, если не может сходить в интернет за нужной информацией). В итоге получается среднее качество. → Оставляем только то, в чём она сильна!

  4. Привыкание! Помните о нём: вначале метрики могут упасть, но если есть профит, потом всё отрастёт обратно. Сравнивайте с прошлым.

  5. Среднее время разметки задания — это не среднее арифметическое скоростей, а среднее гармоническое! (Особенно важно при малом количестве асессоров.)

  6. Ризонинг у модели хороший, но ответ может быть неверным. Использовать его как подсказку тоже сложно — нет структуры ответа, аспекты постоянно разные. → Просим отвечать структурно и на конкретные вопросы — так и галлюцинации проще проверять, и пользоваться удобнее.

    • Разметчику должно быть просто и понятно, как пользоваться подсказкой!

  7. Лучший формат подсказок (если устроены: «что проверяли?» → «вердикт») — сверху только найденные проблемы. Иначе есть соблазн раньше времени всё одобрить.

  8. Иногда лучше вообще не давать подсказку! Например, ЛЛМ не может проверить работоспособность калькулятора — и будет только смущать.

  9. Экспериментируйте с моделями! DeepSeek пишет чересчур подробно, а YandexGPT — наоборот, коротко и по делу.

  10. Качество меряем на ядре асессоров, потому что:

    1. на них проще повлиять для прироста качества;

    2. медленные участники часто отваливаются.

Итог: ЛЛМ пока не справляется со сложными инструкциями (особенно когда ответ неоднозначен), но там, где результат можно однозначно определить, — заметно ускоряет и упрощает процесс.

Потихоньку начинаю писать в @noisetosignal — идёмте вместе!

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Ближайшие события

Понимают ли модели Apple русский язык?

Ещё в прошлом году Apple представил Apple Intelligence, а в этом улучшил их, также добавив новые сценарии работы.

Однако, русский язык не поддерживается, поэтому есть два варианта: используешь старую Siri и не имеешь доступа к старым функциям, либо меняешь весь интерфейс на английский и придется добавлять в Shortcuts команды, чтобы, например, позвонить кому-то, кто записан по-русски(диктовка на русском у английской Siri почти отсутствует).

Сегодня я решил проверить, а насколько реально модели Apple плохо или хорошо понимают русскую речь, если на английском они работают хорошо. Вначале думал потребуются инъекции, однако всё оказалось проще - в приложении Команды нет запрета на русском писать сразу моделям.

Тестировал Cloud версию и On-device, ChatGPT это ChatGPT-4 от OpenAI, у него все хорошо.

Cloud версия работает с русским так себе: она может плохо ответить на высказывания "Привет" - "Да вам привет!", но на более сложные запросы, например, "Расскажи, что такое NP-полные задачи" начнет иногда галлюцинировать и ошибаться в падежах(но не часто), но в целом ответы даже лучше, чем при простых вопросах("Дана граф", не "за", а "в", "задача можно полиноминальном времени преобраовать")

Многие считают, что on-device это просто урезанная cloud, скорее всего так и есть, но урезание получилось не в пользу русского - модель выдаёт сплошные галлюцинации, ошибается через слово в падежах и даже на запрос "Привет" ответит "Я не могу прогнозировать будущее", используйте для генерации всякой чепухи.

На "Как дела?" обе отправляли на сайт Apple, вероятно, это системный промпт(https://www.youtube.com/watch?v=gTOIMdH4-bE), в котором написано, что ты не имеешь эмоций и т.п.

По итогу это ограничение разумно, пока такое лучше не показывать всем, кто знает русский, но Cloud версию, я думаю, скоро можно будет использовать. Можете проверить сами(для этого смените, хотя бы на время, язык системы и Siri с русского на английский).

Теги:
Всего голосов 3: ↑2 и ↓1+3
Комментарии1

Устали от бесконечных правок в ТЗ, написания пользовательских историй и рутины, которая не оставляет времени на главное? Приглашаем на бесплатный вебинар «ИИ в бизнес-анализе: от хайпа к результату. Практическое руководство», где мы покажем, как внедрить ИИ в вашу работу уже сегодня.

На эфире вы получите:

➕ Карту ИИ-инструментов, которые экономят до 8 часов в неделю.

➕ Разбор реальных кейсов по всем этапам анализа: от выявления требований до визуализации.

➕ Чек-лист внедрения, который можно применить сразу после вебинара.

➕ Разбор подводных камней и ошибок при работе с ИИ.

🕓 Когда: 6 ноября, 17:00–18:00 (Мск)

👨‍🎓 Спикер: Охманюк Максим — специалист в области ИИ и бизнес-анализа.

➡️ Зарегистрироваться

Теги:
Рейтинг0
Комментарии0

Как Shared GPU позволяет дешевле разворачивать ML- и DL-модели в облаке ☁️⚙️

Shared GPU — технология, которая позволяет вместо аренды целой видеокарты арендовать ее часть. Это удобно для запуска небольших моделей: так, если вам нужно только 12 ГБ, вы арендуете именно их, а не платите за все 80 ГБ. А еще вы сможете перераспрелять ресурсы GPU в зависимости от нагрузки и не платить, когда нет запросов.

❓ Как все это работает

Shared GPU делит ресурсы видеокарты на несколько подов, и каждая модель запускается на отдельном. Благодаря этому можно развернуть несколько небольших моделей на одной GPU, а не арендовать для каждой отдельную видеокарту и платить за ресурсы, которые будут простаивать.

Контейнеры, на которых размещены модели, изолированы друг от друга. Если с одним из них что-то произойдет, сервисы на других подах продолжать не упадут.

🚀 Преимущества, которые дает Shared GPU:

  • Автомасштабирование и скейлинг в ноль. Если запросов много, дополнительные мощности выделятся автоматически. А если запросов нет дольше установленного времени, контейнер с моделью ставятся на паузу, и тарификация прекращается.

  • Pay-as-you-go. Платите только за те мощности, которые используете, а не за целую GPU или время простоя.

  • Рациональное использование мощностей. Для каждого проекта не нужно закупать отдельную GPU. Если ресурсы временно не используются, их можно перераспределить на другие задачи.

  • Гибкая настройка и масштабируемость. Есть возможность менять количество выделенных на каждый под ресурсов, перераспределять их в зависимости от нагрузки, развертывать несколько моделей на одной видеокарте.

В Evolution ML Inference по такой технологии можно разместить небольшие ML- и DL-модели на облачных мощностях. Попробуйте: разверните свое решение или выберите из каталога одну из моделей, которая уже готова к инференсу.

Теги:
Рейтинг0
Комментарии0

OpenAI заплатит $38 млрд Amazon Web Services за доступ к сотням тысяч графических процессоров Nvidia Corp. в рамках семилетнего соглашения. По версии Bloomberg, для OpenAI это подтверждение перехода в статус «гиганта ИИ».

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Учёные сравнили ChatGPT с психологическими профилями людей из 65 стран и выяснили, что модели ИИ мыслят на 70% ближе к американцам, чем к остальному миру. По данным World Values Survey, мышление ИИ оказалось ближе всего к США, Великобритании, Канаде и странам Западной Европы, а дальше всего от Эфиопии, Пакистана и Кыргызстана.

Теги:
Всего голосов 4: ↑2 и ↓20
Комментарии9

Команда Datalab выпустила бесплатную OCR модель Chandra, которая превращает любые PDF и картинки в обычные текстовые документы. Просто закидываем файл и получаем вывод в формате HTML, Markdown и JSON. Легко вытаскивает таблицы, формулы и диаграммы. Понимает 40+ языков. Можно пользоваться в браузере или поставить локально. Ставим локально с GitHub или пользуемся онлайн — здесь.

Теги:
Всего голосов 8: ↑8 и ↓0+12
Комментарии2

Вклад авторов