Как стать автором
Поиск
Написать публикацию
Обновить
1355.51

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

Подробная шпаргалка по промптам для DeepSeek с универсальной схемой, по которой китайский ИИ выдаст наилучшие ответы.

Маркетинг, кодинг, тексты, коучинг, психология — просто впишите в нейронку нужную вам роль и выбирайте любую задачу.

Например: copy Act as [Marketer] and create a [detailed plan for the brand improvement and promotion]. Show it as a [list]

Теги:
Всего голосов 4: ↑3 и ↓1+2
Комментарии0

От языковых моделей к моделям мира

Большие языковые модели (LLMs) впечатляют умением работать с текстом, но они не имеют реального понятия о трёхмерном мире, физике и логике пространства. Модели мира (World Models) обещают сделать шаг вперед от текстового понимания к пониманию среды, наделяя ИИ способностью «видеть», «чувствовать» и «предсказывать» поведение объектов и агентов.

Если языковые модели генерируют последовательности слов, то модели мира стремятся к глубинному моделированию реальности. Они берут визуальные, аудио- и прочие сенсорные данные (включая данные от камер, IoT-сенсоров, микрофонов), чтобы создать внутреннюю симуляцию мира: с физическими законами, динамикой движения, взаимодействиями объектов, NPC и людей. 

Одним из примеров таких систем стала Genie 2 — фундаментальная модель мира, способная на основе одного изображения создать интерактивное 3D-пространство, в котором можно управлять персонажем и выполнять различные действия. Genie 2 — авторегрессионная диффузионная модель, предсказывающая каждый следующий «кадр состояния» так же, как LLM предсказывает следующий токен. Но в отличие от чисто текстовых моделей, Genie 2 учитывает физику и трехмерность, позволяя агентам взаимодействовать со сценой. Это не просто генерация пикселей, а предсказание будущих состояний среды исходя из действий.

Другой пример - Sora от OpenAI, генерирующая до минуты реалистичного видео, моделируя динамику сцены, перспективу, свет, тени и взаимодействия с объектами. Подобно тому как языковые модели пользуются текстовыми токенами, модели мира работают с «патчами» — фрагментами визуальной информации. Sora сжимает входное видео в латентное пространство и разрезает его на патчи, которые затем обрабатываются трансформером.

Genie 2 и Sora способны «запоминать» объекты, моделировать эффекты гравитации и инерции, а также обеспечивать длительную согласованность сцен. В созданных ими виртуальных мирах персонажи стараются не терять форму, предметы не телепортироваться без причины — всё выглядит логичным и правдоподобным. 

Помимо генерации видео, Sora может симулировать поведение внутри игры Minecraft, включая управление агентом. А Genie 2 позволяет создавать бесконечно разнообразные игровые миры, где поведение объектов и персонажей не задано вручную, а выучено моделью. Агенту можно дать задание и наблюдать, как он осваивает новые навыки, решает задачи и самостоятельно адаптируется к непредсказуемым условиям.

Все это ведет к тому, что роботы на базе моделей мира смогут лучше понимать пространство, предсказывать последствия своих действий и безопаснее взаимодействовать с реальным окружением.

Однако перед нами встают более глубокие вопросы: как интерпретировать решения агентов на базе моделей мира, как избежать опасных сценариев, если модель «догадается» нарушить правила? Такие случаи пока редки и напоминают курьёзы, но уже показывают, что серьезная работа над безопасностью только начинается

Конечно, обучение на огромных видеодатасетах требует колоссальных вычислительных мощностей, куда больше, чем для LLM. Также для обучения нужно много разнообразных данных. Но результат того стоит, ведь одно из перспективных направлений применения моделей мира - симуляция физических законов для развития науки и технологий. Например, использование химических элементов как «слов» в моделях мира позволяет ИИ предсказывать новые материалы или лекарства.

Модели мира — это переход от «умных слов» к «умным действиям» и пониманию пространства. Мы подходим к эпохе, когда ИИ будет предсказывать физические процессы, понимать причинно-следственные связи и даже проявлять «здравый смысл». Хотя модели мира только начали развиваться, но именно они способны заложить фундамент для ИИ, который будет не просто приятным собеседником в чате, а полноценным субъектом в нашем сложном реальном мире.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

В 2024 году мировой агротех-рынок достиг $18,99 млрд, а к 2033 году он вырастет до $92,26 млрд, прогнозируют в Astute Analytica. Среднегодовой темп роста составит 19,2%.

Агротехнологические платформы преобразуют мировое сельское хозяйство, интегрируя передовые цифровые инструменты с традиционными методами ведения сельского хозяйства. Компании‑новаторы используют передовые сенсорные технологии, искусственный интеллект и IoT, чтобы предлагать точные решения по управлению растениеводством, мониторингу влажности почвы в режиме реального времени, динамическому обнаружению вредителей и адаптивному планированию орошения.

Сейчас крупнейшим рынком для агротеха аналитики называют Северную Америку с долей в 56,1%. Однако самым быстрорастущим они считают Азиатско-Тихоокеанский регион, особенно Китай и Индию. Одним из факторов быстрого роста они называют господдержку при внедрении устойчивых методов ведения сельского хозяйства. В США и Канаде 52% опрошенных основным препятствием для внедрения технологий на фермах называют высокие первоначальные затраты препятствием, а 40% — неясную рентабельность инвестиций.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты в новом обучающем трёхчасовом видео рассказал всю базу про нейросети, включая:

  • претрейнинг: как работает архитектура трансформер, из чего состоит и что такое токены;

  • файнтюнинг: психология LLM, галлюцинации, исправление ошибок в орфографии и прочие детали;

  • обучение с подкреплением: как нейросеть учится на обратной связи и улучшает ответы;

  • последние 10 минут видео — краткая выжимка лекции.

В рамках своей деятельности Карпаты активно занимается записью обучающих видеороликов на YouTube по созданию нейросетей, с пошаговыми инструкциями и выкладывает исходные коды на GitHub по различным проектам, связанным с машинным обучением и развитием нейросетей, включая проект nanoGPT для обучения/настройки GPT среднего размера.

В феврале 2024 года Карпаты выпустил лекцию на Youtube под названием Let's build the GPT Tokenizer. Это двухчасовая понятная и доступная лекция о токенах и токенизации в ChatGPT и других нейросетях. В видео Карпаты буквально на пальцах показывает, как именно нейросеть GPT читает текст, как дробит его на единицы и что в нём выделяет. Учебный материал поможет начинающим пользователям углубиться в изучение нейросетей, а также лучше понимать их устройство. Сопроводительный материал к этой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

Теги:
Всего голосов 6: ↑5 и ↓1+5
Комментарии1

В Германии доступен способ общения с ChatGPT по факсу. Пользователю нужно отправить запрос на бумаге на специальный номер, а ИИ пришлёт факс в ответ.

Номер для связи:0531-490590019.

Теги:
Всего голосов 6: ↑6 и ↓0+9
Комментарии0

Большие популяционные модели (LPM): как ИИ симулирует социальное поведение?

В знаменитой серии «Основание» Айзека Азимова математик Хари Сэлдон создает «психоисторию» — науку, способную предсказывать будущее человечества на основе законов массового поведения. Хотя это художественная выдумка, идея отражает глубокую истину: чтобы формировать наше общее будущее, нам необходимо понимать коллективное человеческое поведение.

Сегодня мы стоим на пороге революции в изучении общества. Большие популяционные модели (Large Population Models, LPMs) предлагают нам постоянно обновляющийся портрет человечества, который отражает сложные взаимодействия миллионов отдельных людей.

Большие языковые модели (LLMs) уже продемонстрировали способность генерировать связный текст, предсказывая следующее слово (токен) в предложении. LPMs берут эту концепцию, но вместо предсказания следующего слова, они предсказывают неизвестные атрибуты людей на основе известных данных. Это позволяет моделировать поведение целых обществ, заполняя пробелы в данных и создавая более полную картину человеческого взаимодействия.

Например, если мы знаем возраст, пол и место жительства человека, модель может предсказать его уровень дохода, образование или поведенческие привычки.

Потенциальные области применения больших популяционных моделей обширны:

- Здравоохранение: В период пандемии LPMs могут помочь моделировать распространение заболеваний, основываясь на передвижениях и контактах людей;

- Социальные исследования: Предупреждение о возможных социальных волнениях или гуманитарных кризисах путем анализа настроений и поведения больших групп людей;

- Экономика: Правительства и корпорации могут использовать модели для прогнозирования экономических тенденций и адаптации политик в соответствии с динамикой местных экономик.

Недавно ученые разработали модель под названием «Кентавр». Эта модель способна предсказывать и симулировать человеческое поведение в различных экспериментах, выраженных на естественном языке. Центавр создан путем дообучения Llama 3.1 70B методом QLoRA на уникальном наборе данных Psych-101. Этот набор данных охватывает более 60 000 участников, совершивших более 10 миллионов выборов в 160 различных экспериментах. 

Интересно, что дообучение модели также улучшает согласованность внутренних представлений Кентавра с нейронной активностью человека. Это означает, что модель не только предсказывает поведение, но и демонстрирует внутренние процессы, схожие с теми, что происходят в человеческом мозге. Это не просто шаг вперед в когнитивных науках, но и пример того, как большие модели могут помочь нам понять сложность человеческого поведения.

Сегодня в сфере маркетинговых исследований появляются так называемые синтетические респонденты — искусственные персоны для имитации человеческих ответов. Они могут использоваться для быстрой оценки новых продуктов или идей без необходимости проведения масштабных опросов.

AgentTorch - открытая платформа для создания и запуска масштабных симуляций популяций с использованием больших популяционных моделей. Долгосрочная цель платформы — «переизобрести перепись населения», создав полностью симулированную, но точно отражающую реальное население систему. 

LPMs предлагают нам инструменты для более глубокого понимания общества для принятия обоснованных решений. С такой мощной технологией приходит и большая ответственность. Важно обеспечить, чтобы использование LPMs было этичным и уважало конфиденциальность людей. Цель должна быть не в том, чтобы манипулировать обществом, а в том, чтобы лучше его понимать и принимать обоснованные решения. Будущее не предопределено, поэтому с помощью LPMs у нас есть возможность формировать его в лучшую сторону, используя знания для общего блага и прогресса всего человечества.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0
Сгенерировал в ИИшке
Сгенерировал в ИИшке

США ТРАТИТ В 100 РАЗ БОЛЬШЕ НА ИИ ЦОДЫ, ЧЕМ РОССИЯ

🔥Мир стоит на пороге новой эры искусственного интеллекта, и Америка не просто намерена участвовать в этой гонке — она стремится занять лидирующие позиции.Компании OpenAI, Oracle и SoftBank запускают амбициозный проект Stargate, который предполагает создание сверхмощных дата-центров и суперкомпьютеров, способных изменить правила игры в области ИИ, подержанный Трампом, привлечет инвестиции в размере ПОЛУТРИЛЛИОНА ДОЛЛАРОВ — сумма, сопоставимая с ВВП Израиля или Египта. Участники проекта готовы выделить 100 миллиардов уже на начальном этапе, оставшиеся 400 миллиардов будут инвестированы в течение следующих четырех лет. При этом SoftBank берет на себя финансовую ответственность, а OpenAI операционную. По информации с сайта OpenAI, строительство объектов уже началось, первая площадка создается в Техасе. Кроме того, компания активно ищет и оценивает потенциальные площадки по всей стране для организации новых ИИ-кампусов. После полного запуска потребляемая мощность всех комплексов составит около 5 ГВт, что сопоставимо с 83,3 миллионам обычных лампочек, работающих одновременно.

😥От этой новости голова идет кругом, когда сравниваешь такие инвестиции с российскими. Но стоит упомянуть, что США может себе ПОКА позволить напечатать эти зеленые бумажки, так как еще является резервной валютой, а вот России необходимо быть аккуратнее с инвестициями, чтобы не создать дисбаланс во всех отраслях - жаль, что мы не можем печатать, как в США... Помимо этого, не нужно забывать про количество населения в Америке чуть более 300 миллионов, а в России чуть более 140 миллионов - а это сказывается на количестве потребления и покупательской способности.

Недавно я писал пост, почему потребление ИИ увеличиться, а не уменьшится.

🇷🇺В России расклад такой, в перспективе ближайших 5 лет в отрасли «ЦОДы и Дата-центры» будут проинвестированы 120 проектов на сумму 596,4 млрд рублей. Это крупные дата-центры (от 500 стойко-мест), не считая, маленьких периферийных ЦОДов, в которые также активно инвестируют компании. Чуть-чуть отвлекся, теперь назову самых крупных инвесторов в традиционные дата-центры: Сбер (142 млрд), ЕвросибЭнерго (120 млрд), Датапро (50 млрд), Газпром (41 млрд) и Тензор (30 млрд). 

❗️НО, мы планируем стать технологическим лидером в БПЛА (после заявлений нашего президента), а это поможет нам более быстрее исполнять разного рода задачи на ШИРОКИХ просторах матушки России и возможно сделать прорыв в экспорте, помимо нефти и газа.

Как вы считаете, сможет ли Россия быть технологическим лидером в общей гонке технологий? Жду ваших прогнозов в комментариях. Пишу об инновациях и взрывных новостях в технологическом секторе в своем тг-канале.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Будущее сельского хозяйства тесно связано с технологическими достижениями, в отчёте Agritecture Consulting и CEAg World выделили 5 факторов, подчёркивающих растущую роль технологий в агроотрасли.

Улучшение качества и урожайности культур — главное, чего ждут от новых технологий. Улучшение урожайности, даже на уровне 5%, может существенно повлиять на финансовые модели фермеров. Производители придают большое значение использованию технологий для повышения как качества, так и количества своих культур. Современные системы, такие как инструменты точного земледелия, климат-контроль и оптимизированное орошение, помогают максимизировать производство и обеспечивать высокое качество продукции.

Упрощение операций для повышения эффективности. Автоматизация, ИИ и робототехника снижают ручной труд и улучшают рабочие процессы. Для агроотрасли это  минимизация операционных затрат.

Снижение затрат на рабочую силу. Рабочая сила является значительной статьей расходов в сельском хозяйстве, и многие производители ищут технологии для снижения зависимости от человеческого труда. Автоматизация и робототехника рассматриваются как ключевые факторы для сокращения этих затрат при сохранении производительности.

Принятие решений на основе данных. Умение собирать и анализировать данные для более обоснованного принятия решения имеет важное значение для современного сельского хозяйства. Технологии, такие как датчики, IoT и ИИ, предоставляют информацию в реальном времени, помогая производителям оптимизировать свои операции и вносить коррективы на основе данных.

Поддержка устойчивых практик. Многие производители рассматривают технологии как способ достижения большей устойчивости через более эффективное использование воды и энергии или через снижение отходов и выбросов. Сельское хозяйство стремится сбалансировать продуктивность с экологической ответственностью.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Большие поведенческие модели (LBM): новый этап в развитии ИИ

Представьте робота, который изучает, как вы готовите еду, и с каждым приготовленным вами блюдом он сам становится всё более искусным поваром. Разбираемся, как большие поведенческие модели (LBM) помогут роботу в этом деле.

Несмотря на впечатляющие достижения больших языковых моделей (LLM) в обработке и генерации текста, они не умеют обрабатывать изображения или сенсорные данные, необходимые роботу для ориентации в физическом пространстве, “понимания” объектов и обучения действиям пользователя. Так Visual Language Models (VLM), обрабатывающие визуальные данные, могут “понимать” содержимое изображений и отвечать на вопросы по изображениям.

Large Action Models (LAM) обучены на данных о действиях (в том числе из сенсоров). LAM превращают LLM в автономных агентов, способных выполнять комплексные задачи, ориентированные на вызов определённых функций, улучшенное понимание и планирование.Salesforce уже начали выпускать такие модели для автоматизации процессов.

Visual Language Action Models (VLA) обучены на визуальных данных и данных о действиях. Они дают LLM возможность быть “воплощённым” агентом (Embodied Agent) в физическом мире. Например, RT-2 демонстрирует способность робота выполнять сложные команды благодаря использованию цепочки рассуждений. PaLM-E — мультимодальная языковая модель с 562 миллиардами параметров, демонстрирующая высокую универсальность и эффективность. А OpenVLA — открытая модель с 7 миллиардами параметров поддерживает управление несколькими роботами одновременно.

Для обучения агентов применяется обучение с подкреплением. Существуют различные RL-методы, но в целом обучение агента построено на политике вознаграждений и наказаний за совершение определённых действий. Среди RL-методов также есть обучение с подкреплением на основе обратной связи от пользователя.

Комплексно задачу по обучению роботов действиям человека решают LBM (Large Behavior Models) — большие мультимодальные поведенческие модели, представляющие новое направление в ИИ. LBM направлены на понимание, моделирование, адаптивное обучение и генерацию человеческого поведения в физическом мире (похоже на RLHF на основе данных из физического мира).

Большие поведенческие модели уже используются на практике:

1. В Lirio разработали первую в мире LBM для здравоохранения. Их модель создаёт гиперперсонализированные рекомендации для пациентов на основе медицинских данных и данных о поведении пациента от различных датчиков.

2. Toyota Research Institute совершил прорыв в обучении роботов новым сложным навыкам с помощью метода Diffusion Policy. Их роботы могут быстро осваивать новые действия, такие как наливание жидкостей или использование инструментов, без необходимости перепрограммирования.

3. Стартап Physical Intelligence привлёк $400 миллионов инвестиций от Джеффа Безоса, OpenAI и других крупных игроков. Они стремятся создать роботов, которые смогут выполнять любые задачи по запросу пользователя, будь то уборка, сборка мебели или обслуживание клиентов.

Однако, как отмечал философ Людвиг Витгенштейн в своём "Логико-философском трактате": "Границы моего языка означают границы моего мира". Это актуально для LBM, так как они всё ещё ограничены данными, на которых обучены. Их "мир" определяется теми модальностями, что они могут воспринимать через сенсоры и понимать с помощью алгоритмов.

Для обучения качественной поведенческой модели нужно больше датчиков для сбора данных из различных модальностей. Так данные электроэнцефалографа позволили бы лучше распознавать и имитировать эмоции. А обучение моделей с помощью синтетических данных из симуляций делает "картину мира" LBM более разнообразной.

В реальном мире мы пока можем отличить робота от человека. Но возникает вопрос: а как мы будем отличать человеческое поведение от ИИ в цифровом мире?

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии5

У китайской компании ByteDance был случай. Их стажёр на что-то обиделся и решил саботировать работу: он внедрял зловреды в модели машинного обучения и подменял её чекпоинты. В итоге вся команда два месяца, вместо того, чтобы работать, пыталась понять, что же происходит? Стажёры, не надо так!

А это стажёр сделал вещи, которые заметны. А что если кто-то будет делать то, что незаметно по логам или по метрикам? Например, в модель встроит триггеры и изменит в целом смысл продукта.

Тут вновь встаёт вопрос доверия к искусственному интеллекту и его аудиту.

Что нужно делать, чтобы доверять моделям ML?

  • так обучать модели, чтобы они были устойчивы к разному классу атак (состязательный шум, состязательные патчи и так далее);

  • проверять наборы данных на закладки, аномалии; проводить очистку данных;

  • проверять модели на закладки, проводить очистку;

  • повышать интерпретируемость моделей;

  • защищать модели на основе пред- и постобработки;

  • противодействовать краже, инверсии моделей, определению принадлежности;

  • проводить постоянный мониторинг.

Доверенной может называться только та система, которая разрабатывалась на платформе с правильной методологией разработки и которая контролирует процесс.

А вот признаки, что этой ML-платформе можно доверять:

  • правильная методология разработки в ML;

  • много переиспользуемых инструментов обеспечения доверия;

  • автоматизация и прозрачность использования инструментов обеспечения доверия;

  • интеграция со всеми этапами жизненного цикла модели машинного обучения:

  • появились новые угрозы — появились новые инструменты борьбы.

Пост написан по мотивам доклада Максима Рындина «Роль ПО автоматизации процессов для обеспечения доверия в машинном обучении». Он представил его на V встрече экспертного сообщества по криптографии и большим данным, которую организовал «Криптонит» при поддержке Музея криптографии. Дискуссия была посвящена теме аудита безопасности систем ИИ.

Смотрите запись встречи
📺 на Rutube
📺 в VK видео

Теги:
Всего голосов 4: ↑2 и ↓20
Комментарии0

12 перспективных российских стартапов в области AI по версии RB Choice.

Metamentor — разработчик корпоративных решений на базе генеративного искусственного интеллекта. Проект проводит анализ внутренних документов и регламентов клиента, после чего собирает всю полученную информацию в боте-ассистенте. Это помогает бизнесу настроить внутренние и внешние процессы, упростить онбординг сотрудников, выделить сильные и слабые стороны работы отделов и собрать умную базу данных.

Anix — стартап работает над созданием нейросети для мультипликаторов, которая рисует кадры для анимации быстрее и дешевле человека. Таким образом, у работников освобождается время для творческого процесса вместо рутинной работы.

SalesAI — компания занимается разработкой собственной нейросети, которая интегрируется в CRM-системы и занимается оценкой качества звонков. Продукт нацелен на повышение качества работы менеджеров в малом и среднем бизнесе.

Fabula AI — мультиплатформенное приложение для создания и редактирования изображений на основе искусственного интеллекта при помощи десяти различных онлайн-инструментов. 

НейроХудожник — стартап Университета Иннополис, разрабатывающий нейросеть для генерации изображений с удобным интерфейсом. Для создания картинки достаточно ввести одно слово в поле для описания, после чего сервис сам определит детали объекта и другие параметры. Также в «НейроХудожнике» есть полноценный конструктор ИИ-моделей на основе Stable Diffusion и Kandinsky. 

Dialext — сервис подключается к CRM и проводит аудит телефонных переговоров. При помощи ИИ — языковых моделей и сетей-трансформеров — он определяет, насколько речь менеджера соответствует установленному компанией сценарию разговора.

mymeet.ai — стартап по разработке ассистента для онлайн-встреч. Это нейросеть, которая транскрибирует звонки и собирает на их основе краткую выжимку из всего, что было озвучено на встрече. Кроме того, ассистент помогает назначать задачи всем присутствующим на созвоне. 

JetHub — компания работает над программой, которая помогает разработчикам и инженерам по безопасности находить уязвимости в коде и исправлять их. В основе проекта лежит технология распознавания ошибок на базе ИИ. 

presentsimple — стартап помогает создавать презентации при помощи нейросети, делая процесс верстки слайдов простым и быстрым. Программа автоматизирует рутинные задачи пользователей, генерируя релевантный текст для каждого слайда и подбирая оформление по поставленным запросам. Для старта работы достаточно загрузить черновик в формате PDF, PowerPoint или Word.

DetAFake — сервис для распознавания дипфейков на реалистичных фото-, видео- и аудио-материалах. Стартап ставит своей целью защиту людей и бизнеса от мошенничества. Согласно сайту компании, точность выявления ИИ-фейков составляет 94%, 98% и 99% при работе с фото, аудио и видео соответственно.

Mobidriven — ИИ-платформа для оптимизации рекламных кампаний в реальном времени. Проект помогает закупать персонализированные показы интернет-рекламы под нужды клиентов. Mobidriven работает как с брендами, так и с профильными агентствами. 

Метранпаж — онлайн-сервис автоматической верстки печатных и электронных изданий при помощи ИИ. Платформа значительно ускоряет процесс создания сложных книг, позволяя пользователям сверстать их за час, минимизируя ошибки и затраты.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Большой потенциал малых языковых моделей

Современный бум ИИ уже давно не сводится к крупным разработкам от гигантов вроде OpenAI или Anthropic, инвестирующих миллиарды в большие языковые модели. Наоборот, всё чаще в фокус внимания попадают малые языковые модели (Small Language Models, SLMs), способные решать узкоспециализированные задачи не хуже (а порой и лучше) своих «старших собратьев».

Яркий пример — стартап Patronus AI со своей моделью Glider, имеющей 3,8 миллиарда параметров. Большинство компаний применяют для оценки своих продуктов большие закрытые модели вроде GPT-4. Но это дорого, не всегда прозрачно и несет риски для конфиденциальности. Glider же, будучи относительно компактной, способна работать на более простом «железе» и при этом давать детальное объяснение своих оценок по сотням критериев (точность, безопасность, стиль, тон и т. д.).

По результатам тестов Glider превосходит GPT-4o mini по нескольким метрикам и отвечает в среднем менее чем за секунду, что делает ее практически идеальным решением для генерации текста в реальном времени.

Большие языковые модели, безусловно, продолжают впечатлять своей универсальностью, но их недостатки очевидны:

- Высокие затраты на ресурсы. Обучение и инференс больших моделей требуют колоссальных вычислительных мощностей, что приводит к дополнительным расходам на инфраструктуру, электроэнергию и обслуживание;

- Низкая конфиденциальность. Использование больших закрытых моделей предполагает отправку данных во внешний облачный сервис, что критично для финансовых организаций и здравоохранения;

- Зависимость от интернета. При отсутствии доступа к сети такие модели попросту недоступны;

Малые языковые модели, напротив, легко разворачиваются на локальном сервере или даже на обычном пользовательском устройстве, снижая задержки при ответах и повышая контроль над безопасностью. Им не нужны сотни гигабайт видеопамяти, а адаптация к узконаправленной задаче и интеграция в собственную инфраструктуру обходятся заметно дешевле и проще. Дополнительно малые модели экономят электроэнергию и бережнее относятся к экологии.

Малые языковые модели можно либо обучать с нуля под конкретную задачу, либо «сжимать» уже готовые большие модели, используя методы прунинга, квантизации и дистилляции знаний, сохраняя высокое качество при сокращении числа параметров.

Набирают популярность и гибридные системы, в которых несколько малых моделей берут на себя простые запросы, а большая модель выступает их «роутером» и используется для более сложных задач.

Помимо Glider, существуют такие модели, как Ministral (Mistral AI), Phi (Microsoft) и Llama 3.2 (Meta). Все они ориентированы на локальное использование в задачах, где высоки требования к приватности и быстроте отклика.

Малые языковые модели незаменимы там, где требуется локальная обработка данных: в медицине (электронные записи пациентов, выписки, рецепты) или финансовой сфере (работа с регулятивными документами). Их размер снижает риск «галлюцинаций», помогает быстрее достичь высоких результатов в узкоспециализированных областях и защищает конфиденциальную информацию.

В действительности большие и малые языковые модели — это две параллельные ветви эволюции, которые не исключают, а взаимно дополняют друг друга. Большие модели лучше справляются с универсальными задачами, требующими миллиарды параметров и богатого контекста, а малые эффективнее работают над узкоспециализированными кейсами, обеспечивая локальную приватность и минимизируя затраты.

В ближайшие годы мы увидим стремительный рост гибридных решений, где оба типа моделей будут работать вместе. В результате мы получим еще более умные, надежные и быстрые ИИ-сервисы, способные удовлетворить самые разнообразные потребности практически любого бизнеса.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Можно ли внести программу на базе искусственного интеллекта или нейросеть в Реестр ПО?

Если коротко, то да. Такой вывод можно сделать, проанализировав уже внесенные программы в Реестр ПО. В этом списке: «ILAI - искусственный интеллект для управления продажами на маркетплейсах»«Программа ЭВМ «ИИ «Распознавание речи»«Q.AIML, Искусственный интеллект и машинное обучение»«Программа ЭВМ «ИИ «АТОМ»«Система управления моделями и приложениями технологий искусственного интеллекта RAISA – RSHB AI Systems and Applications»«AI.СТВ (Модуль искусственного интеллекта (AI) для системы технологического видеонаблюдения (СТВ))» и многое другое.

Что надо знать о программе с искусственным интеллектом, чтобы претендовать на включение в Реестр?

1. Нормативное определение ИИ появилось в российском праве относительно недавно (см. напр. Указ Президента РФ от 10.10.2019 № 490). Юридические документы РФ относят к AI совокупность технических решений, могущих, например, самообучаться и выдавать такие результаты, которые сопоставимы с тем, что делает человек.

2. Юридическое отнесение к категории ПО с ИИ производится в Приказе Министерства экономического развития РФ от 29 июня 2021 г. № 392.

3. Технологиями искусственного интеллекта (как следует из вышеупомянутого документа) считаются:

  • Обработка текста и речи, распознавание голоса и его синтез;

  • Помощь для принятия тех или иных решений;

  • Машинное зрение;

  • Иные возможности — их именуют (и детально расшифровывают) в упомянутом Приказе в контексте категории «перспективные методы ИИ».

Как подготовить документацию для включения программы с ИИ в Реестр?

Это достаточно сложная задача, так как необходимо соблюсти ряд требований: как перечисленных выше (например, чтобы в разработке точно имелись признаки ИИ, использовалась минимум одна из указанных технологий), так и иных, обозначенных в других нормативных актах и касающихся непосредственно самой процедуры регистрации. Вполне очевидно, что сделать эту работу неспециалисту, который не связан с данной отраслью, будет затруднительно.

Эксперты Онлайн Патента, зная досконально эту сферу, могут помочь в этом деле. Взаимодействие с вами как заказчиком осуществляется дистанционно, не требуется привозить никаких бумаг в офис компании или в Минцифры РФ. Гарантируется и результат: ваша программа с искусственным интеллектом будет точно включена в Реестр российского ПО.

Какие выгоды от внесения программы в Реестр ПО?

Войдя в этот список, вы можете претендовать на многочисленные налоговые льготы. Также у вас появляется преимущество при госзакупках. 

Куда обратиться для того, чтобы моя программа была включена в Реестр российского ПО?

Оставить заявку специалистам Онлайн Патента можно здесь

Теги:
Всего голосов 5: ↑4 и ↓1+3
Комментарии0

Ближайшие события

ИИ-плагины для Сhrome, с которыми можно выполнить различные задачи:

  • Jasper — ИИ-райтер. Напишет любой текст, поправит грамотность или сделает быстрый рерайт под любую аудиторию.

  • Harpa AI — универсальный ИИ-помощник, который заберет всю рутину, интегрирует Claude и ChatGPT в поиск Google, жестко бустит поиск в сети, делает саммари статей и видео.

  • Scalenut — создаёт SEO-контент прямо в браузере, пишет посты для блогов и даже большие, серьезные статьи, оптимизируя их для поисковиков.

  • Perplexity — мощный ИИ-поисковик, который сделает саммари страниц в сети, статей и ответит на любые вопросы.

  • Otter.ai — швейцарский нож для созвонов. За один клик интегрируется в Zoom или Google Meet, транскрибирует звонки: предоставляет текстовую расшифровку и саммари с выделением тезисов.

  • Copyleaks — точный ИИ-детектор, поможет выбрать только оригинальный контент для ваших задач.

  • DeepL — нейропереводчик и редактор. Переводит текст на любой язык прямо во время чтения или сразу при вводе.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Какой ИИ-стартап запустить: анализ перспективных направлений

Тренд на стартапы с ИИ-агентами стремительно растет. Но важно понять, где можно создать реальную ценность и построить устойчивый бизнес.

Я выделил для себя два ключевых критерия успеха ИИ-продукта:

1. Полезность продукта - он должен решать реальную проблему клиентов, за решение которой они готовы заплатить;

2. Технологическое преимущество, основанное на уникальных данных и моделях, обученных на них, что создает барьеры для конкурентов.

Поэтому есть категории ИИ-продуктов, которые, несмотря на привлекательность, нецелесообразно создавать:

- Во-первых, фундаментальные технологические продукты. Конкурировать с технологическими гигантами в этой области практически невозможно из-за их огромных ресурсов и доступа к данным.

- Во-вторых, "обёртки" поверх GPT-моделей. Такие продукты часто теряют свою ценность с каждым обновлением фундаментальных моделей. Конечно, можно занять свою долю рынка, но достаточно быстро появятся конкуренты, которые вас повторят.

- Наконец, новые продукты в нишах, где текущие игроки уже внедряют ИИ. Лидеры рынка быстро интегрируют новые технологии в свои продукты, используя обширную базу пользователей и существующие интеграции.

С другой стороны, есть перспективные направления, в которых можно развиваться:

- Первое направление — автоматизация ручных процессов в больших компаниях. Это требует глубокого понимания специфики отрасли и умения выстраивать процессы продаж и внедрения, что создает барьеры для конкурентов.

- Второе направление — вертикально интегрированные решения. Фокусируясь на узком сегменте, можно создать специализированный продукт с высокой добавленной ценностью и защитой от конкуренции. Например, Jenni — ИИ-помощник для написания научных работ, учитывающий все нюансы форматирования и ссылок.

- Третье направление — сервисные индустрии, где ИИ позволяет повысить продуктивность. Например, Dwelly автоматизирует процессы в сфере аренды недвижимости. В таких отраслях конкуренция со стороны крупных технологических компаний маловероятна.

Есть возможность и в создании принципиально новых ИИ-продуктов. Это продукты, которые переосмысливают существующие решения, предлагая пользователям новый опыт. Например, Limitless AI — устройство, запоминающее все действия пользователя и позволяющее быстро получать доступ к этой информации.

Также могут быть интересны продукты для ИИ-разработчиков. Но они требуют глубоких технических знаний и, как правило, больше подходят фаундерам с инженерным бэкграундом. Здесь востребованы продукты в области инфраструктуры для ИИ, а также инструменты для MLOps и LLMOps.

Лайфхак для сервисного бизнеса:

Для сервисного бизнеса есть отличная возможность автоматизировать свои процессы и превратиться в продуктовую компанию. Допустим, у вас кадровое агентство:

1. Определите операцию для внедрения ИИ по следующим критериям: ресурсоемкость, эффект от внедрения, сложность внедрения. Например, это скрининг резюме кандидатов и написание обратной связи.

2. Если у вас есть данные по оценкам резюме профессиональными HR’ами и их обратной связью, то вы можете дообучить ИИ на них. Автоматизируйте эту операцию с помощью ИИ и посчитайте метрики процесса найма после внедрения ИИ.

3. Переходите к следующей операции и в итоге автоматизируйте весь процесс. Вы можете дифференцироваться по вертикале, например вы нанимаете только IT-специалистов.

PROFIT: Упакуйте готовый процесс в пользовательский интерфейс и продавайте как ИИ-продукт.

Технологическое преимущество здесь заключается в том, чтобы выполнять задачи лучше, чем остальные, дообучая модели на собственных экспертных данных.

Мы живем в уникальное время, когда сервисные компании могут не только стать очень производительными за счет внедрения ИИ, но и превратиться в продуктовую компанию за счет накопленной экспертизы и данных.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Представлен открытый проект, который помогает создавать нейросети с нуля.

В Oumi вшиты все необходимые инструменты от препроцессинга данных и бенчмарков до различных видов обучения нейронок.

Решение содержит информацию как сделать ИИ‑спеца для различных задач, включая:

  • полную базу данных о популярных ИИ-моделях;

  • пошаговые инструкции для каждого этапа разработки своего ИИ;

  • гайд по файнтюнингу нейросетей, включая LoRA, подготовку данных и оценку производительности по бенчамаркам;

  • дистилляция моделей для снижения их размеров и повышения эффективности;

  • метрики работоспособности ИИ и необходимые фреймворки для тестов;

  • данные для удаленной тренировки моделей — AWS, Azure, GCP, Lambda с подробной документацией к каждой платформе;

  • инструменты для фильтрации данных для нейросетей и их цензурирования;

  • примеры готовых конфигураций.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Представлен открытый проект, который помогает создавать нейросети с нуля.

В Oumi вшиты все необходимые инструменты от препроцессинга данных и бенчмарков до различных видов обучения нейронок.

Решение содержит информацию как сделать ИИ‑спеца для различных задач, включая:

  • полную базу данных о популярных ИИ-моделях;

  • пошаговые инструкции для каждого этапа разработки своего ИИ;

  • гайд по файнтюнингу нейросетей, включая LoRA, подготовку данных и оценку производительности по бенчамаркам;

  • дистилляция моделей для снижения их размеров и повышения эффективности;

  • метрики работоспособности ИИ и необходимые фреймворки для тестов;

  • данные для удаленной тренировки моделей — AWS, Azure, GCP, Lambda с подробной документацией к каждой платформе;

  • инструменты для фильтрации данных для нейросетей и их цензурирования;

  • примеры готовых конфигураций.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Победи DeepFake! ИТ-компания «Криптонит» запускает соревнование Kryptonite ML Challenge!

Сегодня открылась регистрация на соревнование Kryptonite ML Challenge. Главная задача участников — создать DeepFake-устойчивую Face ID-модель. А призовой фонд — 600 тысяч рублей.

Кто может принять участие?

  • Молодые специалисты и профессионалы в областях Data Science, Computer Vision, Face Recognition и Metric Learning.

  • Студенты старших курсов, проходящие обучение по специальностям «Прикладная математика», «Информатика» или «Информационная безопасность».

Участвовать можно как одному, так и в команде до 5 человек. Авторы лучших решений получат возможность стать частью команды «Криптонита»💙

Регистрация открыта до 1 марта! Скорее переходите по ссылке и участвуйте в Kryptonite ML Challenge!

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Чего ждать от ИИ в этом году: технологические тренды Gartner 2025

Аналитическая компания Gartner представила свои технологические прогнозы, сгруппировав их в три основные категории:

1. ИИ: Императивы и риски ИИ для защиты организаций

- Agentic AI: Автономные ИИ-агенты, способные сами планировать и действовать для достижения поставленных целей;

- AI Governance Platforms: Платформы для управления ИИ позволяют организациям управлять юридическими, этическими и операционными аспектами ИИ-систем;

- Disinformation Security: Технологии защиты от дезинформации снижают уровень мошенничества и защищают репутацию бренда через усиленные меры проверки.

2. Новые технологии побуждают организации пересматривать свои подходы к вычислениям

- Post-Quantum Cryptography (PQC): Постквантовая криптография защищает данные от угроз квантовых вычислений;

- Ambient Invisible Intelligence: Использование незаметных сенсоров для выявления ранее скрытых процессов в организациях, повышая эффективность и улучшая принятие решений;

- Energy-Efficient Computing: Энергоэффективные вычисления повышают устойчивость за счёт оптимизированной архитектуры и использования возобновляемой энергии;

- Hybrid Computing: Гибридные вычисления комбинируют различные механизмы для решения вычислительных задач, например, сочетание тензорных (TPU) и графических (GPU) вычислений.

3. Синергия человека и машины объединяет физические и цифровые миры

- Spatial Computing: Пространственные вычисления используют технологии расширенной (XR), дополненной (AR), смешанной (MR) и виртуальных реальностей (VR) для создания иммерсивных миров;

- Polyfunctional Robots: Многофункциональные роботы, выполняющие различные задачи и способные работать вместе с людьми;

- Neurological Enhancement: Нейронные улучшения повышают когнитивные способности, считывая мозговую активность.

Углубимся в категорию императивов и рисков ИИ для защиты организаций.

Что касается ИИ-агентов, мне интересно наблюдать за компанией Artisan, которая разработала ИИ-сотрудника по имени Ava. Ava автоматизирует процессы отдела продаж — от поиска клиентов до закрытия сделок. Ava функционирует как полноценный член команды, не требуя постоянного контроля.

Такие инструменты, как AutoGenLangChain и CrewAI, помогают создавать ИИ-агентов, которые могут самостоятельно выполнять задачи без постоянного вмешательства человека. Агентный ИИ обладает потенциалом кардинально преобразовать множество отраслей. Однако с ростом возможностей таких агентов возникает необходимость в строгом регулировании и этических стандартах.

Поэтому возникает потребность в инструментах, позволяющих контролировать и регулировать его применение. Платформы для управления ИИ становятся незаменимыми для компаний, стремящихся эффективно и безопасно интегрировать ИИ в свои процессы. Они предназначены для мониторинга работы ИИ-систем, регулярной проверки соответствия ИИ-решений установленным стандартам и нормам, а также для обнаружения возможных угроз, включая предвзятость алгоритмов и проблемы конфиденциальности данных. Один из примеров таких систем — Holistic AI.

В эпоху информационных войн и фейковых новостей технологии борьбы с дезинформацией становятся жизненно необходимыми. Например, Sensity AI помогает обнаруживать дипфейки в реальном времени. По прогнозам Gartner, к 2028 году 50% предприятий будут использовать продукты и услуги, направленные на борьбу с дезинформацией, что значительно выше текущих показателей.

В ближайшие годы прогнозируется стремительный рост инвестиций в эти направления, и только те организации, которые оперативно адаптируются к быстро меняющемуся технологическому ландшафту, смогут сохранить свои лидирующие позиции и оставаться конкурентоспособными на рынке.

Если вам интересна тема ИИ, подписывайтесь на мой Telegram-канал — там я регулярно делюсь инсайтами по внедрению ИИ в бизнес, запуску ИИ-стартапов и объясняю, как работают все эти ИИ-чудеса.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии0

Учимся писать промты для о3-mini с помощью мини-гайда, который научит правильно пользоваться новой моделью. У «думающих» нейросетей отличается логика построения промтов — привычные подсказки к ChatGPT тут не работают.

Ранее OpenAI выпустила o3-mini для всех. Она чуть качественнее и заметно быстрее o1.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1