Машинное обучение *

Основа искусственного интеллекта

10 июн 2024 в 08:406.9K

Open source * Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты выпустил новую 4-х часовую лекцию на Youtube о том, как создать GPT-2 с нуля на Python.

В ролике Карпаты стартует с пустого файла и далее собирает полноценную рабочую ИИ-модель — с пошаговым объяснением.

Сопроводительный материал к новой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

В феврале Карпаты выпустил лекцию на Youtube под названием Let's build the GPT Tokenizer. Это двухчасовая понятная и доступная лекция о токенах и токенизации в ChatGPT и других нейросетях. В видео Карпаты буквально на пальцах показывает, как именно нейросеть GPT читает текст, как дробит его на единицы и что в нём выделяет. Учебный материал поможет начинающим пользователям углубиться в изучение нейросетей, а также лучше понимать их устройство.

Сопроводительный материал к этой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

+13

anazarta

7 июн 2024 в 08:307.2K

Блог компании ЯндексПоисковые технологии * Обработка изображений * Машинное обучение * Исследования и прогнозы в IT *

Небольшая, но полезная новость для тех, кто интересуется историей. Мы добавили в Поиск по архивам новый тип документов — справочники XIX–XX веков из фондов Национальной электронной библиотеки и Российской государственной библиотеки.

Историки, социологи и журналисты смогут получить доступ к новым сведениям об исторических событиях и личностях, а обычные пользователи — ещё больше узнать о своих предках. В новых источниках можно найти биографические факты, которые раньше были доступны только в бумажном виде. Например, памятные книжки содержат списки ключевых персон губерний с их должностями. Из адресных книг можно узнать, где они жили, а из торгово-промышленных справочников — каким делом занимались.

Для этого нейросеть Яндекса расшифровала почти 600 книг или 275 тысяч страниц. Причём она узнаёт даже утратившие актуальность знаки (например, исчезнувшие из алфавита буквы) и учитывает особенности почерка. А для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на бумаге низкой плотности. Кстати, более подробно о нашей технологии мы рассказывали на Хабре в отдельной статье.

denis-19

6 июн 2024 в 19:436.8K

Машинное обучение * История ITИскусственный интеллектСоциальные сети

К 225-летию Александра Пушкина «Яндекс» опубликовал проект «Наше всё». В компании исследовали, что интересует пользователей в жизни и творчестве классика. Также «Яндекс» создал нейросетевые трейлеры по произведениям Пушкина.

daniilshat

6 июн 2024 в 16:438.6K

iOS * Машинное обучение * Искусственный интеллект

Журналисты The Wall Street Journal рассказали, что Apple начала заниматься разработкой ИИ-функций после того, как Крейг Федериги попробовал GitHub Copilot. Сообщается, что старший вице-президент по разработке программного обеспечения компании экспериментировал с функцией автоматического завершения кода во время рождественских праздников в конце 2022 года. Он впечатлился ей и сразу начал мотивировать разработчиков Apple начать придумывать что-то своё. После этого события взгляды компании на генеративные модели машинного обучения поменялись в лучшую сторону, но Apple всё ещё занимает отстающую позицию среди международных технологических компаний.

denis-19

6 июн 2024 в 05:475.9K

Open source * Машинное обучение * Учебный процесс в ITИскусственный интеллект

Microsoft обновила бесплатный курс для начинающих пользователей и промпт‑инженеров Generative AI for Beginners (Version 2) — A Course до версии 2. В открытом репозитории 18 занятий по различным ИИ‑моделям, их особенностям и интеграции во все системы, включая обучение, как построить свою мини-модель и получить новые знания.

denis-19

5 июн 2024 в 18:518.3K

Машинное обучение * РобототехникаИскусственный интеллектУмный дом

На полях Петербургского международного экономического форума (ПМЭФ-2024)
5 июня показали робопса от Центра робототехники «Сбера» (SberRoboticsСenter) с функцией «навигатора».

Робот ориентируется на местности и готов проводить посетителей к тому или иному объекту. Управлять роботом можно с помощью голосовых команд или через текстовый чат на планшете. Всё программное обеспечение, включая навигационный модуль — разработка Центра робототехники «Сбера».

Аппаратная часть робота сделана в Китае. Фактически, «мозги» робота расположены не в голове, а в контейнере с ПК на спине, отвечающем за работу машинного зрения и координацию движений. Обучение робота базируется на генеративном ИИ собственной разработки «Сбера».

Также на спине робопса установлено специальное оборудование, в том числе камера Insta 360, позволяющая снимать видео на 360 градусов.

По словам представителей лаборатории робототехники «Сбера», робопёс помогает на производстве и в офисе, может выполнять функции курьера и оказывать помощь при поисково-спасательных операциях. На данный момент робопёс выступает в качестве научно-исследовательской платформы, с помощью которой исследователи Центра робототехники «Сбера» тестируют свои наработки в сфере искусственного интеллекта и машинного зрения.

LizzieSimpson

3 июн 2024 в 15:176.6K

Машинное обучение * Учебный процесс в IT

Финансовый маркетплейс «Сравни» анонсировал бесплатный курс о дизайне современных систем машинного обучения. Программа включает в себя 24 урока, на которых студенты получат практические советы от действующих профессионалов индустрии.

Курс начнётся 4 июля и продлится два месяца. Занятия будут проходить онлайн по четвергам с 19:00 до 20:30 по московскому времени.

Основная цель курса — помочь IT‑специалистам расширить знания о проектировании, обучении, внедрении и поддержке ML‑систем, закрепить практические навыки. В рамках программы эксперты поделятся опытом решения конкретных задач. В финале курса слушатели составят дизайн‑документ по собственному проекту или по одной из предложенных тем.

Cтудентам потребуются теоретические знания в ML, навыки программирования и как минимум учебный опыт реализации проектов в этой сфере.

Попасть на курс можно после заполнения анкеты на сайте «Сравни» до 13 июня включительно. Затем нужно будет пройти тест на знание теории и задач машинного обучения 15 и 16 июня. Результаты будут известны 24 июня.

denis-19

1 июн 2024 в 18:0212K

Машинное обучение * Искусственный интеллектСоциальные сетиБудущее здесь

Представлена нейросеть без тормозов Devil70B. Это модель без цензуры и ограничений. Она отвечает на любой вопрос и поддерживает русский язык.

daniilshat

30 мая 2024 в 13:596.2K

Машинное обучение * Искусственный интеллектЗвук

Suno анонсировала новую версию нейросети для генерации музыки. Теперь модель машинного обучения может работать с готовыми звуковыми дорожками. К примеру, можно загрузить мелодию, сыгранную на фортепиано, и попросить переделать в звук в гитару или аккордеон. Кроме того, показали, как пользователь настучал бит, а нейросеть создала для него аккомпанемент и вокал.

denis-19

30 мая 2024 в 05:428.8K

Программирование * Машинное обучение * Искусственный интеллектБудущее здесь

Mistral представила нейросеть Codestral-22B, которая знает 80+ языков программирования. Codestral превосходит по производительности Llama-3, CodeLlama и даже GPT-4o, а также весит в три раза меньше.

Модель Codestral-22B умеет писать и рефакторить код, подсказывает наилучшие решения задач и даже паттерны проектирования. Её можно интегрировать в свои проекты с помощью API или просто использовать в VS Code. Нейросеть знает даже Fortran и COBOL.

Тест нейросети Codestral-22B доступен здесь или прямо в браузере.

denis-19

29 мая 2024 в 14:046.2K

Машинное обучение * Искусственный интеллектЗвук

Проект ChatTTS опубликовал модель и связанный с ней инструментарий машинного обучения для синтеза эмоциональной речи. Решение оптимизировано для использования в диалоговых системах, таких как интерактивные помощники, и нацелено на воспроизведение свойств естественного эмоционального общения. Поддерживается взаимодействие с несколькими говорящими людьми и построение интерактивного диалога. Корректно отслеживаются и воспроизводятся при синтезе просодические элементы, такие как смех, паузы и междометия.

При тренировке модели использовано около 40 тыс. часов речевых записей. По заявлению разработчиков, по своим возможностям формирования интонаций модель превосходит все ранее доступные открытые модели синтеза речи.

Для управления эмоциями при синтезе пока поддерживается только подстановка токенов, например, "[laugh]" для смеха. Для генерации полуминутной записи требуется GPU с 4 ГБ памяти. На GPU NVIDIA GeForce RTX 4090D скорость генерации составляет приблизительно 7 семантических токенов в секунду. Поддерживается синтез женским и мужским голосом на английском и китайском языках (для русского языка можно рекомендовать фреймворк TTS и модель XTTS-v2, которые кроме синтеза поддерживают клонирование голоса по короткой записи речи, в том числе для синтеза на другом языке).

Модель ChatTTS опубликована под лицензией CC BY-NC-ND 4.0 (Creative Commons Attribution-NonCommercial-NoDerivatives 4.0) и имеет защиту от совершения мошеннических и криминальных действий.

Источник: OpenNET.

daniilshat

28 мая 2024 в 23:2011K

Машинное обучение * Искусственный интеллектИгры и игровые консоли

Автор YouTube-канала Tamulur показал «обратный тест Тьюринга». Он представляет собой сцену, созданную в Unity, с несколькими ИИ-агентами, которые играют роль исторических личностей. Каждый агент управляется одной языковой моделью. Человек также играет за историческую личность.

По сюжету за проезд в поезде могут не платить только нейросети, поэтому агенты пытаются выяснить, кто из них человек. Агенты по кругу задают вопросы, задача человека — не выдать себя, отвечая на вопросы и задавая свои.

+14

denis-19

28 мая 2024 в 18:259.5K

Машинное обучение * Облачные сервисы * ДизайнИскусственный интеллектСоциальные сети

Дизайнерам на заметку. Разработчик подружил GPT-4o c Figma. Оцените мощь — модель генерирует детальные и оптимизированные интерфейсы с кучей слоёв и элементов, используя обычное ТЗ. Такого уровня нейронки добились впервые.

С этим плагином Figma будет дизайнить сама по себе — нужно лишь закинуть документ с описанием продукта и нужную библиотеку элементов.

Travis_Macrif

26 мая 2024 в 11:356.8K

Машинное обучение * Искусственный интеллект

Глава стартапа xAI Илон Маск сообщил инвесторам о планах создания суперкомпьютера для новой версии чат-бота Grok, пишет Information. Бизнесмен заявил, что проект будет завершён к осени 2025 года.

Суперкомпьютер, называемый Маском «гигафабрикой вычислений», будет использовать десятки тысяч графических процессоров Nvidia H100. Для обучения Grok 2.0 применяют около 20 тыс. графических процессоров, а для новой итерации чат-бота потребуется в пять раз больше. Маск заверил инвесторов, что планируемый кластер графических процессоров будет минимум в четыре раза крупнее того объёма, который используют конкуренты xAI.

Сейчас Grok находится в версии 1.5, которая вышла в апреле. Разработчик указывает, что инструмент способен обрабатывать не только текст, но и визуальную информацию, включая фотографии, скриншоты, диаграммы и многое другое. В мае социальная сеть X начала выпускать сводки новостей, созданных при помощи ИИ на базе Grok, для премиальных пользователей.

denis-19

24 мая 2024 в 06:116.5K

Поисковые технологии * Машинное обучение * Искусственный интеллектЗдоровьеБудущее здесь

ИИ-помощник от Google предложил пользователю в ответ на запрос «сколько камней мне нужно есть?»‎ такой ответ: «по меньшей мере один маленький камень ежедневно»‎.

Ранее пользователь из США не смог приготовить пиццу так, чтобы сыр нормально
на ней держался. Gemini, встроенная в поиск Google, предложила ему
замешать в сыр клей для фиксации.

denis-19

23 мая 2024 в 12:229.1K

Поисковые технологии * Машинное обучение * Искусственный интеллектЗдоровьеБудущее здесь

ИИ-помощник от Google предложил пользователю поесть нетоксичного клея.

Пользователь из США не смог приготовить пиццу так, чтобы сыр нормально на ней держался. Gemini, встроенная в поиск Google, предложила ему замешать в сыр клей для фиксации.

Разгадка у казуса оказалась простая: нейросеть нашла ответ по этому запросу из поста какого-то тролля с Reddit 11-летней давности. Примечательно, что такие ИИ-ответы теперь идут в верху выдачи сервиса Google.

kamaisha

23 мая 2024 в 08:455.3K

Блог компании КриптонитТерминология ITМашинное обучение * Искусственный интеллект

В анализе видеопотока с помощью ИИ выделяют два подхода. Первый из них называется обработкой разреженного (sparse) видео. Он решает задачу предсказания одного результата по анализу видеофрагмента (массива кадров).

Второй подход решает задачу предсказания одного результата на кадр. Такую покадровую обработку называют анализом плотного (dense) видео. Модели ML для работы с плотным видео востребованы там, где требуется уловить кратковременные события и проанализировать быстрые изменения сцен.

❗️Существующие модели глубокого анализа видео (например, 3D CNNs) достигли впечатляющих результатов при обработке разреженного видео. Однако их адаптация к задачам плотного видео сопряжена с рядом проблем.

В частности, эти модели менее эффективны при работе с избыточными кадрами, с трудом улавливают временные корреляции на больших интервалах и неоправданно дороги в развёртывании.

Чтобы решить эти проблемы, коллектив исследователей из Белфаста (Ирландия) разработал TDViT — модель трансформера для обработки плотного видео с блоками временнóго расширения.

Эксперименты с наборами данных ImageNet VID и YouTube VIS показали, что TDViT эффективно извлекает пространственно-временны́е представления и ослабляет негативный эффект временнóй избыточности. Также иерархическая структура блоков позволяет моделировать динамику на больших временных интервалах.

Код TDViT открыт и доступен на GitHub

veseluha

23 мая 2024 в 05:365.6K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Mistral-7B-v0.3 доступна на HuggingFace

Изменения в Mistral-7B-v0.3 по сравнению с предыдущими версиями:

Увеличен словарь до 32768 слов;
Добавлена поддержка более новой версии токенизатора v3;
Модель теперь поддерживает вызов функций;
Apache 2.0 лицензия.

Hugging Face Base Model

Hugging Face Instruct Model

denis-19

22 мая 2024 в 19:147.2K

Программирование * Машинное обучение * Управление разработкой * Искусственный интеллект

Сервис «Сбера» GigaCode стал лучшим ИИ-сервисом по точности предсказывания кода разработки среди зарубежных аналогов. Тестирование проводилось на большом количестве файлов с кодом, сообщила пресс-служба «Сбера».

«Эксперты „Сбера“ провели обширное тестирование различных ИИ‑ассистентов разработчика на более чем 17 тыс. файлов с кодом, в ходе которого сервисам предлагалось продолжить фрагмент исходного кода, и производился замер того, насколько точно предсказывается его следующая строка. Результаты показали, что по интегральной доле верно предсказанного кода на языке Java сервис GigaCode показал результат на 2% лучше, чем GitHub Copilot, и на 3% и 6,5% лучше, чем Codeium и TabNine», — рассказал старший вице‑президент, руководитель блока «Технологическое развитие» «Сбера» Андрей Белевцев.

В процессе тестирования исследователями замерялась доля кода, предсказанного ИИ-ассистентами, при этом учитывались не только случаи полного совпадения строки, а также и случаи, в которых была удачно предсказана часть, принимались во внимание также частота и стабильность выдачи подсказок.

Сервис GigaCode помогает в режиме реального времени по фрагменту кода сгенерировать наиболее вероятные его продолжения непосредственно в среде
разработки. Решение поддерживает более 15 языков программирования (Java, Python, JavaScript, TypeScript, C/C++ и другие), а также совместимо со множеством редакторов и интегрированных сред (IDEA, PyCharm, VSCode, Jupyter и другие).

ilomov

21 мая 2024 в 10:498.3K

Блог компании Островок!Data Mining * Машинное обучение * Карьера в IT-индустрииData Engineering *

Привет! Меня зовут Ильдар Ломов. Расскажу, чем занимаются ML-инженеры в Островке. Знаю об этом всё, я сам руководитель команды Data Science.

Сейчас портфель ML-проектов Островка —12 штук в нескольких направлениях: от продуктового ML (ранжирование, рекомендации), до больших языковых моделей.

Состав команды стандартный: ML-инженер, бизнес-аналитик, проджект, продакт. Опционально тимлиды и разработчики.

Работа ML-инженера в Островке — посередине между стартапом с его моделью в jupyter-ноутбуке и корпорацией, где работа с сотнями моделей упорядочена, стандартизирована, вшита в интерфейсы. Можно поработать над серьезным проектом гибко с разнообразием инструментов.

Идеал — проактивный человек, который протащит проект от исследования до прода и покрытия метриками. Важно понимать все этапы проекта, иметь усиленный скилл хотя бы на одном из них, с остальным поможет команда.

Нужно уметь покрывать метриками, следить за проектом на проде, чтобы тот не потерял смысл из-за нестыковок в ТЗ. И работал так, как задумано.

Частые итерации, проверки гипотез и новых технологий дают нашему ML-инженеру больший кругозор в сравнении с крупными компаниями. Специалист растет с технической и бизнесовой сторон.

Работа оценивается с точки зрения влияния на бизнес, инженер видит, как проекты прямо и понятно воздействуют на бизнес-метрики.

Это то, что мы всегда хотим видеть в кандидатах, но на рынке такого не много. Чем виднее на собеседованиях, что человек понимает бизнес-сторону, тем больше он нам подходит.

1 2 ...

27 28

30 31 ...

36 37

Машинное обучение *

Ближайшие события

Вклад авторов