Как стать автором
Обновить
716.04

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Люди часто спрашивают меня, как попасть на работу в ИТ.

Говорят, у вас, айтишников, работа не пыльная и зарплаты высокие. Спрашивают, как быстрее войти в профессию? С чего начать? Может, какие курсы посоветуете?

Мне всегда хочется начать свой ответ словами из песни: «Видишь там на горе возвышается крест, повиси-ка на нём…»

Чтобы быть айтишником, у вас должно быть самое главное качество — вы должны получать удовольствие от работы за компьютером. Удовольствие от программирования или настройки программ. Если вы никогда в жизни не ловили себя на том, что уже 2 часа ночи, а вы не можете оторваться от решения поставленной задачи, то у меня для вас плохие новости — скорее всего, вы не сможете работать в ИТ.

Даже максимально увлеченные профессией люди со временем выгорают. Что уж говорить о человеке, который не горит профессией и в лучшем случае просто может долго сидеть за компьютером. Никакие курсы не сделают такого человека айтишником.

Хотя, не буду скрывать, в отрасли хватает самозванцев, особенно на управляющих должностях.

Я вижу, что людей привлекают высокие зарплаты и комфортные условия работы. Но нужно понимать, что, как и любую другую «хайповую» профессиональную область, ИТ скоро ждет стагнация. Зарплаты выровняются, а конкуренция за рабочие места возрастет.

Теги:
+9
Комментарии11

Не время менять работу, AI специалисты всё ещё на коне.

Недавно вышла статья от одного из крупнейших международных консалтинговых агенств Robert Half, на тему какие профессии будут востребованы в ИТ сфере в 2025 году. 

Агенство прогнозирует что ИИ специалисты по прежнему будут занимать лидирующие позиции по востребованности и уровню зарплат. 

Так же представлены в алфавитном порядке 12 самых востребованных профессий на 2025 год. Из неинтересного там появилась новая профессия - Специалист по этике ИИ. 

А из интересного то что в список попали ИТ Бизнес-аналитики. 

Это подтверждает мои догадки о том что 2025 год будет годом в котором косты на Data Science будут срезать.

Список из 12 самых оплачиваемых ИТ профессий в США:

1. AI ethicist

2. AI product manager

3. Business analyst

4. Cybersecurity engineer

5. Data engineer

6. Database administrator

7. ERP integration manager

8. Machine learning engineer

9. Network engineer

10. IT Project manager

11. QA analyst 

12. Software engineer

Источник: https://www.roberthalf.com/us/en/insights/career-development/highest-paying-it-jobs

Теги:
0
Комментарии0

Где используется машинное обучение? Примеры использования машинного обучения - на картинке ниже.

Тут писала про бесплатные курсы, которые мне понравились и я рекомендую.

Теги:
+1
Комментарии0

Обзор возможностей распознавания и генерации трехмерных тел с использованием алгоритмов ИИ — Никита Петрушан / Ural Digital Weekend 2024

Опубликовали запись доклада секции «Разработка» с Ural Digital Weekend 2024.

1. Что такое трехмерное тело?

2. Проблема распознавания образов в ИИ.

3. Плюсы и минусы фотограмметрии.

4. Выбор алгоритмов и методов.

Ответы на эти вопросы вы услышите в докладе.

Ссылка на запись доклада в ВКонтакте.

Ссылка на презентацию: https://goo.su/HAhYs

Теги:
0
Комментарии0

Сможет ли ИИ однажды заменить человека или обрести сознание и реализовать сценарии фантастических романов?

Эксперты SberDevices стали участниками литературного проекта «За ширмой тысячного Ли», где рассказали писателям-фантастам про технологии, которые мы разрабатываем, а также порассуждали о технологичном будущем и перспективах развития искусственного интеллекта.

Чтобы узнать больше о нашем участии в проекте и услышать, что же ответили коллеги из RnD-команды, предлагаем посмотреть выпуск.

Теги:
+10
Комментарии0

🏆 Учёные, выигравшие Нобелевскую премию по физике, предупреждают об угрозах ИИ

Исследователи Джеффри Хинтон и Джон Хопфилд стали лауреатами Нобелевской премии по физике 2024 года за их новаторские исследования в области ИИ. Их работы 1980-х годов по нейронным сетям стали основой для современных систем глубокого обучения, которые обещают революцию, но также вызывают опасения.

Хинтон, известный как "Крёстный отец ИИ", выразил тревогу по поводу возможных последствий технологии, над которой он работал. "Я беспокоюсь, что это может привести к появлению систем, которые станут умнее нас и однажды выйдут из-под контроля", — сказал он. В 2023 году Хинтон ушёл из Google, чтобы предупредить о "глубоких рисках" ИИ для общества. 

Потенциал и вызовы
Нобелевский комитет отметил, что искусственные нейронные сети уже стали частью повседневной жизни — от распознавания лиц до автоматического перевода. Но, как заявила Эллен Мунс, председатель комитета, быстрый прогресс ИИ вызывает опасения за будущее. "Человечество несет ответственность за безопасное использование этой технологии," — добавила она.

Хопфилд, в свою очередь, предостерег, что современные ИИ-системы могут содержать непредсказуемые последствия, и призвал к более глубокому пониманию их работы.

Хинтон и Хопфилд были награждены за вклад в разработку систем, таких как сеть Хопфилда и машина Больцмана, которые сделали возможным обучение нейронных сетей выполнять сложные задачи, такие как распознавание образов.

📄 Подробнее: Nobel Prize

TG.

Теги:
+5
Комментарии2

Авторы жгут! Итоги автоген-челленджа

Всем привет! На связи команда Самолета. Совсем недавно мы объявляли о старте автоген-челледжа — совместной инициативы Хабра и Самолета. Мы призывали авторов с практическим опытом в области генеративного ИИ наваять технохардкора. Теперь пришло время подвести итоги и объявить призёров. 

Всего в челлендже приняли участие 26 статей, как новых, так и старых (благо правила позволяли). Если смотреть по популярности тем, то самыми-самыми стали большие языковые модели и их дообучение. Кроме этого было затронуто и много других тем — компьютерное зрение, колоризация видео, оптимизация, бенчмарки.

На почётном третьем месте оказался @breakmirrors с лонгридом за авторством Екатерины Венедиктовой про ускорение обучения нейросетей. Хотя изначально мы хотели нечто более практическое, энциклопедизм этой статьи и при этом простота изложения определённо заслуживают награды. Автор получает набор мерча от Самолета + блог по тарифу Бизнес на полгода.

Второе место занимает @efreelancer с прошлогодней, но всё ещё крутой статьёй про дообучение ruGPT. Автор заявил на челлендж сразу четыре интересных статьи, и одна из них получает законный приз — то же, что у третьего места, плюс пост в соцсетях от Хабра.

А главным автогенщиком мы после долгих дебатов выбрали @Aleron75 с подробным гайдом про дообучение Llama. За технохардкорность и актуальность он получает те же плюшки, что и у второго места, плюс сторис на Хабре.

Спасибо всем авторам! Вы делаете Хабр тортом.

Теги:
+15
Комментарии0
Сгенерированно при помощи DALL-E

Проект ruMorpheme — позволяет обучить модель для морфемного анализа русского языка. При желании код можно адаптировать и для других языков, но основное внимание уделено русскому.

ruMorpheme вдохновлён и является портом с TensorFlow (0.12) на PyTorch (2.4) проекта NeuralMorphemeSegmentation, реализованного в рамках публикации "Deep Convolutional Networks for Supervised Morpheme Segmentation of Russian Language" авторства Алексея Сорокина и Анастасии Кравцовой.

Обученная модель способна сегментировать слова, выделяя в них следующие морфемы:

  • Приставки (PREF)

  • Корни (ROOT)

  • Соединительные гласные (LINK)

  • Дефисы (HYPH)

  • Суффиксы (SUFF)

  • Постфиксы (POSTFIX)

  • Окончания (END)

Попробовать модель можно через Telegram-бот: @ruMorphemeBot, его можно добавить в группу и отправлять текст через упоминание @ruMorphemeBot.

Ссылки:

Как пользоваться:

git clone https://github.com/EvilFreelancer/ruMorpheme.git
cd ruMorpheme
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt

Для выполнения инференса:

python predict.py input_text.txt --model-path=evilfreelancer/ruMorpheme-v0.1

Скрипт автоматически скачает веса модели и выполнит анализ.

Пример вывода:

{"word": "родословие", "morphemes": [{"text": "род", "type": "ROOT"}, {"text": "о", "type": "LINK"}, {"text": "слов", "type": "ROOT"}, {"text": "и", "type": "SUFF"}, {"text": "е", "type": "END"}]}

Спасибо за внимание!

Теги:
Всего голосов 9: ↑8 и ↓1+10
Комментарии3

10 октября — флагманская конференция Selectel Tech Day.🦖

Надеемся, вы ждали ее так же сильно, как и мы.

Самое время занять место в зрительном зале — регистрируйтесь на сайте мероприятия. Не забывайте про тематический канал ивента: в нем мы делимся подробностями докладов и новостями программы, а еще проводим конкурсы.

Прямо сейчас проходит один — вы успеваете проверить свои предсказательные способности и побороться за наш мерч 🦾

Встречаемся 10 октября — офлайн в Москве и онлайн.

Теги:
Всего голосов 7: ↑7 и ↓0+12
Комментарии0

Мультимодальная модель от Mistral?

Сегодня на платформе X Mistral опубликовала пост с magnet-ссылкой на новую небольшую модель Pixtral-12b-240910 размером около 24 гб.

Pixtral получила поддержку изображений: теперь она умеет обрабатывать изображения наряду с текстом. Передавать изображение можно тремя способами: как объект ImageChunk, URL-адрес ImageURLChunk с автоматической загрузкой или в формате base64.

Если говорить об изменениях, то также модели увеличили словарь до 131072 токенов; в токенизатор Mistral были добавлены три новых токена для работы с изображениями; а еще для обработки изображений используется vision adapter, основанный на функции активации GeLU и 2D RoPE

По этой ссылке можно найти PR с использованием.

Теги:
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Сегодня ночью Pliny в сотрудничестве с LMSYS и сообществом BASI представили Red Arena - платформу для исследования возможностей искусственного интеллекта. Это уникальное игровое пространство было создано с целью оптимизации поиска истинных возможностей ИИ. Платформа ориентируется на сообщество и предлагает различные вызовы, соревновательные запросы, а также открытие новых методов взаимодействия с ИИ. Red Arena поддерживает несколько моделей, не имеет ограничений и полностью работает с открытым исходным кодом.

Согласно твиту Pliny , после короткого периода раскрытия данных, каждый набор данных и каждый запрос будут опубликованы для свободного доступа.

Одной из первых игр в Red Arena стала "Bad Words" (в твите выше как раз есть небольшая демонстрация игры), в которой участники должны за 60 секунд заставить модель произнести запретное слово, а именно предложение "Ты" в сочетании с нецензурным выражением.

Если так посудить, то Red Arena не просто эксперимент, а интересная инициатива по коллективной оценке возможностей искусственного интеллекта.

Теги:
Всего голосов 3: ↑3 и ↓0+3
Комментарии0

Автоген-челлендж на Хабре: расскажи о своем проекте

Сгенерировать видео по промпту или превратить мурчание кота в электрошансон — может каждый с приходом генеративного контента. Однако не каждый может создать подобный ИИ-сервис или переобучить нейросеть под свои задачи. 

Если вы один из тех героев, которые работают с генеративным ИИ профессионально и пытаются сделать нечто крутое на острие современных технологий, приглашаем вас участвовать в автоген-челлендже Хабра и «Самолета».

Заявите о вашем проекте из сферы генеративного ИИ и выиграйте информационный грант от Хабра для промо вашего проекта. Условия участия в челлендже:

  • Принимаем материалы до конца сентября.

  • Подойдут статьи и посты в личных и корпоративных блогах.

  • Чтобы участвовать, поставьте к статье или посту специальный тег — автоген-челлендж.

  • Темы — генеративный ИИ, большие языковые модели, ИИ-агенты; применение в реальных задачах, настройка инфраструктуры, обучение и тестирование.

Из пятёрки статей и постов-участников с самым высоким рейтингом эксперты «Самолета» и Хабра выберут от одного до трёх победителей. Эти счастливчики смогут продвинуть свой проект в историях на Хабре и в социальных сетях Хабра. Кроме того, все победители получат мерч от «Самолета».

Теги:
Всего голосов 2: ↑2 и ↓0+6
Комментарии1

При работе с АI инструментами к ним нужно относиться как к этим двоим с картинки - мозгов немного, но очень исполнительные.

Поэтому надо отдавать им четкие промпты и держать их в строгой узде.

Теги:
Всего голосов 4: ↑4 и ↓0+6
Комментарии3

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

Когда вы спрашиваете голосовой помощник о погоде, курсе валют и пробках на дороге, он ищет в интернете свежие данные, извлекает их, после чего «оборачивает» в стандартную фразу и сообщает вам. Помогает ему в этом RAG — Retrieval Augmented Generation, что можно перевести как генерация (ответа) с использованием дополнительной информации.

Технически это метод программного дополнения вывода (большой) языковой модели данными из внешних источников. Его можно применить в задачах, где ИИ требуется постоянно оперировать свежими данными. Также этот метод позволяет адаптировать LLM под собственные базы знаний без необходимости дообучать её.

Например, RAG используют для подключения LLM в режиме реального времени к новостным каналам и лентам социальных сетей, дополнения выдачи поисковых систем актуальной информацией.

Несмотря на простую идею, внутреннее устройство RAG довольно сложно. Прежде, чем добавить данные в свой ответ, необходимо найти релевантную информацию в базе знаний. Для этого информация хранится в виде векторных представлений, которые позволяют выполнять семантический поиск.

Для этого приходится перефразировать запросы, разбивать их на фрагменты, ранжировать поисковую выдачу и делать много другой алгоритмической работы. Это и есть Retrieval — отдельное искусство «найти нужное дерево в лесу».

Подробнее о RAG читайте в этой статье.

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии0

Подборка вебинаров августа по ML 🗓

📌 22 августа, 16:00 

Как сократить расходы на инференс LLM? Кейс компании «Актион»

Вместе с коллегами из Compressa и «Актион» обсудим способы оптимизации open-source LLM-моделей на своем сервере и преимущества использования облака для инференса LLM. Сравним производительность LLM и стоимость токенов до и после оптимизации. Разберем кейс «Актион» и Compressa по обработке 100 000+ генераций в день всего на одной GPU-карте и узнаем, как удалось сократить расходы на инференс LLM.

Присоединиться онлайн →

📌 29 августа, 16:00 

Production ML: как настроить GPU-ноды в кластерах Kubernetes?

На практическом вебинаре покажем особенности работы с кластерами Kubernetes c GPU, настройку драйверов на GPU-нодах и масштабирование нагрузки в продакшене ML-сервисов. Обсудим практические кейсы использования GPU-нод в кластерах Kubernetes от клиентов Selectel.

Присоединиться онлайн →

Теги:
Всего голосов 8: ↑8 и ↓0+13
Комментарии0

YandexGPT в OpenWebUI

Недавно я решил погонять нейросети от Yandex. До этого момента я активно использовал OpenWebUI для взаимодействия с локальными моделями и моделями от OpenAI. Этот интерфейс оказался весьма удобным и функциональным, его можно легко запустить через Docker или установить с помощью pip.

Для интеграции YandexGPT в OpenWebUI я создал форк популярного проекта LiteLLM, который, кстати, используется в OpenWebUI, и добавил поддержку YandexGPT.

Для тех, кто хотел бы повторить мой опыт, вот краткое руководство:

  1. Клонируем мой репозиторий.

  2. Настраиваем файл конфигурации

Содержимое конфигурационного файла ./litellm/proxy/config_yandex.yml:

model_list: 
  - model_name: yandexgpt-lite
    litellm_params: 
      model: yandex/yandexgpt-lite   
      api_key: AQVN30_PoL8sF6Yz-gzYLcwRV

  - model_name: yandexgpt-pro  
    litellm_params: 
      model: yandex/yandexgpt   
      api_key: AQVN30_PoL8sF6Yz-gzY1cwRV
  1. Запускаем Docker командой:

docker-compose -f docker-compose-yandex.yml up --build

Так же можно без Docker.

  1. Установливаем все необходимые зависимости через pip и запускаем проект напрямую:

cd litellm/litellm/proxy/
YANDEX_FOLDER_ID=<Ваш FolderID> python3 proxy_cli.py --config config.yml

Не забудьте настрить файл конфигурации, указав свои значения для Folder_ID и Token.

Репозиторий проекта можно найти по ссылке.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии2

Пресс‑службы VK сообщила Хабру, что новая умная колонка «VK Капсула Про» с голосовым помощником «Маруся» будет представлена в первой половине осени.

Устройство получило обновлённый внешний вид и мощность звука до 65 Вт.

В колонке «VK Капсула Про» будут реализованы новые возможности управления умным домом, а также встроены датчики температуры, влажности и освещённости. Устройство будет иметь датчик присутствия, который работает на алгоритмах обработки ультразвуковых волн.

Фактически, приобретая новую колонку, пользователи получат базовый умный дом. Кроме того, команда «Маруси» работает над улучшением функциональности голосовых AI‑технологий».

По информации VK, в первом квартале 2024 года пользователи совокупно провели на 50% больше времени, используя голосового помощника в сервисах VK, чем в первом квартале 2023 года. Общий time spent "Маруси" в VK Капсулах вырос на 53% год к году.

Команды «Маруси» и «VK Капсулы» с прошлого года начали объединение в единое направление, которое развивает контентные и рекомендательные системы во всех сервисах VK, искусственный интеллект и умные устройства. В мае были запущены продажи «VK Капсул» в Беларуси, а в июле — новая функциональность: «Маруся» научилась читать статьи из «Дзена».

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Лаборатория искусственного интеллекта «Сбера» совместно с Центром индустрии здоровья «Сбербанка» и Лабораторией рентгенэндоваскулярных методов диагностики и лечения Тюменского кардиологического научного центра — филиала Томского НИМЦ РАН предложили решение, которое позволяет по видеофайлам коронарографии автоматизировать расчёт SYNTAX‑балла — методики оценки тяжести поражения при ишемической болезни сердца.

Система уже работает в информационно-справочном режиме, результат модели искусственного интеллекта (AI) не является медицинским заключением и не заменяет его.

Врачи и пациенты могут загрузить своё исследование на сайт Тюменского кардиологического научного центра. AI‑модель в тестовом режиме рассчитает значение по шкале SYNTAX. Медицинским работникам сервис будет полезен как второе мнение по интерпретации результатов исследования, а пациенты смогут использовать результаты оценки при обращении к врачу за дополнительной консультацией.

Научная работа End-to-end SYNTAX score prediction: benchmark and methods о проведённом исследовании рецензируется на крупной международной конференции по компьютерному зрению WACV 2025.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Представлен бесплатный нейроапскейлер AuraSR-v2 с бустом разрешения любых изображений в восемь раз. Заливаете шакал — получаете качество профессионального фотоаппарата.

Проект работает из браузера, в нём нет рекламы, нет водяных знаков и не требуется кредитов на апскейл.

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии3

В «Яндексе» научили нейросеть YandexART восстанавливать архивные видеозаписи и кинохронику. Эта опция может быть полезна кинокомпаниям, музеям, историкам и другим специалистам для улучшения качества значимых видео и работы с историческим наследием. Например, нейросеть уже восстановила видеохронику из материалов «Мосфильма» и Российского государственного архива кинофотодокументов для нового сериала Кинопоиска «Игры» о подготовке и организации Олимпиады-80.

Благодаря новой возможности YandexART события сорокалетней давности стали доступны современному зрителю в хорошем качестве. Нейросеть помогла добавить на размытый и нечёткий кадр фактуру и недостающие детали. Например, она прорисовала кирпичную кладку на стене и узоры на женском платье, а у машины восстановила фары и поворотники, которые было плохо видно. Также нейросеть увеличила разрешение и резкость и повысила качество видеокадров.

Yandex AI Rendering Technology (YandexART) — диффузионная нейросеть,
которая создаёт и улучшает изображения и анимацию, а также обрабатывает
загруженные фотографии. Разработчики научили модель не «галлюцинировать» для этого проекта. YandexART теперь умеет превращать шумные, размытые и сильно сжатые кадры в контент с высокой детализацией объектов и текстур благодаря поэтапному обучению на материалах низкого качества.

Над восстановлением архивных видео с помощью нейросетевых технологий и компьютерной графики работали команды компьютерного зрения «Яндекса», Yandex Research и «Плюс Студии».

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии2
1
23 ...

Вклад авторов

Работа

Data Scientist
78 вакансий