Все потоки
Поиск
Написать публикацию
Обновить
879.01

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Дэвид Бресслер — автор Formula Bot, дополнения для Excel и Google Sheets, которое с помощью ИИ помогает писать формулы и автоматизировать задачи, а также обрабатывать и анализировать данные. Дополнение платное и пользуется популярностью, поэтому приносит Бресслеру десятки тысяч долларов дохода каждый месяц.

На днях Дэвид поделился наблюдением: при общении с клиентами сразу в четырёх случаях подряд ему рассказали, что впервые услышали про Formula Bot от ChatGPT. В твите Бресслер также приводит скриншот общения с ChatGPT, где на вопрос об умных инструментах для Excel большая языковая модель GPT-4o рекомендует продукт Дэвида. При этом БЯМ поставила встроенный в Excel майкрософтовский инструмент Ideas лишь вторым пунктом списка рекомендаций.

Formula Bot занимает первые строчки разнообразных рейтингов ИИ-дополнений для Excel, поэтому удивительного мало. Подобный ответ GPT-4o выдаёт не всегда. Сам Дэвид связывает проявление эффектами с чем-то уровня SEO.

Как утверждает Бресслер, ChatGPT не приводит много клиентов, в лучшем случае это дополнительные 10 %. Впрочем, в комментариях к твитам его всё равно просят научить приёмам поисковой оптимизации для ChatGPT.

Возможно, поисковая оптимизация для включения в текстовый датасет предобучения БЯМ когда-нибудь действительно станет востребованной.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Сайт с вакансиями правительства Соединённого Королевства Великобритании и Северной Ирландии опубликовал вакансию инженера промптинга больших языковых моделей. Трудоустроят специалиста в AI Safety Institute — организации, которую открыли на Саммите по безопасности ИИ 2023 года. Институт занимается оценкой продвинутых систем искусственного интеллекта, разрабатывает инструменты для контроля государства в этой сфере и помогает обмену информацией.

От специалиста ждут навыков в достижении нужного поведения БЯМ с помощью составления текстовых промптов, хорошее понимание БЯМ и их архитектуры, а также владение различными технологиями промптинга (chain of thought, ReAct, автоматическая генерация промптов и так далее). Нужно уметь оценивать БЯМ по таким метрикам, как BLEU, ROUGE и разнообразным бенчмаркам способности размышлять и писать код.

За плечами у соискателя должен быть реальный практический опыт построения приложений, которые полагаются на БЯМ для ответов на вопросы, генерации текста, помощи с кодом и других схожих задач. В вакансии также просят уметь писать на Python и вообще программировать. Будущий инженер промптов должен обладать хорошими навыками коммуникации, анализа показателей производительности моделей и их визуализации.

Размер суммарной финансовой компенсации составляет от 65 до 135 тыс. фунтов стерлингов.

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

На русскоязычной платформе LLM Arena появилась языковая модель YandexGPT Experimental. «Яндекс» пока не анонсировала её, а на платформе отмечен статус In training. Вероятно, компания работает над новой более мощной версией YandexGPT.

Теги:
Всего голосов 3: ↑3 и ↓0+8
Комментарии0

История IT: как появилась первая нейросеть

Фрэнк Розенблатт. Источник.
Фрэнк Розенблатт. Источник.

В 2024 году никого уже не удивить возможностями ИИ — люди используют его в обыденной жизни. Но еще несколько десятилетий назад нейросети оставались загадкой для человечества, а термин «искусственный интеллект» приравнивался к научной фантастике. Как все изменилось? Откуда появились нейросети и кто их придумал? Ответим на эти вопросы сегодня в посте. 

С чего все зародилось 

Сегодня мы не будет уходить далеко в историю, вместо этого рассмотрим основные события, которые повлияли на появление нейросетей. 

В 1943 году Уоррен Мак-Каллок и Уолтер Питтс опубликовали исследование «Логическое исчисление идей, относящихся к нервной активности». В нем вывели математическую модель и поделились, как она может выполнять логические операции. По сути, искусственная нейронная сеть приравнивалась к упрощенной модели естественного нейрона.

В 1957 году Фрэнк Розенблатт разработал компьютерную модель восприятия информации мозгом «Перцептрон», основанную на исследованиях Мак-Каллока и Питтса. Впоследствии ее можно было использовать в виде электронной машины «Марк-1». 

Перцептрон стал одной из первых моделей нейронных сетей, которая могла обучаться на данных. Он состоит из сенсоров, ассоциативных и реагирующих элементов.

На сегодня модель устарела, однако на ее примере можно изучить основные понятия и простые алгоритмы обучения нейронных сетей.

С остальными событиями, которые повлияли на развитие нейросетей, можно ознакомиться по ссылке.

Теги:
Всего голосов 6: ↑6 и ↓0+11
Комментарии0

Представлен проект MathGPT Pro для для студентов и школьников. Нейросеть бесплатно решит и пояснит большинство математических задач. ИИ принимает примеры в любом формате: текст, фото и даже голосовое описание — выбирайте подходящий и получайте детальное решение.

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии2

28 мая 2020 года на сайте препринтов arXiv.org опубликовали легендарную научную статью «Language Models are Few-Shot Learners», более известную как «статья про GPT-3». Позднее OpenAI улучшила большую языковую модель до GPT-3.5 и построила на ней сервис ChatGPT, чем привлекла 100 миллионов пользователей и миллиарды долларов инвестиций.

У оригинальной статьи про GPT-3 всего 31 автор. Некто Арун Пракаш составил элементарную статистику, как развернулась судьба этих людей в дальнейшем.

@arunprakashml

Как оказалось, за 4 года в OpenAI осталось менее половины оригинального состава авторов той статьи. Четверть из них ушли в Anthropic, ещё 29 % — в другие компании.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии1

Через 10 минут ждем вас на трансляции вебинара «Как построить MLOps-конвейер для CV-проекта в облаке» ☁️

Расскажем об особенностях реализации ML-проектов и поделимся кейсами применения CV в продакшене. Также вы узнаете, как развернуть и задеплоить CV-модель на платформе Neoflex Dognauts в облаке Selectel и подобрать для него инфраструктуру.

Присоединяйтесь!

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии0

Эксперт спрогнозировал развитие ИИ от OpenAI:

• конец 2024 года — релиз самой умной нейронки GPT-Next. Она превзойдёт всё предыдущие модели.

• 2025 год — рутиной больше не занимаемся. Её заберут ИИ-агенты.

• 2026 год, который изменит ВСЁ. OpenAI создаст нейросеть на уровне человека — AGI (осознающая себя система, обладающая умственными способностями). Люди перестанут быть царями планеты, AGI мгновенно заменит сотни профессий.

• 2027 год — ASI (система, превосходящая человеческие возможности) зародится с вероятностью 70%. ИИ доучит себя сам и отодвинет людей от решения глобальных проблем.

• 2028 год — в этот год испарятся все болезни. ASI создаст нанороботов, убивающих все вирусы и микробы.

• 2029 год — появится Skynet. Сверхинтеллект возьмёт под контроль мир, а прогресс полетит со скоростью света.

Теги:
Всего голосов 7: ↑3 и ↓4+3
Комментарии19

На GitHub представлен открытый проект Album AI для управления с помощью ИИ фотографиями на домашнем ПК.

Бесплатный инструмент организует все фото, альбомы и добавляет необходимую метаинформацию. Под капотом у проекта нейросеть ChatGPT-4o-mini.

Для сортировки изображений Album AI использует распознавание лиц. Из всех фотографий на ПК создаётся локальная база данных PgSQL без доступа извне.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

В контакт‑центре «Сбер ЕАптеки» заработал сервис «Цифровой помощник фармацевта», созданный Центром индустрии здоровья «Сбера» на базе нейросетевой модели GigaChat.

ИИ‑сервис позволяет клиентам «Сбер ЕАптеки» получать поддержку по фармацевтическим вопросам, включая подбор препаратов, график приёма, противопоказания и побочные эффекты. Цифровой помощник автоматически формирует ответ на запрос, а оператор контакт‑центра оценивает качество сформированного ответа и после проверки отправляет его клиенту.

В «Сбере» пояснили, что подключение ИИ‑сервиса позволило сократить время ожидания ответа фармацевта, а также снизило нагрузку на сотрудников контакт‑центра.

«Внедрение GigaChat API в работу компаний индустрии здоровья Сбера — важнейшее направление в развитии навыков искусственного интеллекта, разрабатываемых в нашем центре. Мы уверены, что использование больших языковых моделей является самым перспективным способом улучшить качество и скорость нашей работы на благо человека», — пояснил директор Центра индустрии здоровья «Сбера» Сергей Жданов.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

DeepLearning совместно с Meta* выпустили базовый курс по составлению промптов для языковых моделей Llama. Изучение материала займёт около часа, а сам курс доступен бесплатно на платформе Coursera. В социальных сетях отмечают, что обычно за такое обучение на других площадках надо платить.

Meta Platforms*, а также принадлежащие ей социальные сети Facebook** и Instagram**:
* — признана экстремистской организацией, её деятельность в России запрещена
** — запрещены в России

Теги:
Всего голосов 4: ↑4 и ↓0+8
Комментарии0

На днях OpenAI выпустила GPT-4o-mini — новую флагманскую модель для дешёвого сегмента, так сказать.

  • Говорят, работает «почти как» GPT-4o, а иногда даже круче GPT-4.

  • Почти в 3 раза дешевле GPT-3.5-turbo.

  • Размер контекста 128k токенов, против 16k у GPT-3.5-turbo.

Конечно я сразу побежал переводить на эту модель свою читалку новостей.

Если кратко подвести итоги, то это крутая замена GPT-3.5-turbo. У меня получилось сходу, не меняя промпты, заменить двух LLM агентов на одного и суммарно удешевить работу читалки раз в 5 без потери качества.

Но потом я полез тюнить промпт, чтобы сделать ещё круче, и начал сталкиваться с нюансами. Например, с замыливанием контекста и проблемами с большими запросами. Об этом можно прочитать у меня в блоге.

Теги:
Всего голосов 3: ↑1 и ↓2+1
Комментарии2

Разработчики из команды «Яндекса» объявили о запуске новой удобной функции голосового помощника «Алисы».

Пользователям с особенностями речи теперь будет проще общаться с «Алисой». Она стала лучше распознавать голосовые запросы людей с речевыми нарушениями — например, с заиканием, ДЦП, последствиями инсульта или травмы. Это стало возможным благодаря дообучению нейросети.

В процессе обучения «Алиса» проанализировала сотни тысяч аудиозаписей. Их подготовили люди с особенностями речи, которых «Яндекс» привлёк к открытому тестированию качества распознавания речи «Алисой», в том числе это было сделано с помощью партнёрских организаций.

В итоге разрыв между точностью распознавания обычной речи и с искажениями сократился в среднем на 20%. Качество распознавания оценивали по метрике Word Error Rate (WER), которая позволяет определить долю неправильно понятых слов.

В проекте «Яндекса» по доработке алгоритмов «Алисы» участвовали некоммерческие организации «Центр лечебной педагогики», «Живи сейчас», «Жизненный путь», «Весна», «Перспектива», «Лучшие друзья» и другие. Их подопечные и другие участники тестирования записали более 855 тыс. скороговорок и фрагментов обычной речи. Всего получилось более 900 часов аудиоматериалов. Классифицировать примеры по типам нарушений помогли специалисты‑дефектологи из МГПУ. В общей сложности в проекте участвовали более 300 человек.

Публикация на Хабре: «Как "Яндекс" учит "Алису" понимать пользователей с особенностями речи».

Теги:
Всего голосов 2: ↑2 и ↓0+4
Комментарии0

Ближайшие события

«Крёстная мать искусственного интеллекта» Фей-Фей Ли основала новый стартап-«единорог» World Labs. Его стоимость превысила $1 млрд.

В World Labs намерены использовать человеческую обработку визуальных данных, чтобы сделать ИИ способным к продвинутым рассуждениям.

Ли занималась вопросами компьютерного зрения и возглавила разработку ImageNet, обширной визуальной базы данных. В настоящее время она консультирует рабочую группу Белого дома по ИИ.

«World Labs разрабатывает модель, которая понимает трёхмерный физический мир; по сути, она видит размеры объектов, где находятся вещи и что они делают», — рассказал анонимный венчурный капиталист, знакомый с работой Ли. 

В апрельском выступлении на Ted Ли объяснила, что её стартап работает над алгоритмами, способными реалистично экстраполировать изображения и текст в трёхмерную среду и действовать на основе этих прогнозов. Она назвала это «пространственным интеллектом». Подобные алгоритмы могут применяться в робототехнике, приложениях AR и VR, а также компьютерного зрения. 

У стартапа прошло два раунда финансирования, а в ходе последнего привлекли около $100 млн. World Labs поддерживают фонды Andreessen Horowitz и Radical Ventures.

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии0

«Яндекс Музыка» обучила систему персональных рекомендаций сотням редких жанров, чтобы пользователи могли открывать для себя новые музыкальные направления и артистов, сообщили Хабру в компании «Яндекс».

Также сервис представил интерактивную digital-карту, где можно подробнее изучить новые жанры, включая мумбатон, скиффл и кранк, и больше узнать про экспертов, которые над ними работали.

Музыкальные направления определила редакция сервиса, а к отбору треков редких жанров были привлечены эксперты индустрии. Среди них были автор подкаста и книги «Планетроника. Популярная история электронной музыки» Ник Завриев, автор лекций и книг о классической музыке, лауреат премии «Просветитель» Ляля Кандаурова, музыкальный журналист Антон Вагин, композитор и преподаватель Berklee College of Music Николай Мищенко и другие профильные музыкальные специалисты.

На основе рекомендаций экспертов для каждого жанра была создана ML‑разметка, по которой команда технологий «Яндекс Музыки» обучила специальную нейронную сеть. Теперь «Моя волна» может подбирать музыку из всего каталога сервиса по сотням музыкальных жанров. При этом умная система рекомендаций остаётся персональной — например, из всего жанра «готический метал» она выберет те треки, которые с наибольшей вероятностью понравятся слушателю. Поэтому «Моя волна» по каждому отдельному жанру будет отличаться у разных пользователей.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии1

Пользователь Reddit поделился системным промптом для Sonnet 3.5, который использует для генерации кода. Он отмечает, что с ним нейросеть создаёт качественные фрагменты кода с минимальным количеством ошибок и разбирается в сложных фрагментах. Автор использует его для работы со стеком CSS, JavaScript, React, Tailwind, Node.js и Hugo, но список технологий можно отредактировать.

Системные промпты в Claude можно задавать сразу для всего чата, чтобы каждый вопрос к языковой модели учитывал базовый запрос. Для этого нужен доступ через API или премиальная подписка в веб‑версии.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Эксперты выяснили, что сотрудники Tesla целенаправленно уделяют больше внимания совершенствованию алгоритма автопилота сервиса помощи водителю Full Self‑Driving (FSD) на тех маршрутах, по которым перемещается глава компании Илон Маск или наиболее влиятельные видеоблогеры, освещающие беспилотную электромобильную тематику в США.

Руководители профильных подразделений, которые занимаются аннотацией данных, настаивают на более тщательной обработке данных, собранных на определённых маршрутах и от электромобилей определённых лиц. Это может создавать у клиентов компании ложное представление о реальных возможностях бортовой автоматики электромобилей Tesla из‑за предвзятости разработчиков системы.

Ранее пользователь показал, что электромобиль Tesla с обновлённой прошивкой V12.3.6 автопилота Full Self-Driving действует не по правилам, объезжает пробку по правой полосе и вклинивается в левый ряд через сплошную линию. Также Tesla в режиме FSD не заметила поезд и не замедлилась перед переездом с опущенным шлагбаумом. Водитель в последний момент успел нажать на тормоз и свернул с дороги на обочину.

Tesla считает, что работа бета-версии системы помощи водителю FSD полностью безопасна при выполнении всех рекомендаций компании: руки на руле и внимательно смотреть на дорожную обстановку. В компании уточнили, что ответственность за использование FSD остаётся за водителем, который должен всегда быть внимательным и быть готовым взять на себя управление.

Теги:
Всего голосов 1: ↑1 и ↓0+2
Комментарии3

В пятой серии «Антологии Технологий» специалисты «Яндекс Такси» рассказали, как устроена служба поддержки сервиса, как там работают умные технологии, которые позволяют поддержке отвечать практически на любое обращение за несколько минут.

Каждую неделю в поддержку «Яндекс Такси» поступает около 1,5 млн обращений от пассажиров и партнёров сервиса. Это очень малая часть от всех поездок «Яндекс Такси», но весьма ощутимая в масштабах одного отдела техподдержки компании.

Специалисты «Яндекс Такси» раскрыли детали распределения самых запутанных обращений по темам и попытки призывать для ответа на них нужных специалистов.

В компании рассказали, что на многие обращения безошибочно отвечает искусственный интеллект, большинство авторов обращений даже считают, что с пользователями разговаривает обычный человек.

В «Яндекс Такси» признали, что техподдержка сервиса не может оперативно работать без умных алгоритмов, а определённую роль и всё больше более востребованную роль в сервисе играет фирменная нейросеть.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

«Сбер» и оператор майнинговых дата‑центров BitRiver объявили о стратегическом сотрудничестве. Стороны намерены совместно реализовывать проекты цифровой трансформации.

В рамках партнёрских проектов основное внимание компаний будет уделено применению передовых практик создания и развития цифровых технологий в обработке данных и сопровождению компьютерных систем и смежных направлениях. Кроме того, стороны намерены развивать искусственный интеллект и снижать издержки на обслуживание за счёт применения инноваций.

В рамках сотрудничества «Сбера» и BitRiver речь пойдет о реализации совместных образовательных и популяризирующих проектов в области цифровых технологий и искусственного интеллекта.

«Формирование цифровой экономики — это вопрос национальной безопасности и независимости страны. Сегодня производительность труда напрямую связана с цифровизацией и использованием ИИ. Совместная реализация проектов с крупнейшим российским банком позволит BitRiver сделать ещё один шаг на пути к усилению цифрового и финансового суверенитета России», — отметил владелец и генеральный директор BitRiver Игорь Рунец.

По итогам первого полугодия 2024 года Россия подтвердила второе место на мировом рынке майнинга и опередила США по его темпам роста.

20 апреля 2022 года Минфин США ввел санкции против дата-центра для майнинга криптовалюты BitRiver. Штаб-квартира компании находилась в Швейцарии, а все производственные и вычислительные мощности компании размещены в иркутском Братске.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

В открытом доступе появился литкод по машинному обучению с задачами по линейной алгебре и deep learning.

Разработчики проекта поделили задачи по уровням сложности, а ещё там можно узнать правильный ответ и почитать подробнейший разбор каждого таска.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии1

Вклад авторов