Все потоки
Поиск
Написать публикацию
Обновить
759.31

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Период
Уровень сложности

ИИ представляет собой экзистенциальную угрозу: 9 тезисов для обсуждения

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров3.2K

9 тезисов о том, почему будущие системы искусственного интеллекта могут уничтожить человечество, и какие меры нужны, чтобы это предотвратить.

1. ИИ отличается от нормальных программ.

Традиционные программы — это написанные людьми инструкции, которые выполняет компьютер. Эти инструкции содержат придуманные людьми алгоритмы. Современные системы ИИ вроде ChatGPT — это нейронные сети: матрицы с миллиардами-триллионами чисел. В принципе, для любого алгоритма, даже ещё неизвестного людям, есть (возможно, очень большая) нейронная сеть, которая его приближённо выполняла бы. Но числа в нейронных сетях и алгоритмы, которые они выполняют, людям непонятны.

Читать и обсудить

«Птица говорун» или интеграция open source LLM с XWiki

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.8K

В предыдущей статье я давал специфические, несколько провокационные советы по работе с XWiki. Сегодня же мы обратимся к актуальным трендам. Если я не забыл выпить свои таблетки, то тема больших языковых моделей (LLM) по-прежнему вызывает большой интерес.

Представим следующую ситуацию: вы трудитесь в небольшой IT-компании, и вам поставили задачу — запустить свою «Confluence с блекджеком и нейросетями».

После недолгих поисков вы остановили свой выбор на OpenLLM — веб-API для работы с большими языковыми моделями, и XWiki — open source аналоге Confluence. Осталось лишь их подружить. И что самое приятное, для решения этой задачи, каких-то специальных навыков нам не понадобится.

Читать далее

NLP: когда машины начинают понимать нас (Часть 3)

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров4.2K

В этой статье мы продолжим изучение NLP и перейдем к более продвинутым темам, которые являются главными для построения современных приложений и моделей в области обработки естественного языка. А также создадим и обучим модели самостоятельно, используя TensorFlow/Keras и PyTorch.

Читать далее

Как мы сделали клиентскую поддержку интернет-магазина действительно умной: опыт внедрения RAG-бота

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров3.5K

Привет! Я — Андрей Богомолов, сооснователь и технический директор GenAI Lab.

Сегодня я расскажу, как мы превратили поддержку клиентов одного интернет-магазина в «умного» помощника. Это не просто бот, а инструмент, который понимает запросы пользователей, отвечает естественно и, самое главное, всегда знает актуальную информацию. Начнём с проблем, с которыми столкнулся наш клиент.

Читать далее

Оценка приложений RAG с помощью RAGA

Время на прочтение8 мин
Количество просмотров2.3K

Фреймворк с метриками и данными, сгенерированными LLM, для оценки производительности конвейера с дополненной генерацией данных.

Читать далее

Топ-5 нейросетей, которые выслушают не хуже психолога

Время на прочтение3 мин
Количество просмотров16K

Обычно мы идем за советом к друзьям, партнеру или психологу. А иногда поговорить вообще не с кем. 

Но есть ИИ, который уже давно не бездушная машина, а вполне себе собеседник. У него всегда найдется на вас время. Рассказываем про нейросети, которым можно выговориться прямо сейчас.

Читать далее

Конец эпохи fashion-дизайнеров? Как ИИ меняет мир моды

Время на прочтение4 мин
Количество просмотров2.6K

Сегодня ИИ применяется почти во всех сферах, и не обошел стороной даже фэшн индустрию. Теперь он не только помогает создавать коллекции дизайнерам, но и подбирает стильные аутфиты простым людям. 

Как нейросетки создают тренды, ищут подделки и меняют ваш гардероб — читайте в статье.

Читать далее

Краткий свод концепций Tensor Flow

Уровень сложностиСредний
Время на прочтение21 мин
Количество просмотров13K

TensorFlow — один из самых мощных и популярных фреймворков для машинного обучения, разработанный компанией Google Brain в 2015 году. 

Пока старички-студенты активно практикуются в самых сложных задачах машинного обучения, новички еще практикуются с освоением практики обучения на TF.

Поэтому мы подготовили гайд с основными концептами этого незаменимого для ML-инженера фреймворка.

Читать далее

Преемственность передовых поколений: как знания превращаются в изделия

Время на прочтение6 мин
Количество просмотров920

 «Эй, за нами Долгопрудный, до сих пор он центр мира», - задиристо поет советско-российская рок-группа «Дюна». В этой фразе есть глубокий скрытый смысл: именно в этом подмосковном городе располагается Физтех-лицей имени П. Л. Капицы, ведущая профильная школа Московской области и одна из топовых по стране. За право обучаться здесь борются школьники со всей России, а также стран ближнего и дальнего зарубежья, но успех ожидает только самых мотивированных и талантливых. А еще лицей не напрасно называется «инноватором»: здесь держат руку на пульсе передовых научных трендов.

Москва не сразу строилась

Всероссийский естественно-научный школьный кластер (ВЕНШК) Физтех-лицея им. П.Л. Капицы— самый крупный в стране школьный комплекс, нацеленный на подготовку будущих технологических лидеров. Технопарк, ядро этого комплекса — уникальный объект ВЕНШК, ключевая платформа по тиражированию легендарной системы Физтеха на уровне школьного образования. Он был построен всего год назад, в сентябре 2023, но в 57 лабораториях и мастерских шести треков, оснащенных самым современным оборудованием, будут ежегодно практиковаться более десяти тысяч учащихся и педагогов из разных регионов нашей страны.

- Самый крупный школьный Технопарк страны был построен при поддержке президента В. В. Путина и губернатора Московской области А. Ю. Воробьева. В основном, в фокусе внимания находится инженерно-исследовательская деятельность, но, учитывая специфику лицея, сильна естественнонаучная компонента, включающая в себя математику, физику, химию, информатику и биологию, - рассказал Андрей Дмитриевич Богданов, исполнительный директор Фонда развития Физтех-школ. - Лаборатории тесно сотрудничают с реальным сектором экономики, в качестве партнеров на наших площадках присутствуют компании «Сбер», «Яндекс», «Тинькофф», ведущие профильные вузы – МГТУ имени Баумана и МФТИ. Ученики инженерных классов нашего лицея должны быть всесторонне образованными и не только «зубрить матан», но и разбираться в гуманитарных технологиях, и в сфере креативных индустрий: у нас множество кружков по дизайну, архитектуре, большая музыкальная студия и киноконцертная площадка.

Читать далее

Продолжение исследования RNN

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров650

С прошлой статьи я внёс несколько изменений:
1. Планировщик был сломан и не изменял скорость. Починил.
2. Остаточное соединение через умножение.
3. WindowedDense для выходной проекции.
4. Добавил clipnorm 1, cutoff_rate 0.4

Как обычно это всё добавляет стабильности и 1% точности.

WindowedDense по неизвестной мне причине добавляет SMR стабильность.

Читать далее

Как у нейросетей работает внимание? Статья про self-attention и cross-attention

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров5.9K

Удивительно, как нейросети похожи на нас. У них тоже есть внимание, и на примере коня на ракете я расскажу, как оно работает!

Читать далее

Как оценить качество LLM модели

Время на прочтение11 мин
Количество просмотров4.3K

Представьте модели LLM размером до более чем 100 миллиардов параметров, каждая из которых мощнее предыдущей. Среди них есть гиганты: Mistral (7 миллиардов), Mixtral (8x7 миллиардов), Llama (70 миллиардов) и колоссальная Falcon (180 миллиардов). Однако существуют и модели наподобие Phi1, Phi1.5 и Falcon 1B, стремящиеся к сравнимому уровню мощности, имея всего от 1 до 4 миллиардов параметров. У каждой модели, и большой, и маленькой, есть одна цель: стать мастером в искусстве языка, превосходно справляться с такими задачами, как резюмирование текстов, ответы на вопросы и распознавание именованных сущностей.

Но во всех этих задачах у всех больших языковых моделей (Large Language Model, LLM) проявляются сильные изъяны:

  • Некоторые промты заставляют LLM создавать мусорные результаты; они называются «промтами джейлбрейкинга».
  • LLM не всегда правильно излагают факты; это явление называется «галлюцинациями».
  • LLM могут вести себя неожиданно, из-за чего потребителям бывает небезопасно ими пользоваться.

Очевидно, что простого обучения LLM недостаточно. Поэтому возникает вопрос: как нам обеспечить уверенность в том, что LLM А (с n параметров) лучше LLM Б (с m параметров)? Или сделать вывод, что LLM А надёжнее, чем LLM Б, на основании исчисляемых, обоснованных наблюдений?

Необходим стандарт для бенчмаркинга LLM, гарантирующий их этическую надёжность и фактическую точность. Хотя было проведено множество исследований бенчмаркинга (например, MMLU, HellaSwag, BBH и так далее), одних лишь исследований недостаточно для надёжного специализированного бенчмаркинга продакшен-систем.
Читать дальше →

Dell PowerEdge R7715

Время на прочтение3 мин
Количество просмотров2.2K

Серверный рынок постоянно развивается, и Dell не отстаёт от трендов. Недавно компания представила PowerEdge R7715 — 2U-сервер на базе процессоров AMD EPYC 9005, который сразу привлёк внимание специалистов по инфраструктуре. В этой статье мы расскажем, почему этот сервер может стать отличным решением для вашего дата-центра.

Читать далее

Ближайшие события

Российские ученые создали оптимальный алгоритм децентрализованной оптимизации для динамических сетей

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров699

Группа российских ученых из МФТИ, Сколтеха и Научно-исследовательского центра искусственного интеллекта Университета Иннополис разработала революционный алгоритм для решения сложной задачи децентрализованной оптимизации. Результаты исследования опубликованы в материалах конференции NeurIPS 2024.

До сих пор в научной литературе отсутствовали оптимальные алгоритмы, а также теоретические оценки минимального количества коммуникаций и вычислений, необходимых для решения задачи децентрализованной оптимизации для негладких функций в динамических сетях.

Читать далее

CAIL: критическая ИИ-грамотность — как отличать хайп от теории

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров512

Недавно запущена академическая инициатива Critical AI Literacy (CAIL) — проект о критической ИИ-грамотности с курсами, событиями и материалами для преподавателей, студентов и практиков. Стартовая страница, описание проекта Radboud University.

Идея CAIL проста: меньше антропоморфизма и рекламных обещаний, больше чётких формулировок, прозрачных методов, обозначенных ограничений и воспроизводимых результатов.

Читать далее

Grok 4 Fast — новая модель от xAI

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98 % и впервые становится доступной всем пользователям без ограничений.

Читать далее

Как научить ИИ-агентов работать с инструментами без ручной разметки

Время на прочтение4 мин
Количество просмотров958

Как сделать так, чтобы ИИ-агент уверенно бронировал рейсы, проверял балансы, собирал ответы из нескольких сервисов — и не упирался в кучу искусственных ограничений? Команда исследователей решила взглянуть на этот вопрос иначе: если мир реальных инструментов слишком хаотичен, почему бы не построить для агента полноценную тренировочную среду — с тысячами функций и строгим контролем каждого шага? Оказалось, что такой виртуальный полигон способен научить модели не только формально вызывать API, но и действовать так, будто она действительно понимает происходящее. Что придумали авторы — в подробностях этой статьи.

Читать далее

Учим ai-агента ориентироваться на местности: кастомный tool на python и overpass (OSM)

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.3K

Привет, Хабр!

Современные AI-агенты уже умеют планировать отпуск, писать код, и совершать покупки в интернете, но поставьте их перед простым вопросом «где лучше снять квартиру рядом с метро и школой» - и они начинают галлюцинировать. Они не понимают, что «5 минут до метро» и «500 метров по прямой через реку» - совершенно разные вещи. В результате пользователь получает красивые, но бесполезные советы

Этот проект покажет, как добавить агенту «глаза» для карты, чтобы он мог реально находить ближайшие кафе около парков, считать расстояние пеших прогулок и показывать результаты прямо на интерактивной карте

Читать далее

Сколько ведущие страны планируют и проинвестировали в полупроводниковую ИИ-инфраструктуру (включая Россию) — сравнение

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров1.8K

Общий объем планируемых инвестиций в ИИ-инфраструктуру к 2030 году достигнет $2.75 трлн, при этом частный капитал ($2.22 трлн) намного превосходит государственные вложения ($530 млрд). Каждая страна выбирает уникальный вектор развития, отражающий национальные приоритеты и геополитическое позиционирование.

В статье посмотрим на запланированные и уже исполненные инвестиции в ИИ-инфру по основным странам (и сравним с РФ).

Читать далее

Ученые научились быстрее находить положение минимума функции, не вычисляя ее значений

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров12K

Российские ученые из МФТИ, Сколтеха и Иннополиса провели теоретическое исследование и компьютерное моделирование новых методов оптимизации, основанных на использовании сравнений значений функции между собой без знания самих значений этой функции и ее производных. Им удалось построить более эффективные алгоритмы, чем традиционные, и открыть обсуждение использования концепции порядковых оракулов в вычислении. Работа опубликована в материалах конференции NeurIPS 2024.

В свежей статье, представленная на конференции NeurIPS 2024, авторы предлагают новые подходы. Они создали оптимизационный алгоритм, который использует порядковый оракул, и предложили способ ускорения этого алгоритма. Исследователи подтвердили теоретическую состоятельность предложенных методов через численные эксперименты, которые продемонстрировали их высокую производительность. 

Читать далее

Вклад авторов