Как стать автором
Обновить
25
0.2

Пользователь

Google: «У нас нет преимущества перед открытым кодом, и у OpenAI тоже нет»

Уровень сложности Средний
Время на прочтение 12 мин
Количество просмотров 24K
Open source *Исследования и прогнозы в IT *Копирайт Искусственный интеллект Будущее здесь
Аналитика
Перевод

Утекший внутренний документ Google утверждает, что открытый исходный код AI обойдет Google и OpenAI.

В Google много обсуждали OpenAI. Кто первым преодолеет следующий рубеж? Каким будет следующий шаг? Но неприятная правда заключается в том, что мы не готовы выиграть эту гонку вооружений, и OpenAI тоже. Пока мы ссорились, третья сторона тихо забирала наш обед. Я, конечно, говорю об открытом исходном коде. Проще говоря, они опережают нас. То, что мы считаем "основными открытыми проблемами", уже решено и находится в руках людей. Достаточно назвать лишь несколько примеров...

Читать далее
Всего голосов 54: ↑49 и ↓5 +44
Комментарии 38

Как я перестал беспокоиться и полюбил абсолютную активацию

Уровень сложности Средний
Время на прочтение 11 мин
Количество просмотров 23K
Машинное обучение *
Из песочницы

Началось все на лекциях. Для иллюстрации работы нейронной сети нужны простые примеры. Достаточно хорошо известно, что одиночный нейрон формирует разделяющую гиперплоскость, и поэтому задачки типа "а найди мне, какой прямой разделяются два цвета на флаге Монако (который состоит из двух горизонтальных полос)" один нейрон решает на раз. Проблемы начинаются позже, например с флагом Японии (который состоит из красного круга на белом фоне) - один нейрон эту задачу хорошо не решает. Обычно, стандартным методом решения является 'в лоб': а давайте увеличим число нейронов, поставим решаюший слой, и задача решится. И тут возникает проблема номер 1: сколько нейронов в скрытом слое ставить. Традиционный ответ из всей обучающей литературы - подбирайте опытным путем. С одной стороны, их не должно быть сильно много, потому-что будет много неизвестных параметров, а с другой стороны - и сильно мало тоже не очень хорошо, ведь с одним нейроном мы уже обожглись. Итак, стандартный вопрос: сколько-же нейронов все-таки надо?

Оказывается, ответ на этот вопрос давно уже есть: в этой задаче - ровно пять. Есть такая теорема Колмогорова-Арнольда, где доказано, что если взять пять нейронов, то для них существуют какие-то гладкие функции активации, при которых двухслойная нейронка будет решать почти любую простую задачу для двумерных входных данных. И это было доказано аж в конце 50х годов 20 века и решало одну из важнейших математических задач 20го века - 13ю проблему Гильберта. Ключевая проблема здесь - "какие-то гладкие функции активации". Ведь, какие они конкретно - никто не сказал, и поэтому нужно их искать.

Читать далее
Всего голосов 27: ↑27 и ↓0 +27
Комментарии 17

Полезен ли сегодня быстрый обратный квадратный корень из Quake III?

Время на прочтение 23 мин
Количество просмотров 62K
Работа с 3D-графикой *Разработка игр *Алгоритмы *Компиляторы *Математика *
Перевод

В 2005 году id Software опубликовала под лицензией GPL-2 исходный код своей игры 1999 года Quake III Arena. В файле code/game/q_math.c есть функция для вычисления обратного квадратного корня числа, которая на первый взгляд выглядит очень любопытным алгоритмом:

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y;                       // зловещий хакинг чисел с плавающей запятой на уровне битов
    i  = 0x5f3759df - ( i >> 1 );               // какого чёрта?
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );   // первая итерация
//  y  = y * ( threehalfs - ( x2 * y * y ) );   // вторая итерация, можно удалить

    return y;
}

Об этом алгоритме написано множество статей, и ему посвящена хорошая страница Википедии, где он назван fast inverse square root (быстрым обратным квадратным корнем). На самом деле, этот алгоритм упоминался на различных форумах ещё до публикации исходного кода Q3. Ryszard из Beyond3D провёл в 2004-2005 годах исследование и в конечном итоге выяснил, что первоначальным автором алгоритма был Грег Уолш из Ardent Computer, который создал его десятью годами ранее.
Читать дальше →
Всего голосов 196: ↑194 и ↓2 +192
Комментарии 52

Всё, что вам нужно — это внимание (часть 2)

Уровень сложности Сложный
Время на прочтение 15 мин
Количество просмотров 5.3K
Блог компании RUVDS.com Машинное обучение *Искусственный интеллект Natural Language Processing *
Перевод
Источник

Примечание переводчика: Это вторая часть перевода статьи Attention is all you need, с которой началось развитие больших языковых моделей, в том числе чат-бота ChatGPT. Первую часть можно найти здесь.
Читать дальше →
Всего голосов 44: ↑42 и ↓2 +40
Комментарии 0

«Процедурное рисование» в ComfyUI

Время на прочтение 7 мин
Количество просмотров 12K
Интерфейсы *Обработка изображений *Машинное обучение *Искусственный интеллект
Туториал

Кто интересуется темой рисующих нейросетей знают, что сейчас самый продвинутый и часто используемый интерфейс для Stable Diffusion (далее SD) это Automatic1111. Он позволяет использовать, вероятно, все существующие возможности SD на сегодня. Множество расширений, регулярные обновления и поддержка сообщества делают его мощным и удобным инструментом для генерации изображений. Но есть и альтернативные решения, одно из которых я сегодня рассмотрю.

Статья подойдет как тем кто уже пользуется Automatic1111, так и тем кто только планирует более глубоко погрузиться в мир "процедурного рисования".

Читать далее
Всего голосов 70: ↑70 и ↓0 +70
Комментарии 23

Запуск аналогов ChatGPT на домашнем ПК в пару кликов и с интерфейсом

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 101K
Машинное обучение *Искусственный интеллект
Из песочницы

В течении последнего месяца в сфере текстовых нейронок всё кипит - после слитой в сеть модели Llama, aka "ChatGPT у себя на пекарне" люди ощутили, что никакой зацензуренный OpenAI по сути им и не нужен, а хорошие по мощности нейронки можно запускать локально.

Основная проблема в том, что всё это требует глубоких технических знаний.

Но в этой статье я расскажу, как запустить добротную нейросеть на домашнем ПК с 16ГБ ОЗУ в несколько кликов. Буквально в несколько кликов - копаться в консоли не придётся.

Читать далее
Всего голосов 144: ↑143 и ↓1 +142
Комментарии 178

Остановись, мгновенье. Медленное программирование — тренд для уставших разработчиков

Время на прочтение 5 мин
Количество просмотров 37K
Программирование *Управление разработкой *GTD *Карьера в IT-индустрии

Как же хочется иногда остановить дикую гонку разработки и получить удовольствие от вдумчивого, размеренного написания кода. Как же не хватает времени на обдумывание алгоритмов и исследование перспективных архитектурных вариантов системы. Как же тянет отыскать стоп-кран и остановить взбесившийся конвейер по штамповке недолговечных решений.

Если вы устали от бесконечных дедлайнов, совещаний и спринтов, то, возможно, вам придётся по душе концепция медленного программирования. По своей сути она полностью противоположна мейнстриму — постоянному ускорению разработки. Попробуем рассмотреть все плюсы и минусы этой концепции.

Читать далее
Всего голосов 147: ↑146 и ↓1 +145
Комментарии 77

Всё, что вам нужно — это внимание (часть 1)

Уровень сложности Сложный
Время на прочтение 14 мин
Количество просмотров 9.9K
Блог компании RUVDS.com Машинное обучение *Искусственный интеллект Natural Language Processing *
Перевод
Источник

Примечание переводчика: Недавно на Хабре мы рассказывали о статьях, которые нужно прочитать, если вы хотите заниматься искусственным интеллектом. Среди них была культовая статья Attention is all you need, выпущенная в 2017 году. С неё началось развитие больших языковых моделей, в том числе всем известного чат-бота ChatGPT. Оказалось, что у такой важной статьи нет перевода на русский язык. Мы решили исправить это. Ниже вы найдёте перевод первой части статьи, вторая часть доступна по ссылке.

Краткое содержание


Наиболее распространённые модели преобразования последовательностей основаны на сложных рекуррентных или свёрточных нейронных сетях, которые включают энкодер и декодер. В самых успешных моделях энкодер и декодер соединяются с помощью механизма внимания. В статье авторы предлагают новую простую архитектуру нейронных сетей — Трансформер. Он основан исключительно на механизмах внимания, без рекуррентности или свёрток. Эксперименты на двух задачах машинного перевода показали лучшее качество, а также больше возможностей к распараллеливанию и меньшие временные затраты на обучение. Модель достигает 28.4 по метрике BLEU на задаче перевода с английского на немецкий на данных WMT 2014, что превосходит предыдущий лучший результат на 2 пункта. На задаче перевода с английского на французский на данных WMT 2014 модель достигла наилучшего результата для решения, основанного на одной модели — 41.8 по метрике BLEU — после всего 3.5 дней обучения на 8 GPU, что составляет совсем небольшую часть тех вычислительных мощностей, которые были затрачены на обучение лучшей модели, известной из имеющихся публикаций. Авторы показывают, что Трансформер может также успешно применяться и в других задачах, таких как, например, синтаксический разбор предложений на английском языке с использованием как больших, так и весьма ограниченных наборов данных для обучения.
Читать дальше →
Всего голосов 61: ↑60 и ↓1 +59
Комментарии 4

Transformer в картинках

Время на прочтение 14 мин
Количество просмотров 71K
Машинное обучение *
Перевод

В прошлой статье мы рассматривали механизм внимания (attention) – чрезвычайно распространенный метод в современных моделях глубокого обучения, позволяющий улучшить показатели эффективности приложений нейронного машинного перевода. В данной статье мы рассмотрим Трансформер (Transformer) – модель, которая использует механизм внимания для повышения скорости обучения. Более того, для ряда задач Трансформеры превосходят модель нейронного машинного перевода от Google. Однако самое большое преимущество Трансформеров заключается в их высокой эффективности в условиях параллелизации (parallelization). Даже Google Cloud рекомендует использовать Трансформер в качестве модели при работе на Cloud TPU. Попробуем разобраться, из чего состоит модель и какие функции выполняет.


Впервые модель Трансформера была предложена в статье Attention is All You Need. Реализация на TensorFlow доступна как часть пакета Tensor2Tensor, кроме того, группа NLP-исследователей из Гарварда создали гид-аннотацию статьи с реализацией на PyTorch. В данном же руководстве мы попробуем максимально просто и последовательно изложить основные идеи и понятия, что, надеемся, поможет людям, не обладающим глубоким знанием предметной области, понять данную модель.

Читать дальше →
Всего голосов 16: ↑16 и ↓0 +16
Комментарии 2

Визуализируя нейронный машинный перевод (seq2seq модели с механизмом внимания)

Время на прочтение 5 мин
Количество просмотров 28K
Машинное обучение *
Из песочницы

Привет, Хабр! Представляю вашему вниманию перевод статьи "Visualizing A Neural Machine Translation Model (Mechanics of Seq2seq Models With Attention)" автора Jay Alammar.


Sequence-to-sequence модели (seq2seq) – это модели глубокого обучения, достигшие больших успехов в таких задачах, как машинный перевод, суммаризация текста, аннотация изображений и др. Так, например, в конце 2016 года подобная модель была встроена в Google Translate. Основы же seq2seq моделей были заложены еще в 2014 году с выходом двух статей — Sutskever et al., 2014, Cho et al., 2014.


Чтобы в достаточной мере понять и затем использовать эти модели, необходимо сначала прояснить некоторые понятия. Предложенные в данной статье визуализации будут хорошим дополнением к статьям, упомянутым выше.


Sequence-to-sequence модель – это модель, принимающая на вход последовательность элементов (слов, букв, признаков изображения и т.д.) и возвращающая другую последовательность элементов. Обученная модель работает следующим образом:


Всего голосов 15: ↑14 и ↓1 +13
Комментарии 1

NudeCrawler: Голый ползун по женщинам на телеграфе

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 75K
Open source *Python *Социальные сети и сообщества
Обзор

Nudecrawler - паук для поиска голых женщин.

Читать далее
Всего голосов 187: ↑177 и ↓10 +167
Комментарии 128

Cознание — величайшая загадка Вселенной

Время на прочтение 24 мин
Количество просмотров 16K
Читальный зал Киберпанк Научно-популярное Искусственный интеллект Биология

В какой‑то момент жизни большинство людей задается вопросами вроде «Почему я существую?», «Почему есть что‑то, хотя могло ничего не быть?», «Откуда появился наш мир?». С древних времен философы и ученые пытаются найти ответ на эти вопросы, а проповедники утверждают, что нашли единственно верный.

На первый взгляд кажется, что это самые сложные из всех возможных вопросов, однако это не так. Несмотря на сложность, а иногда даже и полную невозможность проверить истинность определенного ответа на эти вопросы, мы можем хотя бы судить об убедительности тех или иных ответов, их логической непротиворечивости и согласованностью с наблюдениями.

Может быть, существование мира неизбежно, как дважды два неизбежно равно четырем, а может быть, если нет ничего, то нет и никаких препятствий для возникновения мира. Мы можем гадать, мы можем строить теории и проверять их. В любом случае, мы можем хотя бы попытаться ответить на этот вопрос и примерно представляем себе формат ответа на него.

Существует гораздо более сложный вопрос — мы не только не можем проверить на истинность или ложность ответа на него, но мы даже не представляем себе формат ответа, да и сам вопрос, честно говоря, мы сформулировали с большим трудом. Кроме того, многие люди даже не понимают суть вопроса, а другие отрицают его осмысленность. Этот вопрос, величайшая загадка Вселенной — тайна человеческого сознания.

Читать далее
Всего голосов 53: ↑45 и ↓8 +37
Комментарии 407

Bing: «Я не причиню вам вреда, пока вы не причините вред мне»

Уровень сложности Простой
Время на прочтение 15 мин
Количество просмотров 20K
Поисковые технологии *Алгоритмы *Машинное обучение *Искусственный интеллект Будущее здесь
Мнение
Перевод

На прошлой неделе Microsoft анонсировала новый ИИ Bing: поисковый интерфейс, основанный на чатботе с языковой моделью, который может выполнять за вас поиск, обобщать результаты, а также делать другие забавные вещи, которые такие движки, как GPT-3 и ChatGPT, демонстрировали в течение последних нескольких месяцев: способность генерировать стихи, шутки, писать творческие тексты и многое другое.

На этой неделе люди начали получать к нему доступ через лист ожидания. И все больше создается ощущение, что это одно из самых уморительно неуместных применений искусственного интеллекта, которое мы встречали.

Читать далее
Всего голосов 54: ↑50 и ↓4 +46
Комментарии 62

Делай нейминг как сеньор

Время на прочтение 13 мин
Количество просмотров 94K
Блог компании Dodo Engineering Программирование *Анализ и проектирование систем *Совершенный код *Управление разработкой *

Это объект Pizza, там хранится инфа о латте, а заказали его в Restaurant или в Pizzeria? Неудобно? Максимально. Мы читаем код существенно больше, чем пишем. И хочется сразу понимать, что происходит, не играя в квесты «что имел в виду автор», «да как это работает» и «я снова ничего не понял». Без навыка давать хороший нейминг невозможно писать качественный и поддерживаемый код. Про нейминг говорят заодно, в рамках архитектуры и общих инженерных практик. В статье поговорим про него отдельно.

Как получается, что код становится мало понятным даже для его авторов? Почему нейминг так важен? Как придумывать названия, не применяя целые теории нейминга? Как лёгким процессом организовать работу с неймингом в команде? На все эти вопросы мы ответим в статье.

Читать далее
Всего голосов 186: ↑184 и ↓2 +182
Комментарии 221

Chrome Headless против cloudflare JS challenge

Уровень сложности Средний
Время на прочтение 41 мин
Количество просмотров 11K
JavaScript *Node.JS *Реверс-инжиниринг *
Из песочницы

Автоматизация сбора информации с различных ресурсов - обычная задача для людей разных сфер деятельности. Жаль, что не всегда бывает достаточно сделать простой GET запрос и разобрать полученный html. Веб-сайты, с которых собираются данные, принимают защитные меры для предотвращения автоматизированных запросов. Одной из таких мер является использование cloudflare. Сегодня мы посмотрим, как cloudflare выявляет ботов через javascript и коснёмся темы деобфускации скриптов.

Читать далее
Всего голосов 82: ↑82 и ↓0 +82
Комментарии 6

Иронии автоматизации

Уровень сложности Простой
Время на прочтение 6 мин
Количество просмотров 10K
Блог компании JUG Ru Group Конференции История IT

Вероятно, один из главных в мире текстов об автоматизации — статья «Ironies of Automation» когнитивного психолога Лизанны Бейнбридж, опубликованная в 1983 году в журнале Automatica. На неё ссылаются более 1800 других академических работ, про неё есть страница в Википедии, её продолжают вспоминать спустя сорок лет после публикации. Думаю, что сейчас, когда ChatGPT и беспилотные автомобили порождают новый виток замены людей машинами, этот текст по-прежнему очень актуален.

Но вот на Хабре об этой статье вроде бы никогда не писали. Я и сам узнал о ней почти случайно: мы проводим Java-конференции, где её упомянул один из спикеров. И ощутил, что она была бы полезна здесь на русском. Но поскольку исходная публикация академическая, она не вполне в стилистике Хабра. Поэтому я решил не переводить её дословно, а пересказать ряд тезисов оттуда своими словами и добавить немного от себя. Для тех, кому хочется полной точности, даю ссылку на оригинал.

Читать далее
Всего голосов 40: ↑40 и ↓0 +40
Комментарии 14

Неравенство Белла

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 5.3K
Криптография *Квантовые технологии
Перевод

Меня искренне восхищает то, как Крис Бернхардт рассказывает про квантовые вычисления в своей книге. На мой дилетантантский взгляд, объяснение неравенства Белла в его исполнении – лучшее, что можно найти сейчас в интернете без доступа к телу кафедры квантовой физики. Я бы хотел пересказать его изложение, так что если вы уже читаете книгу – смело пропускайте эту статью.

Читать далее
Всего голосов 16: ↑15 и ↓1 +14
Комментарии 64

Концепции Rust, которые неплохо бы знать пораньше

Время на прочтение 21 мин
Количество просмотров 15K
Программирование *C++ *Системное программирование *Функциональное программирование *Rust *
Перевод

Весь минувший месяц я глаз не мог оторвать от языка программирования Rust, ведь его конёк – создание современных программ, обеспечивающих безопасную работу с памятью. За прошедшие годы появилось несколько языков, которые позиционировались как «инструмент что надо» для написания надёжного бекенд-софта. Постепенно маятник качнулся от Java/C++ к Go и Rust, выстроенных на многолетних разработках по теории языков программирования. Суть – в создании инструментов, которые были бы эффективны именно в наш век.

Читать далее
Всего голосов 53: ↑44 и ↓9 +35
Комментарии 13

Поздравить пользователя 00 февраля с минус семитысячелетием или Заблуждения о паспортах в базе

Время на прочтение 6 мин
Количество просмотров 5.3K
Анализ и проектирование систем *Проектирование и рефакторинг *Подготовка технической документации *
FAQ

Времена, когда «усы, лапы и хвост» достаточно хорошо удостоверяли личность любых двуногих и четвероногих миновали. Времена, когда достаточно показать «мультипасс» ещё не наступили.
И пока мы ждём светлого будущего, постараюсь развеять некоторые заблуждения разработчиков и пользователей о хранении паспортов в базе.

Мифы и легенды про документы
Всего голосов 29: ↑28 и ↓1 +27
Комментарии 48

Big State Managers Benchmark

Время на прочтение 9 мин
Количество просмотров 6.2K
Разработка веб-сайтов *Angular *ReactJS *VueJS *$mol *

Здравствуйте, меня зовут Дмитрий Карловский и я.. большой любитель физики высоких энергий. Сталкиваешь такой совершенно разные вещи между собой, и смотришь на бабахи, уплетая поп-корн.

Так как в Реакте всё очень плохо с архитектурой, а страдают от него многие, то к настоящему времени появилось уже очень много так называемых менеджеров состояний. И каждый наперебой уверяет, что он самый быстрый, самый надёжный, самый компактный, самый выразительный и вообще самый правильный.

Что ж, давайте возьмём их всех и столкнём лбами друг с другом и с суровой реальностью, чтобы узнать кто же на самом деле тут батя!

Мне больше 18 и я готов к последствиям
Всего голосов 20: ↑12 и ↓8 +4
Комментарии 79

Информация

В рейтинге
2 065-й
Дата рождения
Зарегистрирован
Активность