Искусственный интеллект

AI, ANN и иные формы искусственного разума

Статьи Посты Новости Авторы Компании

hukenovs 16 окт в 11:58

Bukva: алфавит русского жестового языка

Простой

7 мин

2.9K

Блог компании SberDevicesИскусственный интеллектОбработка изображений*Машинное обучение*Data Mining*

Всем привет!

Недавно мы анонсировали словарь русского жестового языка (РЖЯ), а в этой статье поговорим про задачу распознавания алфавита РЖЯ, именуемого также дактильным алфавитом или дактилем. Предлагаем ознакомиться с нашей работой, в которой мы представим новый датасет Bukva — первый полноценный видеонабор данных для распознавания дактильной азбуки. Он содержит 3757 видеороликов с более чем 101 видео для каждой буквы дактиля, включая не только статические, но и динамические жесты. В статье расскажем, как мы собрали датасет для решения задачи и какие модели обучили в качестве бейзлайнов. Все данные и код открыты и доступны в репозитории команды.

+53

EddyLan 13 окт в 09:20

ИИ без иллюзий. Развенчивание мифов

Простой

5 мин

31K

Искусственный интеллектМашинное обучение*Natural Language Processing*

Мнение

В своем подкасте я грозился сам почитать статью GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models ученых из Apple и разобраться. Почитал. Разобрался. Забавная статья. Забавная не по содержанию, а по выводам, которые можно сделать, если читать между строк и выйти за границы статьи.

+66

172

Roman_Yankovskiy 3 окт в 21:49

Что не так с ИИ-юристами

Простой

14 мин

10K

Искусственный интеллектЗаконодательство в ITИсследования и прогнозы в IT*

Мнение

Я работаю юристом и преподавателем. За последние полтора года я провел много времени, общаясь с большими языковыми моделями — в первую очередь с GPT и GigaChat. С их помощью я решал самые разные профессиональные задачи; что-то получалось удивительно хорошо, что-то до смешного плохо. Однако в среднем — пока — ни одна из моделей, которыми я пользовался, не способна работать в «автономном» режиме, давая надежные юридические консультации неюристам. Максимум, к которому модели готовы — это работа copilot, «второго пилота», выполняющего базовые задачи по поручению и под контролем человека-специалиста.

Почему так?

+54

100

atomlib 28 сен в 08:21

Чему может научить горилла Коко

Простой

21 мин

12K

Мнение

4 июля 1971 года в зоопарке Сан-Франциско на свет появилась 50-я горилла, которая родилась в неволе. День рождения этой особи совпал с днём независимости США, который американцы отмечают запуском фейерверков. Поэтому обезьяну назвали Ханабико — «дитя фейерверков» по-японски. Мир знает эту удивительную гориллу под именем Коко.

В первый год жизни Коко разлучили с матерью для лечения в больнице зоопарка. Здесь на малыша впервые натолкнулась 24-летняя аспирантка Франсин Паттерсон. Во время лечения Паттерсон научила её американскому жестовому языку. Произошло удивительное, и Коко начала общаться жестами.

До Коко подобные эксперименты уже проводились. Гориллы и шимпанзе способны невероятно точно выражать свои эмоции, показывать радость, смех, разочарование, грусть, печаль. Коко пошла дальше. Несколько часов в день горилла изучала новые жесты. Вскоре в дополнение к обычным просьбам покормить солидный запас изученных жестов помог Коко рассказывать людям о себе.

+75

erbanovanastasia 25 сен в 12:45

Искусственный интеллект — сознание или алгоритм? Проблемы цифровой философии

10 мин

14K

Блог компании SelectelИскусственный интеллектМашинное обучение*Научно-популярноеЧитальный зал

Ретроспектива

Привет, Хабр! Проблема сознания у AI волнует философов, нейробиологов, когнитивистов, ML-специалистов и других. Обычно они делятся на два лагеря: одни поддерживают эту гипотезу, а другие — категорически против. Но ни одни, ни другие так и не нашли консенсуса в данном вопросе. В тексте постараемся сузить поток абстрактности вокруг темы и разобраться, почему и как начали изучать сознание у AI.

Автор: Александра Танюшина, преподаватель МГУ, кандидат философских наук, культурный тренд-аналитик и специалист по цифровой философии.

Читать дальше →

+64

280

stalkermustang 18 сен в 08:00

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

Простой

27 мин

90K

Блог компании Open Data ScienceМашинное обучение*Искусственный интеллектБудущее здесьNatural Language Processing*

Обзор

Последние пару лет развитие языковых нейросетей как будто бы шло по принципу «больше, длиннее, жирнее»: разработчики пытались раздуть свои модели на как можно большее число параметров и прогнать через них максимальный объем тренировочных данных. 12 сентября OpenAI выпустили новую LLM, которая добавляет в это уравнение еще одно измерение для прокачки: теперь можно масштабировать объем «мыслей», который модель будет тратить в процессе своей работы. В этой статье мы разберемся, чему научилась новая GPT o1, и как это повлияет на дальнейшую эволюцию ИИ.

Давайте выясним →

+252

351

lozhnikov 14 сен в 09:04

ЧГК-GPT, или насколько хорош новый ChatGPT o1-preview в спортивном «Что? Где? Когда?»

Простой

17 мин

57K

Обзор

Из песочницы

12 сентября 2024 года OpenAI представила новую модель OpenAI o1-preview - первую модель, которая по утверждению создателей умеет "рассуждать".

Я решил посмотреть, насколько хорошо она умеет отвечать на вопросы из игры "Что? Где? Когда?"

+114

380

stalkermustang 11 сен в 07:55

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Средний

30 мин

53K

Блог компании Open Data ScienceМашинное обучение*Научно-популярноеИскусственный интеллектБудущее здесь

Обзор

ChatGPT вышел уже почти два года назад, а датасаентисты до сих пор никак не могут определиться — являются ли нейросети тварями дрожащими, или всё же мыслить умеют? В этой статье мы попробуем разобраться: а как вообще учёные пытаются подойти к этому вопросу, насколько вероятен здесь успех, и что всё это означает для всех нас как для человечества.

Узнать →

+178

Bright_Translate 8 сен в 12:01

Как я выиграл $2 750 с помощью JavaScript, ИИ и банки WD-40

21 мин

14K

Блог компании RUVDS.comDIY или Сделай самИскусственный интеллектМашинное обучение*Программирование*

Перевод

За последние десять лет я выиграл во многих маркетинговых видео-конкурсах, используя проверенные техники. Но конкретно этот случай стал первым, в котором значительную роль сыграло программирование и инструменты ИИ.

В этой статье я опишу, как с помощью ChatGPT и JavaScript выяснил, что реально могу победить в конкурсе, и как в итоге пришёл к победе.

Читать дальше →

+53

Wonderlove 4 сен в 17:05

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion

Простой

5 мин

23K

Блог компании Timeweb CloudГрафический дизайн*ДизайнИскусственный интеллектБудущее здесь

Обзор

Всем привет!

Flux.1 D — это мощная модель для генерации изображений по текстовому описанию. Меня зовут Вандер, я куратор клуба по нейросети Fooocus и нейро-энтузиаст, и сегодня мы разберемся, почему вам точно стоит обратить внимание на свежеиспеченную Flux.

Разработчики Flux - бывшие создатели Stable Diffusion и Stable Diffusion XL - Робин Ромбах и Андреас Блаттман. Оба выступали за идею, но компания преследовала только коммерческие интересы Как итог - произошел конфликт и ключевые фигуры покинули Stability AI. Недавно ими была создана новая компания The Black Forest Team, которая и представила нам Flux.

Flux основана на 12-миллиардном трансформере и использует инновационный подход, так что достигать высокой производительности и качества изображения возможно даже при запуске на бытовых видеокартах.

Модель очень хорошо следует промпту и распознает текст.

В статье мы посмотрим, как запустить Flux онлайн и локально, а так же на ее возможности.

+61

atselousov 4 сен в 12:00

Как Яндекс создавал новую end2end-модель генерации коротких видео

Сложный

25 мин

4.9K

Блог компании ЯндексРабота с видео*Обработка изображений*Машинное обучение*Искусственный интеллект

Приложение Шедеврум начало использовать новую end2end-модель YandexART (Vi). Она позволяет создавать видео по текстовому запросу и учитывает взаимосвязь между кадрами, делая видео более связными, плавными и реалистичными, чем при использовании предыдущей модели. Предыдущее решение было основано на использовании эвристик для добавления движения камеры, где видео создавалось кадр за кадром с применением модели генерации изображений, что приводило к значительным изменениям в содержании каждого кадра.

В этой статье поделимся нашим опытом разработки первых версий end2end-модели YandexART (Vi):

— расскажем, почему изначально выбрали работу в пиксельном пространстве;

— опишем методы инженерных оптимизаций, которые помогли в обучении моделей;

— обсудим проблемы, с которыми столкнулись в процессе разработки, и как их решали;

— в завершение расскажем, почему в итоге решили отказаться от пиксельного пространства в пользу латентного и поделимся нашими планами на будущее.

И так как на Хабре не принято вставлять гифки и видео до ката, примеры новой модели вас ждут под ним.

Посмотреть примеры

+55

Bright_Translate 1 сен в 12:01

Эй, компьютер, создай-ка мне шрифт

Средний

6 мин

Блог компании RUVDS.comДизайнИскусственный интеллектМашинное обучение*Типографика*

Кейс

Перевод

Это история о том, как я с нуля осваивал создание генеративных моделей МО, попутно обучая компьютер создавать шрифты. Да, настоящие типографские шрифты, состоящие из набора заглавных глифов. Созданная мной модель получает на входе описание шрифта и создаёт на выходе файл с их готовым набором. Назвал я свой проект FontoGen.

Выше вы видите несколько примеров шрифтов, сгенерированных моделью FontoGen.

Ну а дальше я подробно опишу всю историю.

Читать дальше →

+66

atomlib 31 авг в 23:59

3 самых очевидных способа вручную обнаружить текст от большой языковой модели

Простой

12 мин

47K

Мнение

На написание и публикацию этого текста меня побудила необходимость быстро объяснить, как определять текст от больших языковых моделей (БЯМ). Важно, что речь идёт только про выявление очевидных случаев, а не бронебойное детектирование.

В голове инструкция выглядела как три коротких пункта. Списочек немедленно разросся обширным введением, замечаниями и примерами. Грех этой инструкцией не поделиться.

+99

19 августа – 20 октября

RuCode.Финал. Чемпионат по алгоритмическому программированию и ИИ

Москва • Нижний Новгород • Екатеринбург • Ставрополь • Новосибриск • Калининград • Пермь • Владивосток • Чита • Краснорск • Томск • Ижевск • Петрозаводск • Казань • Курск • Тюмень • Волгоград • Уфа • Мурманск • Бишкек • Сочи • Ульяновск • Саратов • Иркутск • Долгопрудный • Онлайн

ru_vds 26 авг в 16:00

Празднуем день рождения на древнем компьютере с BASIC

Простой

10 мин

4.4K

Блог компании RUVDS.comИскусственный интеллектИстория ITПроизводство и разработка электроники*Старое железо

Обзор

Перевод

Этим летом я занимался созданием нового приложения для машины, продажи которой закончились в 1980 году, и которая не была рассчитана на поддержку графики, сети и даже букв в нижнем регистре. Её продавала компания, обанкротившаяся десяток лет назад. Приложение было специально разработано под единственного пользователя — моего отца, которому в позапрошлую пятницу исполнилось семьдесят лет. Представляю вашему вниманию MTS-70:

Фото

Программа MTS-70 была разработана для Radio Shack TRS-80 Model 1 (примерно 1979 год). У неё есть шесть уникальных и очень забавных функций, неинтересных никому, кроме меня и (в идеале) моего отца (инициалы которого, разумеется, MTS):

Чат с Dadbot — инстансом gpt-3.5 с fine-tuning на основе текстовых переписок между мной и отцом на протяжении пятнадцати лет.
Воспроизведение «Happy birthday» (через 500-бодный кассетный вывод данных; этот хак был необходим из-за отсутствия нативной поддержки звука в TRS-80).
Морской прогноз на сегодня, в том числе прогнозы прилива и течений.
Поиск ближайших концертов и мероприятий в Ист-Энде Лонг-Айленда (где живёт мой старик).
Текстовая адвенчурная игра на основе LLM о выживании летом в Ист-Энде, дополненная забавными семейными байками.
Игра в го (на доске 9×9 против достаточно сильного локального игрового движка).

Читать дальше →

+51

Firemoon 22 авг в 12:22

«По вертикали и по горизонтали»: как перенести бумажные сканворды в онлайн, чтобы решать с друзьями на удаленке

9 мин

12K

Блог компании SelectelDIY или Сделай самВеб-разработка*Искусственный интеллектЛогические игры

Несмотря на развитие технологий, журналы с кроссвордами, сканвордами и судоку до сих пор актуальны. Бумажную версию удобно разгадывать или в одиночку, или с людьми, которые непосредственно рядом. Но что делать, если хочется разделить процесс с друзьями, которые находятся далеко? Обратиться к технологиям, конечно.

Как оцифровать сканворд по фотографии? Насколько сложно сделать систему общего доступа? Действительно ли интересно разгадывать бумажные сканворды на электронном устройстве? Ответы на эти и другие вопросы — под катом.

Читать дальше →

+89

PatientZero 21 авг в 14:12

Стала ли AlphaGeometry прорывом в ИИ?

Средний

10 мин

10K

Искусственный интеллектМатематика*Алгоритмы*

Мнение

Перевод

Примерно полгода назад математическое сообщество услышало новость о том, что исследователи DeepMind создали ИИ-систему, решающую геометрические задачи с Международной математической олимпиады на уровне, близком к золотым медалистам ММО. (Эту новость обсуждали в сабреддите \math, см., например, здесь и здесь.) За этими новостями, как часто бывает с новостями о прогрессе ИИ, последовала волна страха и ужаса, усиленная множеством громких газетных статей с картинками (разумеется, сгенерированными ИИ), на которых искусственные мозги решают ужасно сложные уравнения. По коллективной спине математического сообщества побежали мурашки, снова всплыли на поверхность обычные экзистенциальные вопросы о будущем человеческого интеллекта, а Интернет заполнили мемы о грядущем восстании машин.

Я бы хотел взглянуть на эту тему под новым углом. (Предупреждение: возможно, для вас он не будет новым. Если вы имели дело с евклидовой геометрией, понимаете основы линейной алгебры и внимательно читаете журнал Nature, то могли прийти ко всем этим выводам самостоятельно. Но поскольку некоторые критичные аспекты изложены мелким шрифтом (вероятно, намеренно), я всё равно считаю, что их нужно сделать более очевидными.)

Я узнал об этих исследованиях, когда кто-то выложил ссылку на пресс-релиз DeepMind в групповом чате моих друзей, любящих математику. Один мой друг с небольшими нотками паники рассказывал, что какой-то ИИ смог решить какую-то сложную задачу с ММО при помощи рассуждений, состоящих примерно из двухсот логических шагов. Вскоре все в чате начали грустно шутить о своём неизбежном увольнении и безработице.

+56

inetstar 20 авг в 12:00

Как подружить PyTorch и видеокарты AMD с помощью pytorch_dlprim

Средний

8 мин

Блог компании RUVDS.comC++*Open source*Искусственный интеллектМашинное обучение*

Туториал

Когда начинаешь изучать или использовать машинное обучение, то думаешь, как приспособить те устройства, которые есть в наличии, чтобы снизить свои траты на вход. И, в частности, обладатели довольно мощных старых карт AMD (типа AMD Fury), на которых легко идут довольно тяжёлые игры типа Cyberpunk 2077 или Atomic Heart, сталкиваются с тем, что эти GPU бесполезны для PyTorch и других фреймворков машинного обучения. Да и самые современные карты AMD 7900-й серии работают с PyTorch только из под Linux. Также есть редкие карты других брендов, типа Intel Arc или китайские, которые хотелось бы использовать для машинного обучения.

Итак, в этой статье я приведу подход, который в некоторых случаях может помочь. Он сыроват, но других работающих вариантов под PyTorch я не нашёл. Итак, речь пойдёт о проекте израильского разработчика Артёма Бейлиса (Тонких) pytorch_dlprim.

Как сумрачный гений плюсов подключает все железки к DL

+54

myops 16 авг в 13:11

Что не так с ИИ-картинками

24 мин

20K

Блог компании Альфа-БанкДизайнИскусственный интеллект

Мнение

«Китайский мудрец, сидя на берегу реки, сетует на расплодившиеся вокруг технологии», — такой текст я вбила в какую-то из многочисленных нейросетей, генерирующих картинки. Судя по всему, вместо расплодившихся вокруг технологий китайский мудрец случайно получил расплодившиеся ноги.

ИИ, с ним такое бывает.

+53

andreybrylb 9 авг в 11:49

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

Простой

5 мин

57K

Перевод

Недавнее исследование, проведенное группой экспертов из ведущих институтов, выявило существенные недостатки в логических способностях даже самых продвинутых LLM. Статья «Алиса в Стране чудес» демонстрирует, что при решении элементарных логических задач современные языковые модели демонстрируют неожиданно низкую эффективность.

+79

303

farmer_2010 31 июл в 15:16

Мои эксперименты с искусственной жизнью

Простой

8 мин

10K

Искусственный интеллект

Из песочницы

Сегодня я расскажу про свои эксперименты с симуляцией эволюции.

В мире, разделенном на квадратные клетки живут боты. Боты могут заниматься фотосинтезом, смотреть в 8 направлениях вокруг себя, перемещаться, атаковать друг друга и размножаться делением.

За то, что бот будет делать в текущий ход, отвечает геном. При размножении есть шанс 1/4, что новый бот мутирует. При мутации его геном немного изменяется. Если мутация была положительной - бот может оставить больше потомства, таким образом полезные мутации будут приживаться, а вредные - отсеиваться.

+81

2 3 ...

20 21

Искусственный интеллект

Bukva: алфавит русского жестового языка

Новости

ИИ без иллюзий. Развенчивание мифов

Что не так с ИИ-юристами

Чему может научить горилла Коко

Истории

Искусственный интеллект — сознание или алгоритм? Проблемы цифровой философии

о1: почему новая GPT от OpenAI — это не хайп, а переход к новой парадигме в ИИ

ЧГК-GPT, или насколько хорош новый ChatGPT o1-preview в спортивном «Что? Где? Когда?»

Большие и чёрные (ящики): что мы знаем о том, как «думают» нейросети?

Как я выиграл $2 750 с помощью JavaScript, ИИ и банки WD-40

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion

Как Яндекс создавал новую end2end-модель генерации коротких видео

Эй, компьютер, создай-ка мне шрифт

3 самых очевидных способа вручную обнаружить текст от большой языковой модели

Ближайшие события

Празднуем день рождения на древнем компьютере с BASIC

«По вертикали и по горизонтали»: как перенести бумажные сканворды в онлайн, чтобы решать с друзьями на удаленке

Стала ли AlphaGeometry прорывом в ИИ?

Как подружить PyTorch и видеокарты AMD с помощью pytorch_dlprim

Что не так с ИИ-картинками

Ахиллесова пята ИИ: простая задача, обнажившая слабости всех языковых моделей

Мои эксперименты с искусственной жизнью

Вклад авторов