Почти все мы пользуемся социальными сетями. А почему бы и не пользоваться? Они ведь предоставляют так много возможностей! Взять ту же сеть ВКонтакте: можно пообщаться с друзьями, поделиться с подписчиками фотографиями только что сделанного крабового салата, посмотреть видео с котом соседа, вырастить огурцы на виртуальной ферме в каком-нибудь приложении… Сказка! Ой, а кто это в друзья добавляется?
Пользователь
Как реализовать символьную языковую рекуррентную нейронную сеть
В одном своём гисте Андрей Карпаты сделал кое-что впечатляющее. Чуть больше чем в 100 строках кода на Python — без тяжеловесных фреймворков для машинного обучения — он прописал довольно полную реализацию языковой модели для обучения символьно-ориентированных рекуррентных нейросетей (РНС). Гист включает полное обучение методом обратного распространения с оптимизацией Adagrad. Подробности — к старту флагманского курса по Data Science.
Бесплатные системы управления проектами: 15 систем, 70 функций
Привет! Продолжаю стабильно выходить на связь с Хабром раз в несколько лет =) Благо есть повод – пару месяцев назад перешел в новую контору, где снова надо было наладить работу целого отдела сотрудников на удаленке, который раньше как-то справлялся без системы управления задачами.
И потому я решил повторно провести рисерч на эту тему, чтобы посмотреть как изменился рынок и не появилось ли на нем что-то новенькое и интересное.
А изменилось на российском рынке систем управления проектами за минувший год чуть менее, чем всё. И это помимо того, что успело измениться еще раньше. Мы с командой перепробовали десятки новых и старых систем. Искали бесплатные и доступные в РФ. Составили себе подборку из 15 систем, и для особо нетерпеливых – свели в одну таблицу по возможностям бесплатных версий.
Понимают ли нейронные модели грамматику человеческого языка?
В лингвистике принято считать, что основным свойством языковой способности человека является возможность определять, насколько грамматически корректно предложение. Подобные суждения говорящих о правильности языкового высказывания получили название «оценок грамматичности/ приемлемости». Лингвисты используют суждения о грамматичности для исследования синтаксической структуры предложений.
Как нарисовать барашка или прикладное нейрохудожество
Потихоньку начнём разговор для понимания приёмов и возможностей нейросетевых инструментов. Они с нами навсегда, неплохо бы разобраться в самом начале.
Для примера выберем, конечно же, девчонок.
Prompth: full frontal, stunning blonde, (perfect face), suggestive, bright smile, gorgeous hair, squat,
Negative prompt: paint, anime, cartoon, art,drawing,3d render, digital painting, body out of frame, ((deformed)), (cross–eyed), (closed eyes), blurry, (bad anatomy), ugly, disfigured, ((poorly drawn face)), (mutation), (mutated), (extra limbs), (bad body)
Перед началом генерирования у вас есть много разных настроек и возможностей . Например запрос может быть и отрицательным - negative prompt, фактически запрет, очень мощный инструмент, в котором описывается чего бы вы не хотели видеть в результате. Как правило туда включают все заклинания призванные исключить появление в результирующем изображении шестипалых рук и множества других мутаций, которые только отнимают ценное время. Рисовать правильные пальцы - это вообще больное место нейросетей, поэтому их часто и не видно в сгенерированных изображениях. Впрочем, продолжим.
На картинке ниже результат работы нейросети от компании StableDiffusion, а именно запрос к парсеру img2img — инструменту, который служит для доработки уже имеющегося изображения. В качестве исходника, был взят мем из сети Интернет. Текст запроса:
Релиз Invoke AI 2.0 — интерфейса и инструментария для Stable Diffusion (win/linux/mac)
Привет всем! Сегодня состоялся релиз InvokeAI 2.0: A Stable Diffusion Toolkit, проекта, цель которого — предоставить энтузиастам и профессионалам набор надежных инструментов для создания и редактирования изображений с помощью нейросети. InvokeAI требует всего ~3,5 Гб видеопамяти для создания изображений 512x768 пикселей (и еще меньше для 512х512), и совместим с Windows/Linux/Mac с M1 и M2.
Как создать переводчик, который переводит лучше, чем Google Translate
Помню, как еще в школе на Basic я писал программу-переводчик. И это было то время, когда ты сам составлял словарь, зашивал перевод каждого слова, а затем разбивал строки на слова и переводил каждое слово в отдельности. В то время я, конечно же, не мог и представить, как сильно продвинутся технологии, и программы-переводчики станут в основе использовать механизмы глубокого обучения с архитектурой трансформера и блоками внимания.
В этот раз я решил окунуться немного в прошлое и сделать то, что хорошо сделать тогда у меня не получилось.
Диффузионные Нейросети — самый актуальный подход к генерации изображений
Метод обратной диффузии поистине является самым нашумевшим в этом году методом генерации изображений нейросетями. Его используют: DALLE 2, Midjourney, imagen и другие актуальные модели 2022 года.
В данной статье мы подробно изучим, что под капотом самых современных генеративных моделей и даже напишем небольшую свою.
Под катом будет много кода, программирования, математики, в общем — всё, как вы любите.
Первый нейросетевой переводчик для эрзянского языка
Эрзянский язык из финно-угорской семьи – один из официальных в республике Мордовия, и на нём говорят сотни тысяч людей, но для него до сих пор не было почти никаких технологий машинного перевода, кроме простых словарей.
Я попробовал создать первую нейросеть, способную переводить с эрзянского на русский (и с натяжкой ещё на 10 языков) и обратно не только слова, но и целые предложения.
Пока её качество оставляет желать лучшего, но пробовать пользоваться уже можно.
Как я собирал для этого тексты и обучал модели – под катом.
Как гражданину РФ открыть ИП и ТОО в Казахстане?
Продолжение про релокацию бизнеса на постсоветском пространстве. К плюсам релокации в РК можно отнести многие факторы, среди которых:
Загадка появления ранних сверхмассивных чёрных дыр решена
Загадка появления ранних сверхмассивных чёрных дыр много лет ставила в тупик астрономов. И вот, наконец, мы поняли, откуда они появились.
Всего на 0,15 квадратных градусах небосвода можно найти множество участков, содержащих большое количество галактик, группирующихся в скопления и филаменты, между которыми есть лишь пустоты, или войды. Каждая светлая точка на этом снимке – это сверхмассивная чёрная дыра (да, их настолько много). Этот участок космоса назвали ECDFS, поскольку ранее его рассматривали в рамках проекта Extended Chandra Deep Field South – это новый взгляд в рентгеновском диапазоне на изученный ранее участок.
Что, если бы мы могли заглянуть в прошлое любого человека с нашей планеты и увидеть их в возрасте 5 лет? Можно ожидать, что мы увидим различные варианты их характеристик: некоторые будут выше, некоторые – ниже, некоторые тяжелее, некоторые – легче, у некоторых будут ступни крупнее, у некоторых – меньше, и т.п. Однако логично будет предположить, что все они будут похожи на пятилетних людей. Вы бы удивились, увидев кого-то похожего на подростка, на молодого человека или на взрослого. Тогда у вас возник бы закономерный вопрос: отражает ли то, что вы увидели, реальность.
Искусственный интеллект. Следующий уровень в «игре»
Здравствуйте Хабр. Просматривал ленту вечерком и наткнулся на очередную статью про ИИ:
Что мы действительно (не)знаем о наличии сознания у сверхбольших нейросетей?
И, честно говоря, в очередной раз в статье пытаются ответить на вопрос - который, по-моему, ИМХО уже давно имеет ответ. Ну не интересно читать об одном и тоже каждый раз. Это как пройденный уровень в игре. И главное - есть следующий уровень. Интересный. Т.е. есть следующий вопрос. Обсуждение, которого и хотелось бы услышать. Начал писать комментарий. Но по мере увеличения количества текста понял - опубликую его отдельной статьёй. Потому как в ответах на изначальный топик, он просто потеряется. А мне хотелось бы увидеть обсуждение. Какие на сегодня есть подвижки в вопросе, который я подымаю, как следующий цепочке вопросов по проблеме создания ИИ. Может мой взгляд кардинально не верен.
Повторюсь - статья ниже это коммент, который писался без всякой коррекции, выглядит сумбурно, поэтому строго не судите. Я надеюсь, что всё же смог донести свою мысль.
Яндекс выложил в опенсорс YDB
YDB решает задачи в одной из самых критичных областей — позволяет создавать интерактивные приложения, которые можно быстро масштабировать по нагрузке и по объёму данных. Мы разрабатывали её, исходя из ключевых требований к сервисам Яндекса. Во-первых, это катастрофоустойчивость, то есть возможность продолжить работу без деградации при отключении одного из дата-центров. Во-вторых, это масштабируемость на десятки тысяч серверов на чтение и на запись. В-третьих, это строгая консистентность данных.
В посте я расскажу об истории развития технологий баз данных, о том, зачем использовать YDB, как её применяют текущие пользователи и какие плюсы для всех несёт выход в опенсорс. А во второй половине поста поговорим о разных вариантах развёртывания.
Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек
В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.
Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:
- Снизили размер модели в 2 раза;
- Научили наши модели делать паузы;
- Добавили один высококачественный голос (и бесконечное число случайных);
- Ускорили наши модели где-то примерно в 10 раз (!);
- Упаковали всех спикеров одного языка в одну модель;
- Наши модели теперь могут принимать на вход даже целые абзацы текста;
- Добавили функции контроля скорости и высоты речи через SSML;
- Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
- Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;
Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).
Попробовать модель как обычно можно в нашем репозитории и в колабе.
Риски обесточивания Чернобыльской АЭС
Вчера (9.03) Чернобыльская АЭС была обесточена из-за повреждения ЛЭП. Как я говорил ранее, комментируя происходящее вокруг ядерных объектов Украины сейчас, наиболее опасный объект в Чернобылськой зоне – это хранилище отработавшего ядерного топлива (ХОЯТ) с 20 тыс. топливных сборок. А потенциальный аварийный сценарий – условно фукусимский. Когда выброс радиации начался из-за перегрева топлива, охлаждение которого было нарушено из-за обесточивания станции. Но насколько тут этот сценарий реален?
Пластырь на желудке: устранение дефектов ЖКТ без применения швов
За последние десятилетия мы стали свидетелями стремительного развития медицинских технологий. Корень мандрагоры в качестве анестезии или трепанация черепа для выведения зла из организма уже давно ушли в прошлое и стали не более чем страшилками для студентов-медиков. Однако, несмотря на весь этот прогресс, подавляющее большинство инвазивных методов лечения сопряжено с послеоперационным наложением швов на участок, где проводился надрез. В современной медицине имеется множество разновидностей шовного материала: нерассасывающиеся нити (полиэстеры, полипропилены, шелк, капрон и т.д.), условно рассасывающиеся нити (шелк, капрон и т.д.) и даже стальные скобы. Однако, какой бы из материалов не использовался, наложение швов связано с определенными рисками для здоровья пациента, особенно если шов расположен на внутренних органах. Группа ученых из Массачусетского технологического института (США) предложили альтернативу швам в виде разработанного ими же хирургического пластыря. Из чего сделан пластырь, как он показал себя по сравнению с классическими швами, и сможет ли он их полностью заменить? Ответы на эти вопросы мы найдем в докладе ученых. Поехали.
Оформляем README-файл профиля на GitHub
Летом 2020 года GitHub позволила пользователям создавать персональные README-файлы и с их помощью кастомизировать свои профили. Сама платформа при создании подобного файла предлагает уже готовый шаблон, в который можно вписать свои данные. Но о какой кастомизации может идти речь, если у всех будут одинаково оформленные профили? За почти два года сообщество придумало множество различных способов выделиться и особенно оформить свою страницу на GitHub.
Retrieval Transformer в картинках
Резюме: Новые языковые модели могут быть намного меньше GPT-3, но при этом достигать сравнимых результатов благодаря использованию запросов к базе данных или поиску информации в Интернете. Ключевая идея заключается в том, что построение все более и более крупных моделей — не единственный способ повысить качество.
Последние несколько лет ознаменовались появлением больших языковых моделей (Large Language Models, LLM) — моделей машинного обучения, которые способствовали быстрому развитию сферы машинной обработки и генерации естественного языка. Некоторые из основных вех развития области с 2017 года включают в себя:
Отправка данных из *.XLSX в Google Sheets
Всем привет! Я обычный пользователь MS Excel и Google Docs, любитель-программист на VBA, App Script и JavaScript.
30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?
Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.
Information
- Rating
- 2,026-th
- Registered
- Activity