Articles / Bookmarks / Profile of AtmosferaVA / Habr

@AtmosferaVA^{read⁠-⁠only}

User

ProfileArticles1PostsNewsComments26

Shannon Nov 28 2023 at 09:14

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

8 min

105K

Machine learning*Artificial Intelligence

Есть много локальных аналогов ChatGPT, но им не хватает качества, даже 65B модели не могут конкурировать хотя бы с ChatGPT-3.5. И здесь я хочу рассказать про 2 открытые модели, которые всё-таки могут составить такую конкуренцию.

Речь пойдет о OpenChat 7B и DeepSeek Coder. Обе модели за счет размера быстры, можно запускать на CPU, можно запускать локально, можно частично ускорять на GPU (перенося часть слоев на GPU, на сколько хватит видеопамяти) и для такого типа моделей есть графический удобный интерфейс.

И бонусом затронем новую модель для качественного подробного описания фото.

UPD: Добавлена информация для запуска на Windows с ускорением на AMD.

+103

SLY_G Jun 20 2019 at 07:00

Нейросети и глубокое обучение, глава 1: использование нейросетей для распознавания рукописных цифр

56 min

146K

Python*Artificial IntelligenceMachine learning*Programming*

Translation

Примечание

Перед вами – перевод свободной онлайн-книги Майкла Нильсена «Neural Networks and Deep Learning», распространяемой под лицензией Creative Commons Attribution-NonCommercial 3.0 Unported License. Мотивацией к его созданию послужил успешный опыт перевода учебника по программированию, "Выразительный JavaScript". Книга по нейросетям тоже достаточно популярна, на неё активно ссылаются авторы англоязычных статей. Её переводов я не нашёл, за исключением перевода начала первой главы с сокращениями.

Желающие отблагодарить автора книги могут сделать это на её официальной странице, переводом через PayPal или биткоин. Для поддержки переводчика на Хабре есть форма «поддержать автора».

Содержание

Введение

Этот учебник подробно расскажет вам о таких понятиях, как:

Нейросети — прекрасная программная парадигма, созданная под влиянием биологии, и позволяющая компьютеру учиться на основе наблюдений.
Глубокое обучение – мощный набор техник обучения нейросетей.

Нейросети (НС) и глубокое обучение (ГО) на сегодня дают наилучшее решение многих задач из областей распознавания изображений, голоса и обработки естественного языка. Этот учебник научит вас многим ключевым концепциям, лежащим в основе НС и ГО.

Читать дальше →

+36

timonin Nov 19 2023 at 09:23

Fooocus v2 — бесплатный Midjourney у вас на компьютере. Подробная инструкция по установке и использованию нейросети

Easy

10 min

348K

Graphic design*The future is hereArtificial Intelligence

Tutorial

Друзья, всем привет! Сегодня я хочу рассказать вам про самую простую и доступную для понимания нейросеть, которая создает изображения по вашему текстовому описанию. Она называется Fooocus и основана на знаменитой Stable Diffusion XL. Это идеальное решение в качестве вашей первой нейросети, и необходимый инструмент для любого дизайнера или контент мейкера.

Внутри много тяжелых изображений.

+115

219

timonin Nov 26 2023 at 12:45

Fooocus v2: Революция в работе с изображениями — расширение, изменение и персонализация. Все про Input Image в нейросети

Easy

9 min

87K

Graphic design*The future is hereArtificial Intelligence

Tutorial

Друзья, всем привет, в прошлой статье Fooocus v2 — бесплатный Midjourney у вас на компьютере, вы познакомились с рисующей нейросетью которая вполне способна заменить Midjourney, узнали как её установить, как пользоваться, за что отвечают все настройки и как работают режимы, как писать запросы, чтобы нейросеть вас понимала.

Из этой части вы узнаете как с помощью нейросети Fooocus можно дорисовать любое изображение выйдя за его границы, изменить любую деталь на изображении, узнаете как добавить на свою генерацию текст, наложить свое лицо или как создать изображение по вашему референсу. Сегодня я расскажу про раздел Input Image.

Внутри много картинок и гифок.

+41

MarselMM Dec 12 2023 at 12:35

Локальные GPT нейронный сети — устанавливаем на домашнем ПК, запускаем и проверяем на адекватность аналоги ChatGPT

18 min

79K

Machine learning*Artificial Intelligence

From sandbox

Есть много LLM нейронных сетей, создатели которых говорят, что они аналогичны, а может даже лучше ChatGPT версий 3.5 и 4.0. Давайте попробуем протестировать их, установив их на локальный компьютер, чтобы понять, действительно ли они так хороши.

+21

akimovpro Dec 14 2023 at 07:08

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

Medium

27 min

95K

Machine learning*Artificial Intelligence

Review

Translation

AI-хайп, честно говоря, слегка задолбал. Кажется, что все вокруг только и делают, что оптимизируют свою работу с помощью AI и в ус не дуют. Все эти возвышенные презентации про amazing и awesome инновации от людей, которые слабо себе представляют, чем энкодер отличается от декодера и почему трансформеры в нейросетях не сражаются с автоботами, мало того, что набивают оскомину и отнимают время, так еще и погружают в грёзы бизнес-руководителей и создают крайне завышенные ожидания.

Вспоминаю, как на одном обмене опытом со стартапами они чётко делились на 2 группы: первая – с менеджерами про невероятные инновации и всеобщее благоденствие, а вторая – с инженерами, которые с красными глазами рассказывали, что так и не смогли победить галлюцинации, что окно контекста заканчивается очень быстро и что для того, чтобы на нормальном продакшн использовании вся эта магия заработала, нужны огромные инвестиции в инфраструктуру, оркестратор, агенты, векторные базы, кратковременную и долговременную память и так далее. Поэтому хотелось собрать в одном месте понятное руководство и для разработчиков, пробующих LLM-ки для своих задач, и для людей из бизнеса, чтобы погрузить в контекст.

+25

seohive Dec 14 2023 at 14:47

ChatALL — chatGPT, Bard и другие нейронки в одном месте для решения SEO задач

2 min

16K

Internet marketing*Search engine optimization*Artificial Intelligence

Review

Recovery Mode

С каждым днем количество нейросетей и сервисов с ИИ увеличивается. Наиболее популярным в настоящее время является ChatGPT, однако конкуренты не отстают. Каждая нейросеть обладает своими уникальными преимуществами в решении определенных задач. Но есть одно универсальное решение — ChatALL.

ChatALL — это бесплатная программа с открытым исходным кодом, которая может отправлять запросы нескольким ботам с искусственным интеллектом одновременно, помогая находить наилучшие результаты. Это просто браузер с интерфейсом, который дает возможность залогиниться в разных сервисах, а потом отправлять в них запросы.

popkovden Dec 14 2023 at 02:54

Массивы в Kotlin

Easy

17 min

13K

Algorithms*Kotlin*

Review

Я - Денис, Android-разработчик в «Лайв Тайпинге». В этой статье расскажу о массивах. Вы узнаете: как они устроены в памяти компьютера, особенности реализации в разных ЯП, оптимизациях, а также частых вопросах на собеседованиях.

Даже, если у вас большой опыт в разработки с Kotlin, думаю вы найдете что-то новое для себя в этой статье.

Погнали!

kazzand Sep 14 2023 at 14:33

Собираем русскоязычный лонгформер шаг за шагом

8 min

MWS AI corporate blogМТС corporate blogNatural Language Processing*

✏️ Technotext 2023

Привет, меня зовут Андрей Казначеев, я NLP engineer в компании MTS AI. В этой статье я расскажу, как создал лонгформер для русского языка. Все началось с того, что мне подкинули задачу по классификации длинных диалогов. Тексты длинные, а большинство популярных моделей имеют строгое ограничение по длине входной последовательности. Хотелось сделать решение умнее, чем просто побить текст на куски, однако ничего готового для русского языка не нашел. Тогда я задумался, а так ли сложно сделать свою собственную версию лонгформера под русский язык? Оказалось, совсем не сложно.

+38

RunFMe Dec 13 2023 at 10:09

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

Medium

18 min

23K

SberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Review

С момента запуска GigaChat прошло около полугода, и за это время у нас появилось более полутора миллионов пользователей. Они активно используют нейросетевые технологии как в работе, так и для развлечения. От пользователей поступают разнообразные запросы: от просьбы сделать краткую выжимку из текста письма до срочного написания поэмы на день рождения коллеги-тестировщика. Мы всегда учитываем обратную связь, которая помогает нам развиваться и внедрять новые идеи.

За последнее время нами были выпущены новые модели и добавлены новые функциональные возможности в сервис. А теперь мы представляем новую нейросетевую модель, у которой более 29 миллиардов параметров. Она успешно прошла тест на ЕГЭ и показала отличные результаты в сравнении с другими системами. Если вы только начинаете интересоваться новыми технологиями в области искусственного интеллекта, то имейте в виду, именно они в ближайшие годы будут формировать наше с вами будущее и давать преимущество тем, кто ими владеет. Давайте познакомимся с ними поближе.

+46

skulabukhov Dec 5 2023 at 12:02

«Трудности перевода»: как ChatGPT справился с задачей адаптации сложных текстов

6 min

2.6K

Fix Price corporate blogArtificial IntelligenceNatural Language Processing*

Привет, Хабр! Меня зовут Сергей Кулабухов, я занимаюсь внедрением ИИ в бизнес-процессы компании Fix Price. С появлением моделей обработки естественного языка (natural language processing) изменился и подход к реализации подобных задач. Теперь мы не программируем и не обучаем, а просто объясняем, что необходимо сделать.

В этой статье мы затронем тему перевода специфических текстов, таких как описание товара со всеми сокращениями и аббревиатурами, на не менее специфичные языки, такие как арабский или монгольский.

+10

dimasklyarov Dec 9 2023 at 16:31

RAG (Retrieval Augmented Generation) — простое и понятное объяснение

Easy

8 min

183K

Natural Language Processing*

From sandbox

Краткое и понятное описание подхода RAG (Retrieval Augmented Generation) при работе с большими языковыми моделями.

tablum Dec 12 2023 at 10:45

Как быстро выбирать языковые модели (LLM) под свои задачи

Medium

6 min

19K

EXTRACTUM.IO corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Review

✏️ Technotext 2023

Последние полгода я активно занимаюсь разработкой сервисов на базе больших языковых моделей, они же «LLM». Для каждого проекта мне приходится подбирать модель по определенным критериям: языковая поддержка, требования к памяти, типу (instruction-based или completion), скорости генерации и т.п. Первое время я использовал платформу HuggingFace, где ежедневно публикуются около сотни новых моделей. Но кто им пользовался, знает, насколько там неудобный и слабый поиск: даже точные совпадения по названию он иногда не выдаёт. Плюс к этому, приходится тратить достаточно времени, чтобы найти и сравнить модели по нескольким критериям. В этой статье я расскажу, как решил проблему выбора языковых моделей.

+27

murat_apishev Dec 12 2023 at 13:25

О методах позиционного кодирования в Transformer

Hard

10 min

15K

Natural Language Processing*Artificial IntelligenceMachine learning*

Review

Technotext Winner 2023

Обзор методов кодирования позиций токенов в нейросетевых моделях Transformer с упором на обработку длинных текстов. Для тех, кто учит и использует LLM, и для всех интересующихся.

+24

ksotar Dec 8 2023 at 05:04

Свежий Google Gemini, GPT-4 и математика

Medium

10 min

25K

Natural Language Processing*Artificial IntelligenceMachine learning*Mathematics*Semantics*

Review

Итак, Google всё‑таки решилась выпустить в свет языковую модель Gemini не дожидаясь Нового Года, и, конечно, обещая революцию. Она де превосходит все публично доступные модели, и местами превосходит людей. Отдельной её особенностью является мультимодальность (в частности способность работать с изображениями и видео) в почти реалтайм режиме, чему есть довольно впечатляющие демонстрации.

Давайте же сравним её с флагманом OpenAI/Microsoft — GPT-4, на трудном поле математики.

+27

alex_golubev13 Dec 4 2023 at 06:51

Кто такие LLM-агенты и что они умеют?

Medium

24 min

44K

Open Data Science corporate blogMachine learning*Artificial Intelligence

Review

В последнее время большие языковые модели (Large Language Models, LLM) стали невероятно популярными — кажется, их обсуждают везде, от школьных коридоров до Сената США. Сфера LLM растёт бурными темпами, привлекая внимание не только специалистов в области машинного обучения, но и обычных пользователей. Кто-то высказывает массу опасений насчет их дальнейшего развития, а кто-то и вовсе предлагает бомбить дата-центры — и даже в Белом Доме обсуждают будущее моделей. Но неужели текстом можно кому-то навредить? А что если такая модель приобрела бы агентность, смогла создать себе физическую оболочку и полностью ей управлять? Ну, это какая-то фантастика из (не)далёкого будущего, а про агентов нашего времени я расскажу в этой статье. И не переживайте — знание машинного обучения вам не понадобится!

+23

Локальные нейросети. Аналог ChatGPT-3.5 на домашнем ПК: OpenChat 7B превосходящая 70B, DeepSeek для кода уровня ChatGPT

Нейросети и глубокое обучение, глава 1: использование нейросетей для распознавания рукописных цифр

Примечание

Введение

Fooocus v2 — бесплатный Midjourney у вас на компьютере. Подробная инструкция по установке и использованию нейросети

Fooocus v2: Революция в работе с изображениями — расширение, изменение и персонализация. Все про Input Image в нейросети

Локальные GPT нейронный сети — устанавливаем на домашнем ПК, запускаем и проверяем на адекватность аналоги ChatGPT

Раскрывая секреты LLM: руководство по основным понятиям больших языковых моделей без хайпа

ChatALL — chatGPT, Bard и другие нейронки в одном месте для решения SEO задач

Массивы в Kotlin

Собираем русскоязычный лонгформер шаг за шагом

GigaChat Pro. Технические детали, сдача ЕГЭ и сравнение с конкурентами

«Трудности перевода»: как ChatGPT справился с задачей адаптации сложных текстов

RAG (Retrieval Augmented Generation) — простое и понятное объяснение

Как быстро выбирать языковые модели (LLM) под свои задачи

О методах позиционного кодирования в Transformer

Свежий Google Gemini, GPT-4 и математика

Кто такие LLM-агенты и что они умеют?

Information

Specialization