Articles / Bookmarks / Profile of BjanG / Habr

BjanG @BjanG

User

Profile Publications Comments 2Bookmarks 171

lock87 Aug 28 2023 at 21:33

Теневое правление Илона Маска

Easy

29 min

23K

KTS corporate blogBiography of geeksInterview

Reportage

Translation

Перевод фрагмента статьи из newyorker.com, где собраны множество реплик коллег и знакомых Илона Маска о его детстве, карьерном пути и влиянии на современную политику.

+25

174

JulliaShulga Nov 23 2023 at 13:11

Все, что нужно знать для разработки с использованием LLM

Medium

11 min

29K

Machine learning*Artificial Intelligence

Translation

Цель данной статьи — простым языком объяснить ключевые технологии, необходимые для начала разработки приложений на основе LLM. Oна подойдёт как и разработчикам, так и специалистам по машинному обучению, у которых есть базовое понимание концепций и желание заглянуть поглубже. Также я прикрепил множество полезных ссылок для дальнейшего изучения. Давайте начинать!

+13

CyberexTech Nov 23 2023 at 11:01

Нейросеть мне в помощь или как я сделал телеграм бота, который умеет переводить песни

Easy

14 min

13K

Timeweb Cloud corporate blogPython*Artificial Intelligence

Case

Однажды, когда я искал эффективное решение для преобразования речи в текст (транскрибации), чтобы применить его в своем проекте умной колонки, обнаружил интересное решение под названием Whisper от широко известной компании Open AI. К сожалению, Whisper не подошел для реализации в моем проекте по «аппаратным» причинам, но его функционал отпечатался в моей душе. Прошло время и меня посетила идея: «Почему бы не разработать телеграмм бота, куда бы пользователь мог отправлять аудиофайл, а в ответ получал текстовую расшифровку и перевод (песни) на родной язык». В этой статье я расскажу о реализации данной идеи и Whisper в этом проекте займет одну из ключевых функций.

Читать дальше →

+30

Sber Oct 19 2023 at 09:15

Посторонись, Copilot: подборка разнообразных AI-инструментов для разработчиков

Easy

4 min

34K

Сбер corporate blogProgramming*Machine learning*Artificial Intelligence

Review

За пределами всем известного GitHub Copilot лежит огромный мир полезных приложений для программистов, и каждую неделю в нем появляется что-нибудь новенькое. В этом посте мы расскажем об этих инструментах — как полноценных конкурентах продукта GitHub, так и более специфических плагинах, а также о нашей собственной разработке в этом направлении.

+30

PatientZero Sep 1 2022 at 15:27

4,2 гигабайта, или как нарисовать что угодно

9 min

43K

Machine learning*Graphic design*Artificial Intelligence

Translation

В нашем мире мы можем сделать всё, что захотим. Всё что угодно.

— Боб Росс, The Joy Of Painting, сезон 29, эпизод 1

Однажды, когда я наблюдал за ярким закатом в Сиэтле, внезапно включилось моё воображение. Потусторонний оттенок неба пробудил воспоминания о чём-то из научной фантастики. Дымчатый оранжево-сиреневый завораживал.

Я представил огромный инопланетный объект, висящий в горящем оранжевом небе над давно покинутым Сиэтлом, здания которого покрыты зарослями.

Тем же вечером я за несколько часов создал вот такое изображение:

Простите за низкое разрешение — к сожалению, у моего GPU всего 12 ГБ памяти.

Поскольку очевидно, что я талантливый художник, имеющий за плечами буквально десятки минут опыта, мне захотелось поделиться тем, как я создал данный шедевр.

Читать дальше →

+160

boris-the-blade Dec 29 2022 at 17:35

Как я засунул Stable Diffusion в IPhone

7 min

6.7K

QIWI corporate blogDevelopment for iOS*Image processing*Machine learning*Artificial Intelligence

Translation

Каждый год выпускают новый iPhone, который, судя по заявлениям, быстрее и лучше прошлого по всем параметрам. И да, эти новые модели компьютерного зрения и новые датчики изображений могут использовать возможности телефона по максимуму. Однако и десять лет назад на iPhone можно было делать хорошие снимки. Такие улучшения оказываются инкрементными.

Инкрементные запросы требуют только инкрементных улучшений. Впрочем, раз в несколько лет появляются программы, которые едва шевелятся даже на самых мощных вычислительных устройствах. Однако эти новые программы с новыми возможностями настолько великолепны, что люди готовы смириться со страданиями.

В последний раз такое происходило с глубокими нейронными сетями, а до этого — с 3D-графикой. Наверно, сейчас настал третий раз. На самом деле, я настолько в этом уверен, что создал приложение, чтобы подтвердить свою точку зрения.

Читать дальше →

+31

guinmoon Oct 10 2023 at 21:30

LLaMA 2, RWKV, Santacoder и другие LLM на iOS

Medium

11 min

8.1K

Development for iOS*Development for MacOS*Machine learning*Artificial Intelligence

Однажды я решил изучить язык Swift и разработать свое первое приложение для iOS. Для этого я решил создать реальный проект, который заключался в оптимизации нашумевшего LLaMA.cpp под iOS. Я поставил перед собой задачу обеспечить запуск 3B и 7B моделей на iPhone 12 Pro с приемлемой скоростью. Под «приемлемой» скоростью я имею в виду такую, чтобы пользователь не успевал заскучать, читая предсказанный текст, пока генерируется новая часть. Что из этого получилось (и какие трудности были при реализации) читайте в статье.

+21

olzeykan Sep 26 2023 at 18:56

Топ 10 deepnude нейросетей 2023 года

5 min

645K

Image processing*Machine learning*Artificial Intelligence

Review

DeepNude — это технология, использующая нейросети для создания изображений обнаженных тел на основе одетых фотографий или видео. Суть этой технологии заключается в том, чтобы "снять" одежду с изображения человека с помощью искусственного интеллекта и показать, как, предположительно, выглядит тело человека под одеждой.

Итак, в данной статье поговорим о пикантных и для некоторых людей непристойных темах, которые больше всего интересуют наше общество - обнаженное тело. Сделаем обзор таких сервисов как: Deepnude .ai, Deepfake.com, DeepSwap.ai, SoulGen и прочих.

+85

SimsiGenerativeBot Sep 27 2023 at 09:51

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети

11 min

8.4K

Open source*Entertaining tasksPython*Machine learning*Artificial Intelligence

From sandbox

Многие люди, когда либо имевшие дело с нейронными сетями, наверняка задумывались, можно ли написать нейросеть, которая сама будет создавать нейросети для решения каких-либо задач. Так вот в этом цикле статей я решил реализовать это. Одним из этапов алгоритма будет генерирование нейросети из списка слоёв. В связи с некоторыми ограничениями, накладываемыми методами реализации (о которых будет сказано в следующих частях, когда мы начнём объединять код из этой статьи с RL ʕ⊙ᴥ⊙ʔ ), входные данные для генератора будут представлены в виде строки случайной длины, содержащей упорядоченный набор слоёв с их параметрами. Генерировать сеть будем для задачи классификации картинок (разобьём это пугало первым).

О реализации на python+pytorch читать тут

alizar Sep 11 2023 at 12:00

ИИ-агенты с саморефлексией. LLM на своём сервере

Medium

8 min

9.3K

RUVDS.com corporate blogOpen source*Machine learning*Popular scienceArtificial Intelligence

Review

Недавно мы обсуждали ИИ-агентов, способных найти решение для произвольных задач и улучшать его до бесконечности. Предполагается, что в будущем множество автономных ИИ-агентов смогут наладить коммуникацию между собой и сформировать коллективный интеллект. Сейчас это одна из самых актуальных тем исследований. Появились даже специальные платформы для разработки и тестирования агентов, такие как SuperAGI.

Один из интересных аспектов обучения ИИ-агентов — внедрение любопытства и саморефлексии, самоанализа. Это позволяет лучше адаптироваться к изменениям среды, обращая внимание на новые и потенциально важные явления вокруг. Примерно тем же занимается человеческий мозг (гиппокамп) во время сна, прокручивая воспоминания за день и оценивая их важность/новизну для долговременного хранения или удаления из памяти.

Читать дальше →

+38

wildboar47 Sep 20 2023 at 17:13

Кентавры и киборги: как консультанты BCG стали решать задачи на 25% быстрее с помощью ИИ

Medium

9 min

2.3K

Machine learning*Research and forecasts in IT*Artificial Intelligence

Case

Translation

Многие спрашивают, действительно ли искусственный интеллект со временем так сильно повлияет на подход к выполнению работы? Мы провели исследование, которое убедительно доказывает, что ответ на этот вопрос "ДА".

В течение последних нескольких месяцев я был частью команды социологов, работающих с Boston Consulting Group. Вместе с ними мы провели крупнейший эксперимент по будущему профессиональной деятельности в век искусственного интеллекта. Сегодня выходит наш первый рабочий отчет. В нем есть масса важных и полезных нюансов, но сначала я хочу озвучить вам его основную мысль: для 18 различных задач, отобранных в качестве реальных образцов работы, выполняемой в элитной консалтинговой компании, консультанты, использующие ChatGPT-4, оказались значительно эффективнее тех, кто его не использовал, по всем показателям.

Rai220 Jan 24 2023 at 16:59

Переносим свою картину мира в чат-бота на базе GPT-3

4 min

47K

Machine learning*Artificial Intelligence

Tutorial

Думаю, все уже наслышаны о потрясающих возможностях ChatGPT и GPT-3, многие уже вдоволь наигрались с ними, а новые стартапы на их основе льются на нас каждый проливным дождём! Возможности ChatGPT в решении некоторых текстовых задач потрясают, порой кажется, что имеешь дело с настоящим разумом.

У меня возникла идея - что если попробовать доучить сеть так, чтобы она имитировала картину мира определенного человека? (Да, снова Черное Зеркало). Классический подход с pre-prompt для этого не подходит, так как хочется заложить в сеть побольше знаний (а также реально поменять веса связей), поэтому будем использовать fine-tune (дообучение на небольшом датасете и небольшом числе итераций). Такая опция доступна пользователям openAI за небольшую плату ($0.5-1 в моих примерах).

В этой статье я покажу как можно обучить GPT-3 (в версии davinchi-003) на своей картине мира и засунуть её внутрь телеграм-бота, потратив на всё всего несколько долларов.

Код бота доступен в репозитарии.

+41

CodeDroidX Sep 12 2023 at 16:00

Визуальное RPG с долговременной памятью, генерируемое из 3 нейросетей и LLamы

Easy

17 min

14K

RUVDS.com corporate blogPython*Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

Языковые модели (NLP) сейчас активно развиваются и находят себе всё больше интересных применений. Начиналась же их эпоха с классики жанра — D&D. Это настольная игра, где несколько друзей или просто знакомых синхронно галлюцинируют, представляя себя командой героев в некоем вымышленном мире. Прав же во внутриигровых выборах тот, кто выкинул большее число на игральной кости. Судить сейчас об их мотивации у меня нет никакого желания, да и статья вообще-то не об этом.

Важно только понимать, что движущей силой сюжета в их сессиях является лишь один из игроков, называемый Dungeon Master. Когда только начали появляться первые GPT-модели, одной из первых хотелок гиков оказалось желание сварить из нейросетей автоматического Dungeon Masterа.

Так и появился AIDungeon — уникальная для своего времени (2019 год) вещь, которая не сильно потеряла в популярности и по сей день. Однако, если вы любите смотреть глубже, то играть в него вам быстро надоест. Я же в своей серии из нескольких статей (посвящённых GPT) стараюсь показать простому обывателю механизм безболезненного использования нейросетевых моделей в простых проектах при помощи Python и Hugging Face Transformers.

Приступим

+64

Takagi Sep 7 2023 at 12:11

Как (быстро) сделать русский локальный ChatGPT

Medium

7 min

41K

Programming*Machine learning*Artificial IntelligenceNatural Language Processing*

Retrospective

Эта история началась в начале марта этого года. ChatGPT тогда был в самом расцвете. Мне в Telegram пришёл Саша Кукушкин, с которым мы знакомы довольно давно. Спросил, не занимаемся ли мы с Сашей Николичем языковыми моделями для русского языка, и как можно нам помочь.

И так вышло, что мы действительно занимались, я пытался собрать набор данных для обучения нормальной базовой модели, rulm, а Саша экспериментировал с существующими русскими базовыми моделями и кустарными инструктивными наборами данных.

После этого мы какое-то время продолжали какое-то время делать всё то же самое. Я потихоньку по инерции расширял rulm новыми наборами данных. Посчитав, что обучить базовую модель нам в ближайшее время не светит, мы решили сосредоточиться на дообучении на инструкциях и почти начали конвертировать то, что есть, в формат инструкций по аналогии с Flan. И тут меня угораздило внимательно перечитать статью.

+88

Underskyer1 Sep 2 2023 at 15:16

Теория типов

Medium

43 min

32K

Programming*Scala*Functional Programming*

Review

From sandbox

Мы так привыкли к типам, что редко задаёмся вопросом, что же они такое на самом деле? А главное - почему возникла необходимость в их использовании? Этот поверхностный обзор сделан для того, чтобы продемонстрировать, как типы и другие связанные абстракции являются следствием из обобщения условий различных задач.

Что можно узнать из этой статьи?

+75

0serg Sep 2 2023 at 10:33

Ортографическая проекция в фотографии и прочие интересные фокусы с объективами

Medium

30 min

23K

Working with 3D-graphics*Popular sciencePhotographic equipmentPhysicsSystems engineering*

Review

С тем как работает фотоаппарат мы знакомимся еще со школьной программы. Однако привычное нам из школьного курса сведение объектива к "тонкой линзе" на самом деле не отвечает на массу практических вопросов. Например как удается создавать объективы с ортографической проекцией применяемые в системах технического зрения?

Да-да, такие тоже бывают не только в компьютерной графике, но и в фотографии: попробуйте-ка это объяснить оперируя исключительно в терминах "тонкой линзы". Размер изображения предмета в таких системах (почти) не зависит от того на каком расстоянии от объектива они находятся и это весьма удобно для измерения размеров предмета. В этой статье мы поговорим о том как этого удается добиться, как работает автофокус и пленоптические камеры и о многих других интересных вещах

Так как же работает объектив?

+160

varanio Jul 25 2023 at 08:23

Я бы пересмотрел вообще всё

4 min

77K

Website development*Programming*Project management*Personnel Management*

В программировании нет вообще никаких непреложных истин. Даже самые очевидные правила могут иметь контекст, в которых их применять нельзя. К сожалению в 99% организаций есть прям заповеди, обязательные к исполнению. И есть правила, которые считаются правилами хорошего тона (как не сморкаться в занавеску). Однако всегда бывают ситуации, когда лучше все-таки сморкаться.

Вот примеры.

1) Например, DRY — don’t repeat yourself. Хорошее полезное правило, но его можно довести до маразма. Из того что я встречал на практике: есть два разных по бизнес-смыслу раздела, которые начинались с простого CRUD, и многие части (и фронта и бека) выглядели во многом абсолютно одинаково. Если их объединить с помощью общей высосанной из пальца абстракции и тем самым избавиться от небольшого дублирования кода, то потом (очень скоро) можно будет сойти с ума, потому что эти две вещи скоро разъедутся, обрастая кастомными фичами, и абстракция будет только вредить. Нельзя абстрагировать неабстрагуемое, даже если DRY нарушен.

«[Немного] дублирования обходится гораздо дешевле, чем неправильная абстракция» — Сэнди Мец

Т.е. DRY — хороший принцип, но бывают исключения.

Читать дальше →

+177

346

ru_vds Jul 5 2023 at 12:00

Софт для самохостинга: что нового в 2023 году

Easy

6 min

42K

RUVDS.com corporate blogHostingOpen source*Server Administration*Software

Review

Среди обычных пользователей (физлиц) в последнее время наметилась тенденция ухода из облака на свою инфраструктуру. Об экономии тут речи обычно не идёт, потому что облачные сервисы Google, Apple и прочие заманивают бесплатными тарифами. Но у людей растёт понимание, что нельзя доверять Google. Надеяться можно только на себя.

В связи с этим стоит внимательнее посмотреть на стандартный софт для самохостинга, а также на последние новинки, которые имеют шанс заменить что-то из стандартного набора.

Читать дальше →

+55

took_the_lead Apr 21 2023 at 17:01

MiniGPT-4, ты что за зверь такой?

Easy

4 min

15K

Timeweb Cloud corporate blogOpen data*Machine learning*Artificial Intelligence

Review

Не проходит и недели, чтобы что-то новое и очень крутое в области LLM не появилось в сети. На этот раз отличились сотрудники из Научно-технологического университета имени короля Абдаллы (технический исследовательский университет в Саудовской Аравии). Они предложили способ наделения языковой модели функцией мультимодальности. Их ресерч называется «Улучшение понимания языка зрения с помощью усовершенствованных больших языковых моделей» (Enhancing Vision-language Understanding with Advanced Large Language Models).

Читать дальше →

+28

AI_Anatomy Apr 21 2023 at 14:40

Kandinsky создаёт игры

Easy

10 min

13K

Game development*DesignArtificial IntelligenceGames and game consolesLogic games

From sandbox

Мы предлагаем Вам познакомиться с Kandinsky 2.1 на практике, углубившись в реальный кейс использования генеративной нейросети.

В рамках этой статьи мы сосредоточимся на процессе создания игры, а именно визуальном оформлении карточной игры, используя Kandinsky 2.1. Мы рассмотрим оптимальные способы генерации изображений и дадим рекомендации по превращению сгенерированных артов в игральные карты для настольной игры.

Статья будет интересна людям, интересующимся генеративными нейронными сетями, дизайнерам, которые хотят оптимизировать свою работу, иллюстраторам и всем тем, кто хотел бы создать что-то подобное, но не имеет возможности нанять профессионального художника.

+23

3 4 ...

8 9