Articles / Bookmarks / Profile of exwill / Habr

Калимулин Михаил Игоревич @exwill

Vision developer

Profile Publications 45Comments 771Bookmarks 65

SLY_G Jul 29 at 15:25

«Уэбб» завершает второй год работы

Easy

4 min

1.6K

Popular scienceAstronomy

Translation

Что происходит при столкновении спиральной и эллиптической галактик? В честь второй годовщины «первого света» телескопа Webb НАСА опубликовало удивительный инфракрасный снимок двух галактик, запертых в тесном танце. Они называются Пингвин и Яйцо, и их танец продлится сотни миллионов лет.

«Всего за два года «Уэбб» изменил наше представление о Вселенной, сделав возможным проведение научных исследований мирового уровня, которые побудили НАСА сделать эту миссию реальностью», — сказал Марк Клэмпин, директор Отдела астрофизики в штаб-квартире НАСА в Вашингтоне. «Уэбб» позволяет разгадать давние тайны ранней Вселенной».

+11

jstmeowme Jul 29 at 15:03

ИИ-модели ломаются при обучении на рекурсивно сгенерированных данных

Hard

11 min

15K

Mathematics*Machine learning*Artificial IntelligenceBotHub corporate blog

Translation

Ранее мы разбирали документ о неизбежности AGI от Леопольда Ашенбреннера, в котором говорилось о «Стене данных». Проблема заключается в том, что данные для обучения новых ИИ-моделей в интернете не бесконечны. Один из подходов для обхода этой стены — создание синтетических данных, т.е сгенерированных ИИ. Ученые из Оксфордского и Кембриджского университетов опубликовали статью, в которой исследуют возможность использования таких данных при обучении новых моделей. Небольшой спойлер: модели сломались.

+23

pashovpa Jun 18 at 19:10

Интеграция LLM в корпоративное хранилище данных

Medium

11 min

Database Administration*Big Data*Machine learning*Data storages*Data Engineering*

Review

В данной статье рассматриваются способы интеграции Large Language Models (LLM) в корпоративные системы хранения данных. Основное внимание уделено использованию LLM для автоматического извлечения информации из текстовых данных с последующим формированием SQL-запросов. В рамках исследования также изучаются методы пост-обработки результатов SQL-запросов с целью улучшения точности и адаптивности моделей к конкретным характеристикам и особенностям баз данных.

Работа включает в себя анализ существующих решений и методов оценки эффективности LLM в контексте их интеграции в корпоративные информационные системы. Особое внимание уделяется применению Preference Learning via Database Feedback — подхода, направленного на обучение моделей на основе обратной связи от баз данных, что способствует более точному и адаптивному выполнению запросов пользователей.

Исследование также охватывает разработку примеров интеграции LLM в реальные корпоративные хранилища данных с целью демонстрации практической применимости и эффективности предлагаемых подходов.

SLY_G Mar 19 2021 at 11:53

Эпоха пара: Введение / Вес воздуха

16 min

22K

History of ITPopular sciencePhysics

Translation

Введение

В центре двора университета Райса, где проходил обучение автор этих строк, на постаменте находятся три огромных гранитных плиты, расположенные вертикально, горизонтально и под углом 45° к горизонту. При этом менее заметной, но более значимой для моего юного впечатлительного сознания оказалась другая скульптура, "Энергия", расположенная в северной части двора, рядом с фасадом лаборатории Аберкромби. На ней изображён рельеф бородатой библейской фигуры, одетой в набедренную повязку, которая левой рукой забирает у Солнца лучи, а правой мечет их на Землю. Скульптура прославляет инженеров. Действительно, практически вся энергия, которую использует человечество, происходит от Солнца, в том или ином виде. Это откровение поразило меня, когда я был студентом. Частичным исключением можно считать лишь ядерную и геотермальную энергии, поскольку они происходят от давно умерших солнц, а не от нашего текущего.

Читать дальше →

+45

jstmeowme Jun 5 at 13:08

Разбор документа про AGI от Леопольда Ашенбреннера, бывшего сотрудника OpenAI

Medium

11 min

38K

Machine learning*Research and forecasts in IT*Artificial IntelligenceBotHub corporate blog

Analytics

Леопольд Ашенбреннер, бывший сотрудник OpenAI из команды Superalignment, опубликовал документ под названием «Осведомленность о ситуации: Предстоящее десятилетие», в котором он делится своим видением будущего ИИ. Основываясь на своих знаниях в этой области, Ашенбреннер предсказывает стремительное развитие искусственного интеллекта в ближайшее десятилетие.

Мы прочитали этот документ объемом в 165 страниц за вас. В этой статье расскажем о ключевых идеях Ашенбреннера и о его прогнозах на будущее искусственного интеллекта.

+62

214

boomb0om May 31 at 10:14

Как мы собираем данные для обучения Kandinsky

Hard

14 min

2.6K

Сбер corporate blogImage processing*Machine learning*SberDevices corporate blog

Case

Всем привет! Наша команда в Sber AI занимается генеративными моделями и сегодня мы расскажем про очень важный этап разработки моделей для генерации фотореалистичных изображений и видео — процесс сбора и фильтрации данных. Про этот этап очень редко подробно рассказывают разработчики и исследователи таких известных генеративных моделей как DALL-E 3, Stable Diffusion, MidJourney или SORA. Генеративные модели уже многих впечатлили своими возможностями создавать максимально реалистичные изображения и видеоролики, а качественные данные — далеко не последняя причина, по которой такого качества генераций удалось достичь.

+20

EditorF_A_C_C_T May 30 at 17:07

Быть или не быть: вопросы расшифровки данных после атаки программ-вымогателей

6 min

5.6K

Information Security*F.A.C.C.T. corporate blog

В этом блоге мы кратко расскажем, что происходит после шифрования ИТ-инфраструктуры, что чувствует жертва, какие действия предпринимаются ею для восстановления своей инфраструктуры. Что следует и не следует делать пострадавшим от атаки вымогателей, что могут предложить им ИБ-компании в таких случаях, рассказал Андрей Жданов, главный специалист по анализу вредоносного кода и проактивному поиску угроз Лаборатории цифровой криминалистики F.A.C.C.T.

На конкретном примере продемонстрируем нестандартный подход по поиску решения по расшифровке данных.

AndyKy May 28 at 10:01

Шпаргалка для создания идеального промпта LLM

Easy

10 min

12K

Machine learning*ГК ЛАНИТ corporate blogNatural Language Processing*

Tutorial

Translation

Большие языковые модели могут производить любую последовательность символов на каком угодно языке в любом формате данных (включая языки программирования, аудио и видео). Соответственно и качество этой последовательности может быть самым разным. Иногда мы получаем многословные запутанные объяснения с галлюцинациями и устаревшими знаниями, а иногда ― элегантную функцию на Python решающую сложную задачу, идеальное название для бренда, а скоро и первую серию будущего бестселлера. Более того, модель может надёжно и точно ответить на миллионы вопросов ваших клиентов, сопоставить запросы из сотен позиций с многотысячным каталогом, самостоятельно обработать заявки по страховым искам, обучить робота или перебрать новые патентные заявки в поисках конфликтов со старыми. Однако чтобы полностью реализовать потенциал LLM, необходимо научиться мастерски давать им подсказки. А как это делать, я расскажу в этой статье.

+44

AlexeyChijov Apr 17 2023 at 08:48

Подробная пошаговая инструкция как настроить сервер на Linux и подключение по API к ChatGPT. Для Python и Node.js

Easy

9 min

12K

Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

ChatGPT набирает все большую популярность, ведь он может помочь человеку или даже заменить его в ряде задач. С ним можно взаимодействовать не только через графический интерфейс, но и по API. Таким образом его можно встраивать в свои системы, чтобы решать практические задачи бизнеса. Сейчас реализую подобный проект. Решил написать статью, где подробно и пошагово описываю, как настроить сервер Linux (Ubuntu) для интеграции по API с данной нейросетью, на примере Python (Flask) и Node.js (Next.js). Опять же, вы можете использовать не Ubuntu, не Flask и не Next.js, просто адаптировав примеры под себя.

В данной статье описано, как развернуть демо проект от OpenAI (описание здесь: Build your application), а затем доработать его, чтобы задавать свои собственные произвольные вопросы, в том числе и на русском. Также в конце статьи скажу немного про параметры API запросов и модели. Все команды и действия будут из консоли.

Flokis_guy May 17 at 14:20

Интуитивное понимание пространств и ядер в машинном обучении: Часть 1

Hard

9 min

8.4K

Data Mining*Mathematics*Machine learning*Artificial Intelligence

Tutorial

При изучении темы ядер (kernel) в ML/DS программы вузов, роадмэпы и видео на YouTube обычно рассматривают её через призму SVM, не говоря уже о всеми любимых курсах:). Казалось бы, это неплохо: вот тебе краткое объяснение и модель, которая использует ядра. Но, увы, в этих областях желательно понимать многие процессы интуитивно, так сказать — «тяжело в учении, легко в бою». К тому же, эта тема нечто большее, чем просто метод; она позволяет связать многие вещи в машинном обучении в единую картину через пространство, что я и хочу показать в этой статье.

+20

veseluha Apr 22 at 18:00

На какие AI Coding Assistants стоит обратить внимание в 2024?

8 min

14K

Programming*Machine learning*Artificial IntelligenceBotHub corporate blog

Review

Не является секретом, что LLM в настоящее время являются неотъемлемой частью нашего рабочего процесса. Особое внимание заслуживает AI Coding Assistant — искусственный интеллект, или просто программный помощник, который поддерживает разработчиков, помогая писать более качественный и точный код, тем самым экономя время и ресурсы.

Давайте рассмотрим различные программные помощники, доступные на рынке для разработчиков с разными уровнями навыков, включая как бесплатные, так и платные варианты.

Но прежде чем мы погрузимся в детали этих инструментов, давайте ответим на вопрос: "Что такое эти помощники?".

Приятного прочтения(:

+20

Friflex_dev Apr 16 at 13:22

Как обучают GPT

Easy

6 min

9.2K

Python*TensorFlow*Friflex corporate blog

Tutorial

Привет, Хабр! Меня зовут Родион Уколов, я занимаюсь искусственным интеллектом в компании Friflex. Мы помогаем компаниям внедрять модели машинного обучения и развиваем свои цифровые продукты.

Может быть, вы помните статью моего коллеги о том, как решать реальные задачи с ChatGPT. В этой статье я предлагаю попробовать глубже разобраться, что из себя представляет GPT-модель и как ее обучают.

+13

dimasklyarov Dec 9 2023 at 19:31

RAG (Retrieval Augmented Generation) — простое и понятное объяснение

Easy

8 min

47K

Natural Language Processing*

From sandbox

Краткое и понятное описание подхода RAG (Retrieval Augmented Generation) при работе с большими языковыми моделями.

janvarev Apr 8 at 11:01

GPT-4, Claude 3, Gemini Pro или опенсорс — как выбрать LLM под свою задачу?

Medium

10 min

24K

Timeweb Cloud corporate blogArtificial IntelligenceNatural Language Processing*

Tutorial

Несмотря на то, что сейчас ~~из каждого утюга~~ рекламируется доступ к ChatGPT и GPT-4, вообще говоря, в мире существует несколько больше разных поставщиков LLM (больших языковых моделей), и некоторые из которых могут гораааздо более эффективнее решать какие-то конкретные задачи.

Я уже полгода веду проект VseGPT.ru с доступом к разным LLM из России по OpenAI API (ну, и через вебчат). Львиная доля работы — подключение новых нейросетей. Сейчас их уже свыше 60, и каждую я попробовал хотя бы раз, ну, когда подключал.

Правда, сайт LLMExplorer, собирающий данные об опенсорс нейросетях с портала Hugging Face, говорит, что их там уже более 33 000 штук. М-да.

В общем, вероятно, я не знаю о текстовых сетках всё, но определенно знаю кое-что — хотя бы в пределах своего скромного опыта в 60 сеток. Так что кому интересно — прошу под кат.

Читать дальше →

+31

roman-gorb Apr 2 at 10:01

Ускорение инференса LLM

Medium

13 min

9.2K

Programming*Яндекс corporate blogAlgorithms*Machine learning*Artificial Intelligence

Инференсом ML-модели называют процесс её работы на конечном устройстве. Соответственно, чем больше мы разгоняем инференс, тем быстрее работает модель. Скорость может зависеть от разных условий, например, от архитектуры, которую вы выбрали для модели, или от железа, на котором работает устройство. Кроме того, проблема тяжёлого инференса остро ощущается на больших языковых моделях (LLM) так остро, как ни на каких других моделях.

Меня зовут Роман Горб, я старший ML-разработчик в команде YandexGPT. Тема инференса LLM заинтересовала меня, потому что я занимался R&D в квантовании сеток для CV-задач. Сегодня я расскажу, как безболезненно увеличить скорость инференса. Сперва разберёмся, зачем это нужно, а потом рассмотрим разные методы ускорения и фреймворки, которые могут в этом помочь.

Ускоряемся

+30

Dmytro_Kikot Mar 6 at 11:05

Дивергентное мышление: человек vs GPT-4

10 min

5.9K

ua-hosting.company corporate blogMachine learning*Popular scienceArtificial Intelligence

За последние годы применение больших языковых моделей искусственного интеллекта стало крайне распространенным явлением. Популярность ChatGPT повлекла за собой море дискуссий на тему правильности применения таких систем как с практической, так и с этической стороны вопроса. Рассматривая тот или иной ИИ, ученые сравнивают его возможностями с возможностями человеческого мозга. К примеру, ученые из университета Арканзаса (США) провели исследование, в ходе которого сравнивали креативное мышление людей и ChatGPT-4. Какие параметры сравнивались, как себя показал ChatGPT, и какие выводы можно сделать по результатам данного исследования? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

Ilya999Ilya Jan 14 at 09:22

OpenAI запускает GPT Store — как создать свой custom GPT с внешними API вызовами

Easy

7 min

14K

Machine learning*Artificial Intelligence

From sandbox

Вчера вечером, 10 января 2024 г., OpenAI официально запустили GPT Store.

Давайте разберемся, что это такое, и что оно дает. А затем создадим свой собственный GPT и добавим его в GPT Store.

Концепция "custom GPT" в терминах OpenAI - это кастомный набор инструкций (custom prompt), который может быть создан любым пользователем ChatGPT с подпиской Plus. Каждый такой custom GPT за счет своего набора инструкций хорошо заточен под решение своей конкретной задачи. Есть custom GPT, которые хорошо пишут код, есть custom GPT, которые играют роль репетитора или психотерапевта и т.д.

Таким образом, GPT store - это большая библиотека инструкций для разных задач внутри ChatGPT. Она создается и поддерживается комьюнити и очень сильно напоминает google play market или apple app store.

Процесс создания Custom GPT заключается в том, что в интерфейсе ChatGPT пользователь составляет подробные инструкции, что и как его GPT должен делать, дает описание, придумывает название, примеры использования и т.д. - всё это сохраняется на серверах OpenAI.

+33

SKarulin Dec 14 2023 at 02:16

Подключение Google Gemini Pro к проекту на Python

Medium

4 min

8.4K

API*Google API*Google Cloud Platform*Artificial Intelligence

Несколько дней назад я решал задачу подключения Yandex GPT, и главной сложностью там было освоение Yandex Cloud Console. В остальном API - вылитая LLaMa 2.

С Google Gemini история иная. Документация консоли содержит те самые вставки "New to Google Cloud", отсутствие которых вдохновило меня писать про Yandex GPT. При работе с консолью есть нюансы, их и выделим ниже по тексту. Но в целом, можно просто следовать документации, и всё получится.

В Google Cloud теперь доступны два пространства, с которых можно начинать: Vertex AI Studio и Model Garden. Первая предназначена для экспериментов с моделями и отладки промптов. А вторая - библиотека моделей, где всего их на сегодня 56, среди них упомянутая LLaMa 2, PaLM 2, знаменитый тем, что на нём работет Google Bard и, возможно, скоро мы увидим прорыв в медконсультировании Med PaLM 2, Gemini Pro. Мы сегодня коснёмся только Gemini Pro Vision, поскольку именно она заявлена как главный прорыв.

Подключить модель просто, весь процесс состоит из четырёх шагов.

agpankova Sep 2 2023 at 12:18

Эволюция метрик качества машинного перевода. Часть 3

5 min

2.3K

Machine learning*Natural Language Processing*

Review

Как правильнее всего измерять качество машинного перевода? Многие слышали о BLEU, но на самом деле метрик много. В этой статье расскажем, какие существуют метрики, как они эволюционировали и какие сегодня наиболее адекватны. Часть 3: безреференсные нейросетевые метрики, сравнение адекватности различных метрик.

erbanovanastasia Aug 2 2023 at 12:29

Чат-боты на все случаи жизни. 7 инструкций по созданию мини-приложений в Telegram

Medium

5 min

36K

Python*Selectel corporate blogDevelopment for IOT*Cloud services*

Tutorial

Telegram-боты — хорошая возможность вписать какую-то важную функциональность в понятную и простую платформу мессенджера. Не нужно думать об отдельном сайте и интерфейсе. Также боты — хорошая возможность для новичков в разработке реализовать свой мини-проект. Идея может быть как совершенно фановая — например, создавать стикеры из мемных сообщений друзей, так и быть частью функциональности сервиса — например, платежной системы.

В подборке под катом — семь инструкций по созданию Telegram-ботов с разной функциональностью. Сохраняйте статью в закладки: пригодится как начинающим, так и опытным разработчикам.

Выберите интересующего вас бота:

→ Паттерны взаимодействия с ботами
→ Веб-приложение на Node.js и React
→ Платежная система с Payments
→ Карманный ChatGPT, которому можно отправлять голосовые сообщения
→ Бот для генерации сложных паролей
→ Бот для создания стикеров из сообщений
→ Бот для мониторинга погоды на Python

Читать дальше →

+40

2 3