Статьи / Закладки / Профиль StriganovSergey / Хабр

@StriganovSergey

Разработчик PL/SQL, Delphi

Профиль Публикации Комментарии 176Закладки 260

derunat 4 часа назад

N-граммная языковая модель в эпоху LLM — как устроена и зачем нужна

Средний

3 мин

339

Блог компании НТР

Обзор

Тренды трендами, а всегда найдутся те, кто плывет против течения. Пока трендом становится уменьшение размеров модели, авторы из университета штата Вашингтон решили вообще не обращать внимание на размер и проверить, имеет ли смысл в эпоху LLM вернуться к N-граммным языковым моделям. Оказалось, что имеет. Во всяком случае, хотя бы просто из интереса.

На N-граммы, пожалуй, действительно давно никто не обращал внимания. Техники масштабирования, выведшие трансформеры на заоблачные высоты, к ним не применяли. Но авторы статьи Infini-gram: Scaling Unbounded n-gram Language Models to a Trillion Tokens обучили N-граммную модель на 1,4 триллиона токенов — это самая гигантская модель такой архитектуры. Она занимает 10 тебибайт, зато ей нужно всего 20 миллисекунд, чтобы подсчитать n-граммы, вне зависимости от того чему равно n. Самое интересное — возможные значения n.

drobushevkiy 26 мар в 09:07

Где продать стартап?

Простой

3 мин

Развитие стартапаУправление продуктом*

Обзор

Собрал подборку площадок с небольшим описанием и мои личным мнением по каждой площадке, где можно продать свой стартап, продукт, готовый бизнес, магазин, сайт, блог. Если у вас завалялся какой-то проект можете попытаться продать его и сделать отличный кейс для своей карьеры.

badcasedaily1 17 мар в 09:40

Основы Actor-Critic алгоритма

Простой

8 мин

1.9K

Машинное обучение*Блог компании OTUS

Привет, Хабр!

Actor-Critic — это класс алгоритмов в RL, суть которого довольно проста на словах, он сочетает в себе такие полтики как policy-based и оценки value-based. У нас есть два главных действующих лица: Actor и Critic. Actor отвечает за выбор действий, т.е формирование политики поведения, он принимает решения исходя из текущего состояния окружающей среды. Critic оценивает, насколько хорошо или плохо Actor справляется со своей задачей, предоставляя обратную связь через оценку действий Actor'a.

awswaltz 30 янв в 12:08

Отладка в PL/SQL Developer

Средний

12 мин

6.5K

Oracle*Отладка*Блог компании CUSTIS

Обзор

Привет! Меня зовут Алексей Маряхин, я работаю разработчиком на Oracle и пишу много, очень много кода. И когда программа ведёт себя не так, как ожидалось, на помощь приходит отладка.

Не так давно выяснил, что не все разработчики владеют функционалом отладки или знают её фичи. А если код сложный и баги искать всё равно надо? Литературы на русском языке про отладку практически нет.

Тогда я собрал подробный гайд для коллег и провёл внутренний семинар по обмену опытом. Материал получился настолько подробным и полезным, что решил поделиться им с сообществом программистов. На примере инструментов для работы с СУБД Oracle, которые используются у нас в компании, посмотрим, как работает отладка, сравним их в теории и узнаем, что внутри.

В серии из двух статей подробно расскажу о способах, инструментах и нюанса отладки кода PL/SQL. Первая часть — про инструмент PL/SQL Developer. Поехали!

Читать далее →

Blaukovitch 27 янв в 20:11

«Пиратский» Google Chrome в Microsoft Windows 7 год спустя. И примкнувший к ним MS EDGE, Opera, Brave. Полная версия

Средний

22 мин

37K

Антивирусная защита*Assembler*Google ChromeКонтент и копирайтинг*Разработка под Windows*

Туториал

Пиратство растёт, милорд!

Google Chrome для Windows 7 - детальный технический отчёт, каким образом актуальная версия популярнейшего браузера всё равно работает в «семёрке» даже спустя год после официального прекращения её поддержки корпорацией. Реакция Google LLC или почему пиратство только набирает обороты?

+105

158

mxvlpr 20 янв в 21:00

Нельзя писать безопасный код на C++ без санитайзеров

Простой

5 мин

19K

Ненормальное программирование*Программирование*C++*Отладка*

Кейс

С++ видится мне огромным франкенштейном: очень уж много разнообразных способов описать свои намерения. В добавок к этому язык пропагандирует политику zero-cost abstractions, из которой следует (помимо прочего), что программист в ответе за все свои действия. Однако, работая с большими кодовыми базами, становится крайне тяжело держать в уме различные тонкости языка, которые держать в уме нужно — иначе Undefined Behavior.

В данной статье хочу рассказать о трех интересных случаях UB, с которыми столкнулся при разработке на С++. Не думаю, что опытным разработчикам примеры из статьи будут полезны, но, полагаю, что начинающим разработчикам смогу показать на своем примере, как не стоит писать код на C++.

+24

157

LeninIvanov 14 янв в 15:31

О кастомных HTML-тегах по-человечески и как их использовать

Средний

7 мин

12K

Веб-разработка*JavaScript*HTML*

Из песочницы

Расскажу вам о том, как использовать чудо-юдо под названием «Кастомные HTML‑теги» понятно, но подробно.

+42

dimanosov007 15 янв в 12:29

Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

12 мин

13K

Python*Обработка изображений*Машинное обучение*

Туториал

Перевод

Обнаружение движущихся объектов широко используется в самых разных приложениях, от видеонаблюдения до мониторинга дорожного движения. Это важнейшая задача в постоянно развивающейся области компьютерного зрения. Библиотека OpenCV с открытым исходным кодом, известная своим полным набором инструментов для компьютерного зрения, предоставляет надежные решения для обнаружения движущихся объектов. В этой статье рассмотрим комбинацию обнаружения контуров и вычитания фона, которые можно использовать для обнаружения движущихся объектов с помощью OpenCV.

+12

Sivchenko_translate 14 янв в 14:31

С новым годом: GPT в 500 строках на SQL

42 мин

37K

Занимательные задачкиПрограммирование*SQL*Машинное обучение*Искусственный интеллект

Перевод

В минувшем году все только и говорили об ИИ и о том, как он может всё за вас сделать.

Мне нравится, когда кто-то или что-то работает за меня. Поэтому решил: попрошу-ка ChatGPT написать за меня новогодний пост:

«Эй, ChatGPT. А ты можешь реализовать большую языковую модель на SQL?»
«Нет, SQL не подходит для реализации больших языковых моделей. Язык SQL предназначен для выполнения запросов к данным, хранящимся в РСУБД и для управления этими запросами. Для реализации большой языковой модели требуются сложные алгоритмы, обширные датасеты, а зачастую — и фреймворки для глубокого обучения. SQL всеми этими возможностями не обладает.»

Что ж, лишний раз убеждаешься, что, если хочешь что‑то сделать хорошо – сделай это сам.

Давайте же воодушевимся этим оптимистическим планом и реализуем большую языковую модель на языке SQL.

+207

R0bur 11 янв в 19:44

Четвёртое наблюдение о командной строке и путях в файловой системе

Простой

3 мин

4.8K

Системное администрирование*Оболочки*

Мнение

В недавно опубликованной статье «Три наблюдения о командной строке и путях в файловой системе» были рассмотрены некоторые особенности интерпретации командной строки оболочками в операционных системах Windows и Linux. Первое наблюдение было о том, что командные оболочки SH/BASH, в отличие от COMMAND/CMD, выполняют предварительную обработку параметров, содержащих шаблоны имён файлов. А в этой небольшой заметке приводится ещё одно наблюдение, демонстрирующее важность учёта предварительной обработки параметров-шаблонов командной оболочкой.

MaFrance351 10 янв в 11:01

Сам себе мобильный интернет. Запускаем базовую станцию стандарта 4G LTE

Сложный

13 мин

81K

Сетевые технологии*Блог компании Timeweb CloudРазработка систем связи*Стандарты связи*Сотовая связь

Туториал

Приветствую всех!

Я уже не раз рассказывал про то, как в домашних условиях поднять сотовые сети разных стандартов. Но всё же все они были уже весьма древними. Самое время замахнуться на кое-что поинтереснее — LTE.

Итак, в сегодняшней статье поговорим о том, что детально в нашем сообществе не описывал практически никто — о том, как запустить базовую станцию самого нового из поддерживаемых большинством телефонов этой страны стандартов. Поговорим об особенностях её работы и о трудностях, с которыми, возможно, придётся столкнуться при запуске. Традиционно будет много интересного.

Читать дальше →

+368

156

MountainGoat 2 янв в 00:40

Начинаем продолжать: обработка исходников с помощью ИИ в оффлайне

Средний

17 мин

9.1K

Ненормальное программирование*Искусственный интеллектNatural Language Processing*

Обзор

В этой статье я расскажу про расширение «Continue» для VSCode, помогающее обрабатывать исходные коды и просто текст любым ИИ, в том числе бесплатным и запущенным локально; а так же покажу, что умеет делать локальный вариант ИИ уже сейчас.

+17

alizar 1 янв в 13:00

Гений 21 века. Чем сейчас занимается Фабрис Беллар

Простой

9 мин

54K

Open source*Блог компании RUVDS.comКарьера в IT-индустрииИскусственный интеллектБиографии гиков

Ретроспектива

Некоторые программисты настолько хорошо известны, что не нуждаются в особом представлении. Наверное, Фабрис Беллар — самая яркая звезда современности. Автор мультимедийного комбайна FFmpeg, эмулятора QEMU и десятков других полезных программ — абсолютный гений и пример программиста 100х, который в одиночку принёс больше пользы миру, чем многие корпорации с сотнями разработчиков. В общем, все знают Фабриса — про него ещё была статья на Хабре двенадцать лет назад…

… Но по просьбам молодых читателей мы решили вернуться к этой теме. Оно и к лучшему, ведь Фабрис многое сделал за это десятилетие, особенно в области нейросетей.

Читать дальше →

+198

MarselMM 12 дек 2023 в 15:35

Локальные GPT нейронный сети — устанавливаем на домашнем ПК, запускаем и проверяем на адекватность аналоги ChatGPT

18 мин

24K

Машинное обучение*Искусственный интеллект

Из песочницы

Есть много LLM нейронных сетей, создатели которых говорят, что они аналогичны, а может даже лучше ChatGPT версий 3.5 и 4.0. Давайте попробуем протестировать их, установив их на локальный компьютер, чтобы понять, действительно ли они так хороши.

+21

Autotattoo 25 дек 2023 в 17:00

Опросы с использованием метода Дельфи

8 мин

2.8K

Управление проектами*Блог компании Testograf

Метод Дельфи, представляет собой уникальный подход к систематическому и структурированному сбору мнений экспертов для прогнозирования или решения сложных проблем.

Цель статьи — не только описать метод Дельфи, его основные этапы и применение, но и показать, как его преимущества и ограничения могут быть интегрированы в реальные бизнес-процессы и исследовательские проекты. Мы также рассмотрим, как инструменты, предлагаемые сервисом Testograf, могут помочь в организации и проведении опросов методом Дельфи. Эта статья будет интересна тем, кто ищет новые подходы к сбору и анализу экспертных мнений, а также тем, кто стремится улучшить свои исследовательские методы с помощью современных инструментов онлайн-опросов.

alizar 25 дек 2023 в 18:00

Чипы для всех. Свободный стандарт на производство микросхем

Простой

7 мин

12K

Блог компании RUVDS.comПроизводство и разработка электроники*Компьютерное железоDIY или Сделай самЭлектроника для начинающих

Аналитика

LibrePCB: бесплатный инструмент для разработки печатных плат под Windows, Linux и MacOS

Идея свободного железа особенно актуальна сейчас, когда крупные корпорации пытаются ограничить доступ к своей интеллектуальной собственности, а национальные правительства ставят друг другу препоны в доступе к технологиям.

Многие хотели бы составить конкуренцию лидерам — TSMC, Samsung и Intel, которые являются фактически монополистами в производстве современных микросхем по техпроцессу 2/5 нм.

Читать дальше →

+40

dimasklyarov 9 дек 2023 в 19:31

RAG (Retrieval Augmented Generation) — простое и понятное объяснение

Простой

8 мин

21K

Natural Language Processing*

Из песочницы

Краткое и понятное описание подхода RAG (Retrieval Augmented Generation) при работе с большими языковыми моделями.

mr-pickles 11 дек 2023 в 13:15

Добавление собственных данных в LLM с помощью RAG

Средний

28 мин

15K

Python*Программирование*Блог компании Wunder FundИскусственный интеллект

Перевод

Этот материал посвящён тому, как добавлять собственные данные в предварительно обученные LLM (Large Language Model, большая языковая модель) с применением подхода, основанного на промптах, который называется RAG (Retrieval‑Augmented Generation, генерация ответа с использованием результатов поиска).

Большие языковые модели знают о мире многое, но не всё. Так как обучение таких моделей занимает много времени, данные, использованные в последнем сеансе их обучения, могут оказаться достаточно старыми. И хотя LLM знакомы с общеизвестными фактами, сведения о которых имеются в интернете, они ничего не знают о ваших собственных данных. А это — часто именно те данные, которые нужны в вашем приложении, основанном на технологиях искусственного интеллекта. Поэтому неудивительно то, что уже довольно давно и учёные, и разработчики ИИ‑систем уделяют серьёзное внимание вопросу расширения LLM новыми данными.

До наступления эры LLM модели часто дополняли новыми данными, просто проводя их дообучение. Но теперь, когда используемые модели стали гораздо масштабнее, когда обучать их стали на гораздо больших объёмах данных, дообучение моделей подходит лишь для совсем немногих сценариев их использования. Дообучение особенно хорошо подходит для тех случаев, когда нужно сделать так, чтобы модель взаимодействовала бы с пользователем, используя стиль и тональность высказываний, отличающиеся от изначальных. Один из отличных примеров успешного применения дообучения — это когда компания OpenAI доработала свои старые модели GPT-3.5, превратив их в модели GPT-3.5-turbo (ChatGPT). Первая группа моделей была нацелена на завершение предложений, а вторая — на общение с пользователем в чате. Если модели, завершающей предложения, передавали промпт наподобие «Можешь рассказать мне о палатках для холодной погоды», она могла выдать ответ, расширяющий этот промпт: «и о любом другом походном снаряжении для холодной погоды?». А модель, ориентированная на общение в чате, отреагировала бы на подобный промпт чем‑то вроде такого ответа: «Конечно! Они придуманы так, чтобы выдерживать низкие температуры, сильный ветер и снег благодаря…». В данном случае цель компании OpenAI была не в том, чтобы расширить информацию, доступную модели, а в том, чтобы изменить способ её общения с пользователями. В таких случаях дообучение способно буквально творить чудеса!

+22

0a1a2a3a4a5 17 дек 2023 в 11:36

OpenAI сняли все ограничения со своих моделей

4 мин

74K

Машинное обучение*Natural Language Processing*

Recovery Mode

Вас тоже бесит когда Вы хотите устроить подрыв, спрашиваете у ChatGPT как сделать бомбу, а он Вам... Не отвечает. Говорит что мол, OpenAI, правила и бла-бла-бла.

На самом деле эту статью я пишу чтобы объяснить тем кто её увидит что у OpenAI абсолютно нет конкурентов. Google и прочие даже рядом не стоят с OpenAI...

Узнать что там дальше ёмаё

+12

Maximov_psy 17 дек 2023 в 16:18

Жертвы психологии XXI века или «токсичная терапированность»

Простой

12 мин

21K

Читальный залЗдоровье

Скоро новый год, а значит наступает пора ~~несбыточных~~ обещаний себе. Как показывает практика, декабрь – месяц предварительных записей к психологу и в спортзал, вызванных надеждой поменять жизнь с ~~понедельника~~ первого января. И если за спортзал я сказать ничего не могу, то вот про влияние психотерапии вам точно будет интересно послушать, ведь сегодня мы препарируем феномен под названием «токсичная терапированность».

И если вы когда-то наблюдали картину, что человек, который до похода к психологу был не самым приятным собеседником, после посещения остался таким же, но начал у всех видеть «травмы», своё хамство оправдывать «отстаиванием личных границ», а в общении постоянно использовать слова «абьюз», «токсик» и «газлайтинг» (что чаще всего встречается в семейных отношениях), то добро пожаловать под кат.

Осторожно, лонгрид

+80

2 3 ...

11 12

N-граммная языковая модель в эпоху LLM — как устроена и зачем нужна

Где продать стартап?

Основы Actor-Critic алгоритма

Отладка в PL/SQL Developer

«Пиратский» Google Chrome в Microsoft Windows 7 год спустя. И примкнувший к ним MS EDGE, Opera, Brave. Полная версия

Нельзя писать безопасный код на C++ без санитайзеров

О кастомных HTML-тегах по-человечески и как их использовать

Обнаружение движущихся объектов с помощью OpenCV с использованием обнаружения контуров и вычитания фона

С новым годом: GPT в 500 строках на SQL

Четвёртое наблюдение о командной строке и путях в файловой системе

Сам себе мобильный интернет. Запускаем базовую станцию стандарта 4G LTE

Начинаем продолжать: обработка исходников с помощью ИИ в оффлайне

Гений 21 века. Чем сейчас занимается Фабрис Беллар

Локальные GPT нейронный сети — устанавливаем на домашнем ПК, запускаем и проверяем на адекватность аналоги ChatGPT

Опросы с использованием метода Дельфи

Чипы для всех. Свободный стандарт на производство микросхем

RAG (Retrieval Augmented Generation) — простое и понятное объяснение

Добавление собственных данных в LLM с помощью RAG

OpenAI сняли все ограничения со своих моделей

Жертвы психологии XXI века или «токсичная терапированность»

Информация

Специализация