Articles / Bookmarks / Profile of himikk / Habr

@himikk

User

Profile Publications Comments 7Bookmarks 141

murat_apishev Apr 19 at 16:57

Как учить большие языковые модели (теоретический туториал)

Medium

1 min

4.7K

Machine learning*Artificial IntelligenceNatural Language Processing*

Tutorial

Обзорное видео с доклада об особенностях обучения LLM для тех, кто в теме ML/DL, но хочет расширить кругозор в области работы с большими языковыми моделями. На основе личного опыта и обзора множества научных статей и инструментов. Ссылка на презентацию прилагается.

Смотреть

Sivchenko_translate Apr 15 at 17:34

На пути к 1-разрядным моделям машинного обучения

8 min

3.8K

Programming*Mathematics*Machine learning*Natural Language Processing*

Translation

В последнее время активно разрабатываются технологии экстремально малоразрядного квантования, например, BitNet и 1.58 bit. Они пользуются большим интересом в сообществе машинного обучения. Основная идея данного подхода заключается в том, что перемножение матриц с квантованными весами можно реализовать и умножения, что потенциально полностью меняет правила игры применительно к скорости вычислений и эффективности больших моделей машинного обучения.

Эта статья написана в схожем ключе, но нас наиболее интересует, возможно ли напрямую квантовать предобученные модели при экстремальных настройках, в том числе, при двоичных весах (0 и 1). Уже имеющиеся работы нацелены на обучение моделей с нуля. Но в открытом доступе сейчас достаточно много отличных предобученных моделей, таких как Llama2. Более того, обучение с нуля — это ресурсозатратная задача в пересчёте как на вычисления, так и на данные, поэтому такие подходы не слишком доступны в свободном сообществе.

В этой статье мы подробно разберём крайне малоразрядное (2 и 1-разрядное) квантование предобученных моделей с применением HQQ+. HQQ+ — это адаптация HQQ (полуквадратичного квантования), в которой для повышения производительности используется адаптер с низкой размерностью. Наши результаты показывают, что при обучении лишь небольшой части весов в верхней части HQQ-квантованной модели (даже одноразрядной) качество вывода значительно возрастает, такая модель может даже превосходить небольшие модели полной точности.

Модели находятся на Hugging Face: 1-разрядная, 2-разрядная.

+19

ph_piter Apr 9 at 18:33

Книга «SQL. Pocket guide, 4-е изд.»

7 min

4.3K

MySQL*SQL*Database Administration*Издательский дом «Питер» corporate blogProfessional literature*

Привет, Хаброжители!

Если вы аналитик или инженер по обработке данных и используете SQL, популярный карманный справочник станет для вас идеальным помощником. Найдите множество примеров, раскрывающих все сложности языка, а также ключевые аспекты SQL при его использовании в Microsoft SQL Server, MySQL, Oracle Database, PostgreSQL и SQLite.

В обновленном издании Элис Жао описывает, как в этих СУБД используется SQL для формирования запросов и внесения изменений в базу. Получите подробную информацию о типах данных и их преобразованиях, синтаксисе регулярных выражений, оконных функциях, операторах PIVOT и UNPIVOT и многом другом.

Читать дальше →

+14

PB_Academy Apr 9 at 11:26

Ликбез по методологиям проектирования хранилищ данных

Easy

2 min

8.7K

Big Data*Data storage*Data storages*

From sandbox

Хранилище данных — это информационная система, в которой хранятся исторические и коммутативные данные из одного или нескольких источников. Он предназначен для анализа, составления отчетов и интеграции данных транзакций из разных источников.

Рассмотрим сильные и слабые стороны самых популярных методологий.

badcasedaily1 Apr 1 at 07:34

Кратко про алгоритм обучения Q-learning и как он реализуется в Python для новичков

Easy

5 min

Machine learning*OTUS corporate blog

Review

Привет, Хабр!

Q-learning — это алгоритм обучения с подкреплением, который позволяет агенту оптимизировать свою стратегию действий в динамичной среде, стремясь максимизировать сумму будущих наград. Агент исследует среду, принимая решения, основанные на предыдущем опыте, а не на предварительной модели мира.

В этой статье мы и рассмотрим этот алгоритм.

UranusExplorer Mar 15 at 00:03

Надежный обход блокировок в 2024: протоколы, клиенты и настройка сервера от простого к сложному

Medium

45 min

136K

Configuring Linux*Information Security*System administration*Network technologies*

Tutorial

Поскольку блокировки интернета в РФ в последние недели и месяцы многократно активизировались, а маразм все крепчает и крепчает, стоит еще раз поднять тему обхода этих самых блокировок (и делаем ставки, через сколько дней на эту статью доброжелатели напишут донос в РКН чтобы ограничить к ней доступ на территории страны).

Вы, наверняка, помните отличный цикл статей на Хабре в прошлом году от пользователя MiraclePtr, который рассказывал о разных методах блокировок, о разных методах обхода блокировок, о разных клиентах и серверах для обходов блокировок, и о разных способах их настройки (раз, два, три, четыре, пять, шесть, семь, восемь, десять, десять, и вроде были еще другие), и можете спросить, а зачем еще одна? Есть две основные причины для этого.

+490

351

snakers4 Apr 12 2022 at 20:58

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

8 min

47K

Machine learning*DIYSoundNatural Language Processing*Voice user interfaces*

hero_image

В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.

Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:

Снизили размер модели в 2 раза;
Научили наши модели делать паузы;
Добавили один высококачественный голос (и бесконечное число случайных);
Ускорили наши модели где-то примерно в 10 раз (!);
Упаковали всех спикеров одного языка в одну модель;
Наши модели теперь могут принимать на вход даже целые абзацы текста;
Добавили функции контроля скорости и высоты речи через SSML;
Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

+156

100

quasilyte Jan 15 2022 at 00:47

Ускоряем hugo на 20% простым изменением в пакете reflect

5 min

5.4K

High performance*Open source*Programming*Compilers*Go*

Найти значительное узкое место в производительности стандартной библиотеки или зрелого приложения — это редкость.

Я был удивлён, когда в top10 списке CPU-профиля hugo при сборке digitalgov.gov на первой позиции находился метод reflect.Type.MethodByName().

      flat  flat%   sum%        cum   cum%
     8.84s  6.28%  6.28%     57.85s 41.10%  reflect.(*rtype).MethodByName
     7.93s  5.63% 11.92%      8.50s  6.04%  reflect.name.readVarint
     7.56s  5.37% 17.29%    111.79s 79.43%  reflect.Value.call
     7.53s  5.35% 22.64%     23.33s 16.58%  runtime.mallocgc
     7.29s  5.18% 27.82%     16.10s 11.44%  reflect.name.name

В этой статье я расскажу вам о том, как так вышло и что с этим можно было бы сделать.

Читать дальше →

+26

shurik2533 Dec 17 2021 at 01:46

Клубничная чудо-коробка 2.0. Первая часть

12 min

24K

Start-up developmentGadgetsBiotechnologiesDIYBiology

Не так давно я писал пост про умную коробку для выращивания клубники на балконе. Я убедился, что у меня получается и добился хороших результатов. Это подвигло меня продолжить дело и создать нечто большее. Я решил построить небольшую теплицу в закрытом помещении — контейнере, чтобы контролировать факторы, влияющие на развитие клубники и получить более качественный результат. На этот раз я отказываюсь от субстрата и перехожу на аэропонику.

+101

programmerguru May 28 2021 at 16:02

Разработка REST-серверов на Go. Часть 1: стандартная библиотека

9 min

76K

Programming*Server Administration*Go*RUVDS.com corporate blog

Translation

Это — первый материал из серии статей, посвящённой разработке REST-серверов на Go. В этих статьях я планирую описать реализацию простого REST-сервера с использованием нескольких различных подходов. В результате эти подходы можно будет сравнить друг с другом, можно будет понять их относительные преимущества друг перед другом.

Первый вопрос разработчиков, которые только начинают применять Go, часто выглядит так: «Какой фреймворк стоит использовать для решения задачи X». И хотя это — совершенно нормальный вопрос, если задавать его, имея в виду веб-приложения и серверы, написанные на многих других языках, в случае с Go при ответе на этот вопрос нужно принять во внимание множество тонкостей. Существуют серьёзные аргументы как «за», так и «против» использования фреймворков в Go-проектах. Я, работая над статьями из этой серии, вижу своей целью объективное разностороннее исследование этого вопроса.

Предыдущие части:

Вы тут — Разработка REST-серверов на Go. Часть 1: стандартная библиотека
Разработка REST-серверов на Go. Часть 2: применение маршрутизатора gorilla/mux
Разработка REST-серверов на Go. Часть 3: использование веб-фреймворка Gin
Разработка REST-серверов на Go. Часть 4: применение OpenAPI и Swagger
Разработка REST-серверов на Go. Часть 5: Middleware
Разработка REST-серверов на Go. Часть 6: аутентификация

Читать дальше →

+41

15432 Dec 13 2020 at 16:56

Реверсим и улучшаем SATA контроллер

14 min

40K

Information Security*Reverse engineering*Programming microcontrollers*Computer hardware

Вы когда-нибудь задумывались, как много вокруг умной электроники? Куда ни глянь, натыкаешься на устройство, в котором есть микроконтроллер с собственной прошивкой. Фотоаппарат, микроволновка, фонарик... Да даже некоторые USB Type C кабели имеют прошивку! И всё это в теории можно перепрограммировать, переделать, доработать. Вот только как это сделать без документации и исходников? Конечно же реверс-инжинирингом! А давайте-ка подробно разберём этот самый процесс реверса, от самой идеи до конечного результата, на каком-нибудь небольшом, но интересном примере!

+215

PaulZi May 27 2019 at 02:06

Мошенники и ЭЦП — всё очень плохо

5 min

237K

Information Security*Legislation in IT

Недавно общественность облетела новость о первом случае продажи квартиры мошенниками с помощью ЭЦП и подделки документов. Когда я раньше читал подобные новости, всегда воспринимал отстранённо, как будто со мной этого не может произойти, но я ошибался. И теперь могу заявить, в зоне риска мошенников — каждый, увы, даже хабровчане.

Читать дальше →

+356

780

specialist_nicru Dec 5 2020 at 17:02

Хочу купить чужой домен, как это сделать? Шаги от проверки к покупке

4 min

19K

Domain names administrating*IT Infrastructure*Server Administration*Internet marketing*

From sandbox

Вы можете перекупить домен у владельца или зарегистрировать освобождающийся адрес через аукцион доменных имен. На сначала надо проверить домен, чтобы не приобрести «кота в мешке».

Рассказываю, как проверить и как купить.

+25

kciray Jul 25 2020 at 14:26

Экзамены TOEFL/IELTS как ориентир для развития. Фундаментальные апгрейды языка и их польза для разработчика

13 min

18K

IT careerLearning languagesThe future is here

Technotext 2020

Экзамены английского языка вызывают у большинства разработчиков негативную реакцию. В сети или в курилке часто можно услышать утверждения о том, что TOEFL/IELTS проверяют не уровень владения языком, а умение соответствовать шаблонам. Разработчики цепляются за свой B1 или даже B2/C1, который им дали на внутреннем ассессменте в компании или при прохождении 10-минутного онлайн-теста. Далее, у нас есть 2 пути. Вы можете принять ваш уровень и не развиваться, думая что вам «не нужно», «не моё» и так далее. Можете найти 100 причин отрицать международные общепринятые тесты и даже обойти их при миграции. А можете согласиться с тем, что ваш уровень не достаточно хорош при объективной оценке по критериям, и подумать над развитием и пользе для карьеры разработчика. Статья будет именно про второй путь, а конкретно:

Развитие скорости чтения и использование правого полушария мозга вместо левого
Накрутка навыка письма через независимые эссе внутри Grammarly
Турбонакрутка разговорной речи через комментирование своих действий в играх (RPG/RTS)
Ускорение с помощью слепой печати
Контроль промежуточных результатов через TOEFL GO

Читать дальше →

+15

olegchir Jul 9 2020 at 14:02

Работаем в IntelliJ IDEA на слабом железе

7 min

49K

JavaScript*Programming*Java*C++*Usability*

Обнаружил секретный репозиторий на гитхабе JetBrains под названием Projector. Благодаря нему написал кусок кода в IntelliJ IDEA, запущенной на Android-планшете. Рассказываю, как это повторить.

Читать дальше →

+92

147

editor_ruvds Jul 4 2020 at 12:12

Как жить и работать с психиатрическим диагнозом: расшифровка эфира, часть 1

24 min

24K

RUVDS.com corporate blogIT careerBrainHealthInterview

И снова привет, Хабр.

Две недели назад я написала пост с каминг-аутом, что я работаю в IT с тяжелым психическим расстройством и предложила задавать вопросы. И форма ответов просто взорвалась! Впервые за время, которое я на площадке, я увидела человеческую часть нашего коммьюнити так близко.

Поэтому перед публикацией расшифровки я хочу сказать спасибо за поддержку и доверие. Я постаралась ответить на все вопросы во время эфира — вышло длинно, поэтому расшифровка выйдет двумя частями: в целом о жизни с БАР и практические вопросы, вроде как найти врача.

Под катом часть первая — о жизни с БАР.

+51

editor_ruvds Jun 21 2020 at 14:14

Как жить и работать дальше, если вам поставили психиатрический диагноз

6 min

107K

RUVDS.com corporate blogLifehacks for geeksBrainHealth

UPD Cсылка на стрим на youtube

Привет, Хабр!

Меня зовут Сания Галимова, я 6 лет в рекламе, два из них — руковожу отделом маркетинга в IT-компаниях и уже 4 года пью психотропные препараты по назначению психиатра.

Раньше мне было очень трудно заканчивать проекты и даже просто удержаться на одном месте работы: я была сверхэмоциональной, со мной было трудно договориться, а иногда я просто не могла работать — после 3-4 месяцев интенсивной работы и демонстрации хороших результатов меня «выключало» — я сидела перед монитором и не могла прочесть даже строчки текста.

Меня увольняли, от меня уходили партнеры, я еле сводила концы с концами, но это ни в какое сравнение не шло с галлюцинациями, навязчивыми суицидальными мыслями и клиническими депрессиями.

Звучит, будто бы жизнь была ужасной, но я никогда так не думала: жизнь была замечательной, но очень сложной, и я постоянно искала причину, почему так трудно — и в 21 наконец дошла до психиатра, который поставил мне диагноз и я начала лечиться.

Сейчас я уже 3-й год в ремиссии, моя карьера пошла вверх, я могу жить, работать и путешествовать, не переживая о здоровье и бытовых вещах. Во многом это правильная диагностика, подбор препаратов и работа с психиатром и как раз об этом я и хочу рассказать.

Читать дальше →

+159

169

editor_ruvds Jul 5 2020 at 12:12

Как жить и работать с психиатрическим диагнозом. Часть 2: практические вопросы

14 min

27K

RUVDS.com corporate blogIT careerBrainHealthInterview

Кэрри Фишер, известная ролью принцессы Леи всю жизнь сражалась с биполярным расстройством — ей не помогали лекарства, только электрошок. Она — мой любимый биполярник, поэтому и иллюстрирует эту статью

Это вторая часть расшифровки эфира про жизнь и работу в IT с биполярным расстройством, первую и нулевую часть про мою историю, как я этому училась на своих ошибках, можно прочитать в анонсе и первой части расшифровки.

В этой части расшифровки все практические вопросы про ментальные расстройства, которые задавали читатели Хабра во время эфира: как найти врача, как помочь близкому человеку с заболеванием и могут ли вас насильно госпитализировать и поставить на учет в современной России.

+39

122

Astrei Apr 13 2020 at 00:48

Исследуем электромагнитные поля с помощью SDR приемника и OpenCV

10 min

28K

Popular sciencePhysicsDIY

SDR-приемник, даже самый дешёвый, является весьма высокочувствительным приборчиком. Если добавить к нему специальную антенну и OpenCV, то можно будет не только привычно слушать эфир, но и посмотреть на распределение электромагнитных полей в пространстве. О таком интересном применении и пойдет речь в данной статье. Внимание! Под катом много картинок и анимации!

Читать дальше →

+100

mobilz Jan 26 2018 at 22:14

Добываем Wi-Fi соседа стандартными средствами MacOS

5 min

359K

Information Security*Wireless technologies*

Я всегда был фанатом багов и уязвимостей «на поверхности», всегда завидовал чувакам, которые пишут эксплойты для самых защищённых ОС, а сам умел только скрипткиддить (термин из нулевых). Однако мой пост про уязвимости в системах контроля версий набрал более 1000 лайков на Хабре и остаётся топ1 постом за всю историю Хабра, несмотря на то, что был написан 9(!) лет назад.

И сегодня я хотел бы на пальцах показать и рассказать про такую штуку, как вардрайвинг. А точнее, как стандартными средствами MacOS можно добыть пароли от Wi-Fi соседей. Нелёгкая забросила меня на очередную квартиру. Как-то исторически сложилось, что я ленивый. Пару лет назад я уже писал, что моя лень, новая квартира и провод Beeline (бывшая Corbina) помогли мне найти багу у Билайна и иметь бесплатно интернет в их сети. «Сегодня» происходит «подобное», я на новой квартире, нет даже провода, но есть много сетей у соседей.

Заколебавшись расходовать мобильный трафик, я решил, что «соседям надо помогать», и под «соседями» я имел введу себя…

Читать дальше →

+139

249

2 3 ...

6 7