Articles / Bookmarks / Profile of zartdinov / Habr

@zartdinov

User

ProfileArticlesPostsNewsComments390

BImLoshadka Jan 23 2024 at 07:37

Personal (jesus) стенд — решаем проблему тестовых контуров в компании

Medium

9 min

2.8K

Bimeister corporate blogIT Infrastructure*Development Management*DevOps*

Всем привет, меня зовут Захаров Антон, и я DevOps-инженер в компании Bimeister! Весь свой опыт я получил в этой компании, за 5 лет прошел путь от эникея до того, кем я работаю сейчас (большое спасибо коллегам!). Я расскажу, как на базе своих серверов и внутренних ресурсов мы создаем персональные стенды для разработки и тестирования нашего приложения.

+10

sacredtree Jan 11 2024 at 07:00

Добрый, плохой, злой… невыспавшийся?

8 min

4.2K

Газпромбанк corporate blogPopular science

Нужна помощь по работе? Посмотрите в офисе на поведение коллег. Тот, зевающий, с красными глазами — его лучше не спрашивать. Обратитесь к тому, кто явно выглядит выспавшимся.

Уезжаете на выходные и не с кем оставить кота? Прежде чем попросить друга, поинтересуйтесь, как он спал. Если товарищ гулял всю ночь — приходите завтра.

Ну и в ваших интересах давать родным высыпаться — они станут гораздо дружелюбнее. Наука подтверждает.

А именно подтверждает наука то, что эмпатия и альтруизм заканчиваются там, где начинается недосып.

В трёх повторных исследованиях мы продемонстрировали, что потеря сна является одним из ранее не признанных факторов, определяющих, решают ли люди помогать друг другу, что наблюдается в трёх различных масштабах (в рамках отдельных людей, между людьми и в обществе).

Это работает на нескольких уровнях: межличностном, групповом и национальном. Если засунуть невыспавшегося человека в МРТ, то окажется, что части мозга, которые отвечают за просоциальное поведение, дезактивируются. А когда стрелки часов туда-обратно переводят, то оно дезактивируется в масштабах стран.

На крупномасштабном национальном уровне мы продемонстрировали, что один потерянный час сна, вызванный переходом на летнее время, снижает реальную альтруистическую помощь, что было установлено на основе анализа более 3 миллионов благотворительных пожертвований.

Получается, что качество вашего сна — это залог не только индивидуального здоровья, но и коллективного. И альтруизма опять же.

Читать дальше →

+15

Helldar Jan 9 2024 at 08:12

Изучение мидлварей в Laravel 11

Easy

4 min

12K

PHP*Programming*Laravel*

Opinion

Translation

Выход Laravel 11 намечен на первый квартал 2024-го года, что может произойти уже в следующем месяце.

Я начинаю новый проект, и поскольку дата выхода очень близка, решил взглянуть на то что изменится в новом крупном обновлении. Помню как пол года назад прочитал в Laravel News статью о том, что Http Kernel уходит в небытие, и не придал этому особого значения.

Когда я создал проект с помощью команды laravel new project --dev, я был очень удивлён тем, насколько уменьшился размер проекта. Было очень удивительно видеть пустую папку config (можно опубликовать файлы конфигурации при помощи команды php artisan config:publish)!

И, конечно же, там нет Http Kernel. Итак... как же добавить или изменить мидлвари? До Laravel 11 ядро Http Kernel, располагающееся по пути app/Http/Kernel.php,было местом хранения всей конфигурации для мидлварей. Также до Laravel 11 не было необходимости трогать руками файл bootstrap/app.php, если только Вы не использовали фреймворк Lumen. Однако в новой версии его нужно...

Трогать мидлвари

+20

taychinov_01 Jan 8 2024 at 22:41

RabbitMQ как способ масштабирования ML проекта

Medium

6 min

6.5K

Python*Machine learning*

From sandbox

Данная статья будет полезна тем кто хочет расширить свой учебный (или даже рабочий) ML пет-проект добавлением новой технологии.

Весь код в статье написан для OpenSource проекта по детекции синтетического текста raisontext в рамках курса ML System Design от ODS.

tw0face Jan 9 2024 at 10:14

Pinterest для ИИ-картинок (с бесплатной нейросетью), поисковик одежды во всех интернет-магазинах и другие стартапы

4 min

2.3K

Product Radar corporate blogBusiness Models*Start-up developmentWeb services monetization*SaaS / S+S*

Digest

12 новых российских проектов для совместной работы, продвижения Телеграм-каналов, повышения конверсии интернет-магазина, ведения чек-листов в Телеграм и многое другое. Битва за «Продукт недели» началась!

Product Radar – здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

dvgureev Dec 22 2023 at 08:38

Большой тест GPT4, GPT3.5, YandexGPT, GigaChat, Saiga в RAG-задаче. Часть 1

Medium

7 min

24K

Data Engineering*Artificial IntelligenceMachine learning*Python*

From sandbox

Меня зовут Дмитрий Гуреев. Я занимаю должность CDTO в одной из медицинских компаний и параллельно веду работу по популяризации ИИ в среднем бизнесе. Генеративные модели привлекли мое внимание ещё в феврале 2022 года. Тогда я внедрил цифрового ассистента для полевых продавцов.

Летом 2022 года хороший знакомый из крупной компании предложил совместный эксперимент. Создать цифрового юриста, способного отвечать на вопросы первой линии, используя в качестве базы знаний 200-страничный регламент из более чем 1200 пунктов. Все это должно было функционировать в закрытом контуре. Без интернета.

Задача представлялась крайне интересной...

Вторая часть здесь.

+30

dvgureev Jan 7 2024 at 18:01

Большой тест GPT4, GPT3.5, YandexGPT, GigaChat, Saiga в RAG-задаче. Часть 2/2

Medium

5 min

27K

Data Engineering*Artificial IntelligenceMachine learning*Data Mining*

Review

В первой части статьи я рассказывал о создании цифрового юриста, способного отвечать на вопросы на основе 200-страничного регламента. Цель — работа такого юриста в закрытом контуре организации, без использования облачных технологий.

Особенностью эксперимента является в том, что оценку ответов делают обычные люди. Юристы.

Во второй части мы рассмотрим как и зачем делать локальные токензайзеры и попробуем запустить всё полностью на локальной машине с видеокартой 4090.

В конце будет приведена полная сравнительная таблица разных моделей и токензайзеров.

+28

Realife Jan 4 2024 at 21:04

Как я сделал ремастер всех серий Том и Джерри в 2к всего за пару месяцев

Easy

8 min

97K

Working with video*Machine learning*Artificial IntelligenceSound

From sandbox

Улучшение Том и Джерри из 480p в 1440p

С чего всё началось? Как-то я решил в третий раз с детства пересмотреть всю оригинальную коллекцию "Том и Джерри", но я, в отличие от маленького ребёнка, не потребляю любой контент вне зависимости от его качества. И вот я собрался посмотреть самую доступную версию, а там вот это цветошоу с постоянными царапинами на всём экране.

Мур-мур-мур

+387

193

yadro_team Jan 3 2024 at 10:06

Подборка книг для менеджеров и тимлидов, которые развивают команды в России

Easy

7 min

14K

YADRO corporate blogIT-companiesReading roomPersonnel Management*Professional literature*

Review

Возможно, в новый год вы вступаете в роли техлида, тимлида или менеджера команды. А может, вы хотите сделать следующий шаг в профессиональном развитии в новом году? Собрали для вас несколько полезных книг, которые помогут начинающим и опытным лидерам команд (да и линейным сотрудникам) разобраться в тонкостях работы с людьми. Особенность подборки в том, что она состоит исключительно из книг российских авторов, которые учитывают особенности менталитета людей и контекст, актуальный для компаний в нашей стране.

Вся подборка основана на рекомендациях Оксаны Нечитайловой, руководителя отдела сервисного дизайна продуктов YADRO, — в IT-сфере она уже 15 лет и имеет богатый опыт управления командами и построения процессов. Каждую книгу подборки Оксана сопроводила развернутыми комментариями, которые помогут вам понять, стоит ли вам тратить на нее время.

+21

SLY_G Dec 29 2023 at 07:05

Шведский стартап построил самый высокий деревянный ветряк в мире

5 min

EcologyEnergy and batteriesPopular science

Translation

Что сделано из того же дерева, что и рождественская ёлка, скреплено клеем и изготовлено на шведской фабрике для последующей самостоятельной сборки на месте?

Если вам на ум приходит мебель в плоских упаковках и фрикадельки, вы ошибаетесь. Если вы ответили "деревянная ветряная турбина", вы, наверное, провидец.

По мнению Modvion, шведского стартапа, который только что построил самую высокую в мире деревянную турбину, использование дерева в ветроэнергетике - это будущее. "У неё огромный потенциал", - говорит Отто Лундман, генеральный директор компании, когда мы смотрим вверх на новую турбину, расположенную в нескольких минутах езды от Гётеборга.

До кончика самой высокой лопасти - 150 метров, и мы - первые журналисты, которых пригласили заглянуть внутрь. Генератор мощностью 2 мегаватта на вершине только что начал подавать электричество в шведскую сеть, обеспечивая энергией около 400 домов. Мечта Лундмана и Modvion - поднять дерево и ветер гораздо выше.

+13

BeQuick Dec 27 2023 at 14:04

Использование Postgres-триггеров для исторических таблиц

Medium

4 min

12K

PostgreSQL*SQL*DevOps*

Review

Translation

В динамичной среде управления базами данных постоянно присутствует необходимость фиксировать и понимать изменения данных с течением времени. Начните управлять временем с использованием Postgres-триггеров, которые открывают легкий путь к сложному решению — историческим таблицам.

Представьте себе мир, в котором каждое изменение вашей базы данных оставляет след, фиксирующую эволюцию ваших данных. В этом заключаются перспективы исторических таблиц — концепции, которая выходит за рамки традиционных ограничений проектирования баз данных. В этом исследовании мы углубимся во временное измерение PostgreSQL, раскроем возможности Postgres-триггеров и их ключевую роль в создании и обслуживании исторических таблиц.

+11

ru_vds Dec 26 2023 at 13:00

Почему люди не пользуются вашим продуктом (даже если он может спасти тысячи жизней)

Easy

8 min

13K

RUVDS.com corporate blogInternet marketing*Product Management*Project management*

Opinion

Translation

«Красный дракон», судно Ланкастера

Когда Васко да Гама в 1497 году обогнул мыс Доброй надежды, больше половины его экипажа из 160 человек погибли от цинги. Этот показатель был довольно привычным: по статистике, от цинги умерло больше моряков, чем от войн, несчастных случаев и всего остального.

Представьте, что у вас есть новое изобретение, способное предотвратить цингу. Люди наверняка будут умолять поделиться им и вы сразу же станете героем?

Спустя сто с небольшим лет, в 1601 году, у английского мореплавателя Джеймса Ланкастера появилась гипотеза о том, что лимонный сок предотвращает цингу.

Его гипотеза не только была абсолютно верной (как мы знаем сейчас, цинга вызывается дефицитом витамина C), но он ещё и провёл эксперимент, результаты которого оказались вполне убедительными. Он добавил в рацион моряков на одном из его судов лимонный сок, а морякам на других судах не давал его. Ни один моряк на судне, где выдавался лимонный сок, не заболел цингой.

Моряки на всех остальных трёх судах умирали в больших и предсказуемых количествах. Чтобы продолжить маршрут, Ланкастеру пришлось перевести моряков с первого корабля на другие.

Возможно, вы подумаете, что британский флот сразу одобрил или, по крайней мере, проверил эту инновацию, которая была простой, дешёвой и практически на 100% эффективной.

Но лишь в 1795 году, почти двести лет спустя после успешного эксперимента Ланкастера и три сотни лет после времени Васко да Гамы флот наконец-то предписал всем своим морякам употреблять цитрусовые (из-за добавления лаймового сока в еду британцев и прозвали «лайми»). До коммерческого флота это нововведение добиралось ещё дольше.

Нам может показаться непостижимым, почему для принятия такой простой инновации, позволявшей избавиться от цинги и сохранить тысячи жизней, потребовалось так много времени. Кто-то может сказать, что её принятию помешали медленные коммуникации и распространение информации. Но ведь не на три сотни лет?

Читать дальше →

+54

FirstJohn Dec 26 2023 at 08:11

Простая проблема приводит к слишком большим числам для нашей Вселенной

9 min

27K

FirstVDS corporate blogAlgorithms*Mathematics*

Translation

Исследователи показывают, что навигация по определенным системам векторов является одной из самых сложных вычислительных задач.

Нечасто пятилетние дети могут разобраться в вопросах, связанных с информатикой, но и это может произойти. Предположим, например, что у девочки по имени Алиса есть два яблока, но она предпочитает апельсины. К счастью, её одноклассники разработали хорошую систему торговли фруктами со строго контролируемым обменным курсом: за яблоко, скажем, вы получите банан. Может ли Алиса совершить серию сделок, собирая и предлагая бананы или дыни, и получить свой любимый фрукт?

Звучит достаточно просто. «Вы можете пойти в начальную школу и рассказать об этом детям», — сказал Кристоф Хаазе, учёный из Оксфордского университета. «Люди подумают: «Это должно быть легко».

Но математическая задача, лежащая в основе дилеммы Алисы и называемая проблемой достижимости для систем сложения векторов, на удивление тонкая.

+20

comerc Dec 25 2023 at 20:03

Тонкая настройка Whisper для многоязычного ASR с помощью Hugging Face Transformers

21 min

19K

Data Mining*Machine learning*Artificial IntelligenceNatural Language Processing*

Translation

Предлагается пошаговое руководство по дообучению Whisper для любого многоязычного набора данных ASR с использованием Hugging Face ? Transformers. Эта заметка содержит подробные объяснения модели Whisper, набора данных Common Voice и теории дообучения, а также код для выполнения шагов по подготовке данных и дообучению. Для более упрощенной версии с меньшим количеством объяснений, но со всем кодом, см. соответствующий Google Colab.

badcasedaily1 Dec 24 2023 at 17:01

Проектирование fault-tolerant систем на Go

Medium

11 min

7.9K

OTUS corporate blogHigh performance*Programming*Designing and refactoring*Go*

Review

Привет, Хабр!

Fault-tolerant системы — это те, которые способны продолжать функционировать даже в условиях частичных сбоев или неисправностей. Основная фича таких систем заключается в том, чтобы обеспечить непрерывность работы приложения даже при возникновении ошибок или непредвиденных ситуаций. Это достигается за счет ряда архитектурных и программных решений, направленных на предотвращение полного отказа системы при возникновении отдельных сбоев.

Go благодаря своей простоте, производительности и, что наиболее важно, поддержке конкурентности на уровне языка, становится идеальным выбором для создания fault-tolerant систем.

+12

0a1a2a3a4a5 Dec 24 2023 at 08:44

Как правильно файн-тюнить ChatGPT?

Easy

6 min

18K

Machine learning*Natural Language Processing*

Tutorial

пппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппппп

+21

starosta2012 Dec 22 2023 at 10:16

Микрофронтенд для самых маленьких

Easy

9 min

26K

Ozon Tech corporate blogWebsite development*JavaScript*Programming*Microservices*

Tutorial

Всем привет. Меня зовут Алексей. Сейчас я работаю frontend-разработчиком в компании Ozon. В свободное время мне нравится читать про новые технологии, фреймворки, а учитывая то, с какой скоростью развивается frontend, я никогда не скучаю. В этой статье пойдет речь о микрофронтах. В частности, мы посмотрим, как их реализовать на самом базовом уровне, разберемся, когда они нужны, а когда даже не стоит смотреть в их сторону.

+31

YaphetS7 Dec 20 2023 at 14:17

Как дообучать огромные модели с максимальным качеством и минимальными затратами? LoRA

Medium

8 min

5.6K

Machine learning*Artificial Intelligence

Review

✏️ Technotext 2023

paper link

hf implementation

Для ответа на вопрос в заголовке - погрузимся в статью.

Саммари статьи:

Обычно LLM-ку предобучают на огромном корпусе, потом адаптируют на down-stream tasks. Если LLM-ка была большая, то мы не всегда можем в full fine-tuning. Авторы статьи предлагают Low-Rank Adaptation (LoRA), который замораживает предобученные веса модели и встраивает "rank decomposition matrices" в каждый слой трансформера, очень сильно понижая кол-во обучаемых параметров для downstream tasks.

Compared to GPT-3 175B fine‑tuned with Adam, LoRA can reduce the number of trainable parameters by 10,000 times and the GPU memory requirement by 3 times. LoRA performs on‑par or better than finetuning in model quality on RoBERTa, DeBERTa, GPT-2, and GPT-3, despite having fewer trainable parameters, a higher training throughput, and, unlike adapters, no additional inference latency.

Многие NLP-приложения требуют решения разных задач, что зачастую достигается путем дообучения большой модели на несколько разных downstream tasks. Самая важная проблема в классическом fine-tuning'е - новая модель содержит столько же параметров, сколько начальная.

Есть работы, где авторы адаптируют только некоторые параметры или обучают внешний модуль для каждой новой задачи. Таким образом, нам необходимо для каждой новой задачи хранить лишь веса, связанные с этой задачей. Однако, имеющиеся методы страдают от:

Inference latency (paper 1 - Parameter-Efficient Transfer Learning for NLP).

Reduced model's usable sequence length (paper 2 - Prefix-Tuning: Optimizing Continuous Prompts for Generation).

Часто не достигают бейзлайнов, если сравнивать с "классическим" fine-tuning'ом

SladFermer Dec 16 2023 at 07:38

Изучаем и парсим биржевую информацию Мосбиржи. Наш первый парсер на Python, разбор кода

7 min

28K

Python*Algorithms*Finance in IT

From sandbox

Как устроен ISS MOEX (информационно-статистический сервер Московской Биржи) и как можно парсить с него биржевые данные. Разбор кода программы. Это первое знакомство с MOEX, дальше будем изучать куда как более актуальный для алготрейдинга продукт мосбиржи - ALGOPACK. Однако перед этим общее знакомство с архитектурой iss moex должно быть. Стратегическая задача - использовать данные для алготрейдинга (работы торгового робота) напрямую с московской биржи.

+11

nsuvorov Oct 27 2022 at 06:30

Как автоматизировать рутинные операции с помощью Jupyter, Python и Selenium

8 min

26K

МТС corporate blogPython*

Привет, Хабр! Меня зовут Николай Суворов, я руководитель направления в МТС Digital. Занимаюсь продуктом МТС Premium – это единая подписка на сервисы МТС и партнеров. Сегодня я расскажу о нашем опыте создания робота для автоматизации повторяющихся действий сотрудников с помощью Jupyter, Python и Selenium. Статья будет интересна прежде всего менеджерам, которые хотят оптимизировать свою работу. Разработчикам мой текст будет полезен с точки зрения понимания возможностей по ускорению повторяющихся действий в интерфейсах. Весь необходимый код – внутри.

+30

1 2 ...

9 10

12 13 ...

50 51