Articles / Bookmarks / Profile of onehell / Habr

John Doe @onehell

Лень и чревоугодие

ProfileArticles2PostsNewsComments197

Kosmak Mar 17 at 07:00

CAG и KAG: Улучшенные методы дополнения генерации после RAG

Medium

7 min

Raft corporate blogArtificial IntelligenceNatural Language Processing*

Review

Если вы следите за развитием технологий в области обработки естественного языка, то наверняка слышали о технологии Retrieval Augmented Generation (RAG), которая объединяет методы поиска с генеративными моделями для создания более интеллектуальных, обогащенных контекстом ответов. Но, как и любая технология, RAG имеет свои особенности, и именно здесь на помощь приходят два подхода: Cache-Augmented Generation (CAG) и Knowledge-Augmented Generation (KAG). В этой статье мы подробно рассмотрим, что представляют собой эти методы, чем они отличаются друг от друга и в чем заключается их преимущество. Давайте начнем!

Читать далее ->

+11

Dhwtj Jan 12 at 08:00

Архитектурные паттерны для высокой масштабируемости. Часть 2

Hard

14 min

22K

System Analysis and Design*Microservices*

Review

Эта статья предназначена для разработчиков, архитекторов и технических лидеров, которые ищут способы оптимизации производительности и масштабируемости своих систем.

Продолжение статьи об архитектурных паттернах для масштабируемости приложений.

+14

Dhwtj Jan 11 at 16:00

Архитектурные паттерны для высокой масштабируемости. Часть 1

Hard

16 min

24K

System Analysis and Design*High performance*Microservices*

Review

Когда стоит использовать более простые подходы (например, шардирование, репликацию, CQRS) вместо того, чтобы сразу переходить к микросервисам.

Какие trade-offs возникают при выборе каждого из паттернов или архитектурных решений.

Как избежать излишней сложности, которая может быть вызвана преждевременным внедрением сложных архитектур.

Цель статьи — помочь вам найти баланс между производительностью, масштабируемостью и сложностью системы. Вместо того чтобы сразу применять микросервисы, мы предлагаем сначала рассмотреть более легкие инструменты, делая выбор осознанно и обоснованно.

+21

101

Byurrer Oct 25 2024 at 08:26

Как я собирал свой первый домашний сервер

Easy

11 min

40K

Computer hardware

From sandbox

В этой статье поделюсь как я собирал свой первый домашний сервер для виртуализации, с какими трудностями столкнулся на всем пути сборки и как их решал (правильно или неправильно), поделюсь личными выводами. А в конце посчитаем все это дело в цифрах (на первую половину 2023 года). Фото различных элементов прилагаются.

+40

tagir_valeev Dec 4 2012 at 04:20

Накладные расходы памяти у коллекций

7 min

91K

Java*

Мне было интересно, какие коллекции сколько съедают дополнительной памяти при хранении объектов. Я провёл замеры накладных расходов для популярных коллекций, предполагающих хранение однотипных элементов (то есть списки и множества) и свёл результаты на общий график. Вот картинка для 64-битной Hotspot JVM (Java 1.6):

Читать дальше →

+61

Munoon Jun 5 2020 at 20:29

Подтверждение входа с помощью Telegram на Spring Boot

19 min

16K

Java*Information Security*

Tutorial

Technotext 2020

Recovery Mode

Недавно столкнулся с проблемой: все приложения используют Telegram-бота в качестве подтверждения входа в аккаунт, а мое — нет. Я был настроен серьезно и провёл уйму времени в интернете в поиске туториала, но меня ждало разочарование. Задача сложная и имеет много подводных камней, а туториалов — ноль.

Следующую неделю я потратил на написание своей имплементации данной фичи и готов поделиться успехом.

Весь код, который мы сегодня напишем, доступен в репозитории на GitHub. Рекомендую параллельно с чтением статьи проверять этот код в проекте, чтобы не упустить детали.

it_man Mar 19 2020 at 14:18

“Давайте использовать Kubernetes!” Теперь у вас 8 проблем

6 min

14K

MWS corporate blogKubernetes*

Translation

Если вы используете Docker, следующим логичным шагом кажется переход на Kubernetes, он же K8s, правильно? Ну, предположим. Однако решения, предназначенные для 500 инженеров-программистов, одновременно разрабатывающих одно приложение, достаточно сильно отличаются от решений для 50 человек. А решение для команды из 5 программистов — это и вовсе другая история.

Если вы работаете в маленькой команде, Kubernetes, вероятнее всего, не для вас. Он принесет вам много боли в обмен на крайне скромные преимущества.
Давайте разберемся, почему это может произойти.

Читать дальше →

+13

106

phillennium Mar 3 2020 at 10:08

Что такое «чистый код» в 2020-м?

10 min

43K

JUG Ru Group corporate blogIT systems testing*Perfect code*JavaScript*.NET*

^{«Чистый код» и чистый кот}

Разработчиков хлебом не корми, дай поспорить о чистоте кода: например, недавно шумиху навёл пост Дэна Абрамова «Goodbye, Clean Code».

Но при этом у самого понятия «чистый код» нет чёткого определения. Главная книга по этому вопросу — «Clean Code», где Роберт «Дядюшка Боб» Мартин сразу заявляет: «сколько программистов, столько и определений». Впрочем, из этого он делает не вывод «говорить об этом бесполезно», а вывод «стоит сравнить разные определения». Поэтому в книге он привёл мнения нескольких выдающихся программистов о том, что такое чистый код.

Нам стало интересно: в 2020-м представления человечества о чистом коде остались теми же, или с выхода книги как-то изменились? Различаются ли мнения у разных айтишников: может, бэкендеры видят всё с одного ракурса, а тестировщики с другого?

В апреле Дядюшка Боб прилетит в Петербург выступить на трёх наших конференциях, и они как раз по трём разным направлениям (про .NET-разработку, про тестирование и про JavaScript). Поэтому мы спросили нескольких спикеров этих конференций, что такое чистый код для них, чтобы сравнить мнения экспертов индустрии в 2020-м.

А поскольку тема холиварная, наверняка кто-то из вас окажется не согласен с какими-то из мнений. В таком случае айда спорить в комментариях, это тоже весело!

UPD: Когда мы писали эту статью, Роберт планировал приехать на наши конференции. К сожалению, ситуация изменилась. Также из-за запрета на проведение массовых мероприятий мы перенесли конференции на другие даты. Следите за обновлениями на сайте конференции. 13 марта мы обновили этот пост, чтобы он не содержал некорректную информацию.

Читать дальше →

+36

Shapelez Mar 19 2020 at 15:12

Оказывается, интернет-бизнес выживает в текущих условиях. Почему? Удаленка в ДНК

5 min

8.1K

Qrator Labs corporate blogPersonnel Management*IT careerHealth

«В 1665 году Кембриджский университет закрылся из-за эпидемии чумы. Исааку Ньютону пришлось работать из дома. Он открыл дифференциальное и интегральное исчисление, а также закон всемирного тяготения».

К сожалению, мы живем в выдающееся время. С наступлением 2020 года и эпидемией COVID-19 сотрудники по всему миру закрываются дома на карантин, стараясь изо всех сил поддерживать нормальное течение жизни, а значит, и продолжать работать. Но есть одно отличие от всех предыдущих инфекционных пандемий, которые пережило человечество — в этот раз у нас есть Интернет.

Читать дальше →

+35

nmivan Dec 26 2019 at 19:04

23 минуты. Оправдание тугодумов

3 min

194K

Reading roomPersonnel Management*Brain

Я всегда думал, что я – тупой. Точнее, что я — тугодум.

Проявлялось это просто: на совещаниях и обсуждениях я не мог быстро придумывать решение задачи. Все чего-то говорят, иногда умное, а я – сижу и молчу. Даже как-то неудобно было.

Все остальные тоже думали, что я тупой. Поэтому меня перестали звать на совещания. Звали тех, кто что-то говорит без промедления.

А я, выйдя с совещания, продолжал думать над задачей. И, как говорит устойчивое идиоматическое выражение, хорошая мысля приходит опосля. Находил нормальное, иногда интересное, а бывало – что и офигенное решение. Но оно уже никому не было нужно. Типа после драки кулаками не машут.

Просто культура в тех компаниях, где я начинал работать, была модерновая. Ну, как там это бывает – «совещание должно закончиться принятием решения». Вот чего придумали на совещании, то и принимается. Даже если решение — полная фигня.

Читать дальше →

+365

334

ilammy Dec 14 2019 at 17:16

CreateRemoteThread для Linux

46 min

15K

C*Abnormal programming*Development for Linux*System Programming*

Tutorial

Мицуха несёт новые потоки В WinAPI есть функция CreateRemoteThread, позволяющая запустить новый поток в адресном пространстве другого процесса. Её можно использовать для разнообразных DLL-инъекций как с нехорошими целями (читы в играх, кража паролей, и т. д.), так и для того, чтобы на лету исправить баг в работающей программе, или добавить плагины туда, где они не были предусмотрены.

В целом эта функция обладает сомнительной прикладной полезностью, поэтому не удивительно, что в Linux готового аналога CreateRemoteThread нет. Однако, мне было интересно, как он может быть реализован. Изучение темы вылилось в неплохое приключение.

Я подробно расскажу о том, как с помощью спецификации ELF, некоторого знания архитектуры x86_64 и системных вызовов Linux написать свой маленький кусочек отладчика, способный загрузить и исполнить произвольный код в уже запущенном и работающем процессе.

Для понимания текста потребуются базовые знания о системном программировании под Linux: язык Си, написание и отладка программ на нём, осознание роли машинного кода и памяти в работе компьютера, понятие системных вызовов, знакомство с основными библиотеками, навык чтения документации.

Читать дальше →

+74

tsypanov Nov 21 2019 at 14:32

Вкалывают роботы — счастлив человек

6 min

4.4K

Java*Programming*

Tutorial

Позабыты хлопоты,
Остановлен бег,
Вкалывают роботы,
Счастлив человек!

Из фильма ~~"Детство Терминатора"~~ "Приключения Электроника"

Привет, сегодня мы снова поговорим о производительности. О производительности труда разработчиков.

Я расскажу о том, как средствами "Идеи" прокачать этот навык. Надеюсь, мои советы пригодятся вам, замечания и улучшения приветствуются. Поехали!

Читать дальше →

denys_kurinnoy Oct 31 2019 at 08:07

Вымирание компьютерных файлов

9 min

72K

ua-hosting.company corporate blogIT Standards*Interfaces*History of ITData storage*

Translation

Новомодные технологические сервисы меняют наши интернет-привычки.

Я люблю файлы. Мне нравится переименовывать их, перемещать, сортировать, изменять способ отображения в папке, создавать резервные копии, выгружать их в интернет, восстанавливать, копировать и даже дефрагментировать их. Как метафора способа хранения информационного блока, я думаю, они великолепны. Мне нравится файл как единое целое. Если мне нужно написать статью, она окажется в файле. Если мне нужно выдать в свет изображение, оно будет в файле.

Читать дальше →

+138

400

MaxRokatansky Sep 27 2019 at 14:25

Топ 20 навигационных фич в IntelliJ IDEA. Часть 2

5 min

39K

OTUS corporate blogDevelopment for Android*Java*

Translation

Перевод статьи подготовлен специально для студентов курса «Android-разработчик. Продвинутый курс». И хотя в данном материале речь пойдет преимущественно о Java, материал будет полезен Android-разработчикам

Первая часть тут

Читать дальше →

+18

romicohen Sep 21 2019 at 07:44

Тяжела ли работа программиста — взгляд с точки зрения психофизиологии

4 min

66K

HealthBrain

From sandbox

Во первых словах:

— Работа программистом-разработчиком — тяжелый труд, сравнимый с валкой леса топором. И проблематика данного труда сильно недооценена в общественном сознании.

Сейчас я обосную этот тезис с научной точки зрения.

Читать дальше →

+85

366

PatientZero Sep 10 2019 at 08:52

Почему провалилась соцсеть Google+

10 min

61K

Instant Messaging*Social networks and communitiesProduct Management*Community management*

Translation

Я присоединился к команде разработчиков Google Plus вскоре после появления этого проекта в 2010 году, перейдя из команды Blogger. Я участвовал в проекте три года, сначала поработав в команде разработки профилей, затем перейдя в отдел развития и привлечения пользователей (Growth and Engagement Team, GET), и наконец оказался в Project Madonna и Project Zorro, где помогал в упразднении политики «реальных имён».

Я был низовым разработчиком ПО пятого уровня, поэтому принимал довольно незначительное участие в проекте, но стал свидетелем множества решений, принятых на этапе первоначальной разработки Google Plus, и мне кажется, что я могу указать на критические ошибки, сделанные на ранних этапах истории этой соцсети. Дело не только в том, что все мы крепки задним умом — даже тогда у меня было чёткое ощущение того, что в долговременной перспективе эти решения нанесут ущерб. С тех пор поменялось только то, что я теперь могу изложить свои аргументы более доходчиво.

Я не стану утверждать, что описываемые мной проблемы стали единственными, с которыми столкнулась Google Plus, но полагаю, они оказали значительный вклад в постепенное угасание проекта. Всё нижеизложенное является моим личным мнением, а не нынешнего нанимателя или иных лиц.

Читать дальше →

+99

246

xpendence Sep 4 2019 at 04:50

Spring Cache: от подключения кэширования за 1 минуту до гибкой настройки кэш-менеджера

12 min

122K

Java*Programming*

Tutorial

Раньше я боялся кэширования. Очень не хотелось лезть и выяснять, что это такое, сразу представлялись какие-то подкапотные люто-энтерпрайзные штуки, в которых может разобраться только победитель олимпиады по математике. Оказалось, что это не так. Кэширование оказалось очень простым, понятным и невероятно лёгким во внедрении в любой проект.

В данном посте я постараюсь объяснить о кэшировании так же просто, как это сейчас понимаю я. Вы узнаете о том, как внедрить кэширование за 1 минуту, как кэшировать по ключу, устанавливать время жизни кэша, и многие прочие штуки, которые необходимо знать, если Вам поручили закэшировать что-то в вашем рабочем проекте, и Вы не хотите ударить в грязь лицом.

Читать дальше →

olegbunin Aug 15 2019 at 12:40

TCP против UDP или будущее сетевых протоколов

27 min

179K

Конференции Олега Бунина (Онтико) corporate blogSystem Analysis and Design*High performance*Programming*Development of communication systems*

Перед каждым сервисом, генерирующим хотя бы 1 Мбит/сек трафика в интернете возникает вопрос: «Как? по TCP или по UDP?» В прикладных областях, в том числе и платформах доставки уже сложились предпочтения и традиции принятия подобных решений.

По идее, если бы, к примеру, однажды один ленивый разработчик не попробовал развернуть свой ML на Python (потому что только его и знал), мир скорее всего никогда не проникся бы такой любовью к презренному «супер-джава-кодерами» языку. А сегодня слабости этого языка в прошлом контексте применения безоговорочно обеспечивают ему первенство в развертывании и запуске многочисленных майнерских А/Б.

Сравнивать можно многое: ARM с Intel, iOS и Android, а Mortal Kombat с Injustice. И нарваться на космический холивар, поэтому вернемся к теме доставки огромных объемов разноформатного контента.

Десять лет назад все были абсолютно уверены, UDP — это что-то про негарантированную доставку. Если нужен надежный протокол — это TCP. И вопреки традициям в этой статье мы будем сравнивать такие, кажущиеся несравнимыми вещи, как TCP и UDP.

Осторожно, под катом 99 иллюстраций и схем и все важные.

+156

dbelob Jul 6 2019 at 19:04

Кирилл Толкачёв и Максим Гореликов про Spring Boot на jug.msk.ru

2 min

8.9K

JUG Ru Group corporate blogJava*

На встрече московского сообщества Java-разработчиков jug.msk.ru, состоявшейся 28 июня 2019 года традиционно в офисе компании КРОК, Кирилл Толкачёв и Максим Гореликов представили свой доклад о Spring Boot: какие задачи можно решить с помощью него, какие сложности могут при этом возникнуть и как с ними бороться.

Читать дальше →

+22

gmorfy Apr 24 2019 at 17:03

Steal: кто крадёт у виртуалок процессорное время

11 min

21K

VK corporate blogVirtualization*Configuring Linux*System administration*

Привет! Хочу рассказать простым языком о механике возникновения steal внутри виртуальных машин и о некоторых неочевидных артефактах, которые нам удалось выяснить при его исследовании, в которое мне пришлось погрузиться как техдиру облачной платформы Mail.ru Cloud Solutions. Платформа работает на KVM.

CPU steal time — это время, в течение которого виртуальная машина не получает ресурсы процессора для своего выполнения. Это время считается только в гостевых операционных системах в средах виртуализации. Причины, куда деваются эти самые выделенные ресурсы, как и в жизни, весьма туманны. Но мы решили разобраться, даже поставили целый ряд экспериментов. Не то чтобы мы теперь всё знаем о steal, но кое-что интересное сейчас расскажем.

Читать дальше →

+58

2 3 ...

13 14