Articles / Bookmarks / Profile of Uroborus / Habr

@Uroborus

User

ProfileArticlesPostsNewsComments6

@Pahandrovich Mar 31 at 11:02

Как мы учили нейросеть разбираться в сложных документах: задача семантического поиска

Medium

17 min

3.6K

YADRO corporate blogArtificial IntelligenceSearch engines * Machine learning *

Привет! Меня зовут Павел Яковлев, я инженер по разработке ПО искусственного интеллекта в YADRO. В команде GenAI мы занимаемся умными продуктами на основе корпоративных баз данных.

В проектах мы часто используем современные генеративные модели и энкодеры. В статье расскажу, как мы в компании разрабатываем и оптимизируем семантический поиск по сложным документам: PDF, HTML и DOCX.

+25

@LesnoyChelovek Mar 19 at 11:11

Книга «PostgreSQL 17 изнутри»: заглянем под капот слона

Easy

3 min

4.5K

Postgres Professional corporate blogReading roomProfessional literature * PostgreSQL *

Review

Компания Postgres Professional выпустила обновленную книгу Егора Рогова «PostgreSQL 17 изнутри», которая станет настольной для тех, кто хочет понимать, как устроена СУБД. От многоверсионности до типов индексов – все, что нужно для эффективной работы и оптимизации, теперь под рукой.

Читать обзор книги

+19

@yulian_tyrnov Mar 10 at 07:16

Конспект книги «Atomic Habits» для IT: как маленькие привычки приводят к большим успехам

Easy

3 min

10K

Popular scienceThe future is here

Opinion

Сегодня хочу рассказать, как книга Джеймса Клира «Atomic Habits» может перевернуть ваше представление о продуктивности, особенно если вы работаете в IT. В книге речь не о грандиозных переменах, а о крошечных, почти незаметных шагах, которые со временем складываются в настоящий прорыв. И да, кто знает, возможно, эти привычки даже спасут ваш утренний кофе от похмельной небрежности.

@full_moon Jan 24 at 13:53

50 исследований на тему нейросетей, которые помогут вам стать ИИ-инженером от бога

9 min

13K

Magnus Tech corporate blogResearch and forecasts in IT * Machine learning * Artificial Intelligence

Digest

Translation

В этом дайджесте мы собрали 50 знаковых научных работ в области ИИ за последние годы. Подборка охватывает десять ключевых направлений разработки нейросетей: от промтинга и проектирования бенчмарков до файнтюнинга и компьютерного зрения.

Материал будет полезен как для опытных ИИ-инженеров, которые хотят прокачать свои навыки разработки, так и тем, кто только начинает свое знакомство с нейросетями и находится в поисках точки входа в ту или иную тему.

+32

@chlorine Jan 24 at 04:00

Горизонтальное масштабирование базы данных. Репликация. Партицирование. Шардирование

Easy

11 min

15K

Programming * Algorithms * System Programming * System Analysis and Design * Database Administration *

Tutorial

В современном мире данных нагрузка на базы данных стремительно растёт. Когда один сервер перестаёт справляться с объёмом запросов, встаёт вопрос о масштабировании: как эффективно распределить нагрузку, сохранив высокую производительность и доступность?

Существует множество стратегий решения указанной проблемы. Сегодня мы разберем самые популярные из них — репликацию, партициривание и шардирование. Рассмотрим их принципы, плюсы и минусы, а также лучшие практики применения. Понимание этих техник поможет разработчикам и архитекторам строить отказоустойчивые, масштабируемые и высокопроизводительные системы хранения данных.

+17

@sokolcati Jan 15 at 11:00

Как поймать и обезвредить проблемные запросы в PostgreSQL

Medium

10 min

11K

Postgres Professional corporate blogPostgreSQL * Database Administration *

Tutorial

«Как ускорить выполнение запросов к базам данных?» — извечный вопрос админов и пользователей. Казалось бы, раньше всё работало неплохо, но стоило клиентской базе вырасти в пять раз, как всё замедлилось. Знакомая ситуация? В этой статье расскажем, как найти запросы, которые можно ускорить, и оптимизировать их.

Статья подготовлена по материалам выступления на конференции PGCONF.СПБ 2024.

Бежим ловить запросы!

+42

@ProstoKirReal Jan 13 at 09:06

Сложно о простом. Как работает интернет. Часть 1. Что такое коммутатор, маршрутизатор и примеры работы простых сетей

Easy

14 min

89K

Timeweb Cloud corporate blogIT-companiesIT Infrastructure * Network hardwareNetwork technologies *

Review

Приветствую, коллеги! Меня зовут @ProstoKirReal. Мне бы хотелось с вами обсудить как работает интернет от кабелей на витой паре, соединяющие простые локальные сети до подводных коммуникационных кабелей соединяющие между собой континенты и основные операторские сети.

Поскольку в одной статье невозможно охватить всю тему целиком, я разделю подготовленный материал на несколько частей. Сегодня мы начнем с базовых понятий.

+145

@Linx Nov 18 2024 at 12:49

Оптимизация PostgreSQL: параметры для ускорения запросов

Medium

5 min

9.3K

Linx corporate blogDatabase Administration * PostgreSQL * Cloud services *

Tutorial

Почему SQL-запросы иногда работают не так быстро, как хотелось бы? PostgreSQL — мощный инструмент, который раскрывает свои возможности при правильной настройке. В этой статье мы разберем ключевые параметры, влияющие на производительность запросов, а также дадим рекомендации, как их использовать. В конце мы обсудим, как избежать ошибок при конфигурации и почему мониторинг так важен.

+12

@rip_m Nov 13 2024 at 09:01

Что нового в .NET 9?

5 min

14K

PVS-Studio corporate blog.NET * C# * Programming *

.NET 9 вышел в релиз, и значит, можно начинать переносить свои проекты на новую версию. В этой статье мы рассмотрим новые улучшения и фишки .NET: C# 13, производительность, BuildCheck, GC, LINQ, NuGet Audit и прочее.

+11

@Terentew Nov 10 2024 at 01:27

Как растить мышцы двумя тренировками в неделю? Подход для людей с полной занятостью и готовый план на 2 дня

9 min

149K

HealthReading room

Review

Силовые тренировки уже давно не инструмент для соревновательного бодибилдинга и пауэрлифтинга. Сегодня силовые — неотъемлемый инструмент здоровой и качественной жизни, в котором вы должны быть заинтересованы.

Только вот некоторые культурные и даже профессиональные мифы повышают порог вхождения в тренажерный зал. Взращивают ментальный барьер, к которому нужно морально готовиться, настраиваться и из-за этого постоянно откладывать начало тренировок. Один из таких барьеров — время. Многие думают, что тренировки обязательно должны быть продолжительными, чтобы быть эффективными. Второй барьер — утомление. Не редко можно услышать что-то из разряда “не устал = не потренировался”, “не болит = не растет”.

Сейчас я постараюсь показать и доказать, что это не так и можно действовать намного эффективнее, опираясь на науку об упражнениях, а не мифы. С помощью рационального подхода делать хороший результат ценой приемлемых усилий. Это не будет материал из разряда “фигура Апполона за 10 минут в день”, но кое-что более изящное, чем классический убийственный метод и подходящее вам — людям с полной занятостью, которым хочется ввести силовые в жизнь, чтобы поддерживать организм и получать от этого бонусы внешнего вида.

В данной статье мы составим экономный по времени тренировочный план, подберем упражнения и применим инструменты, которые помогут еще сократить длительность тренировки без потери качества. Поехали.

+54

238

@badcasedaily1 Oct 11 2024 at 16:46

ConcurrentBag в C#

Easy

6 min

2.9K

OTUS corporate blogC# * Programming *

Review

Привет, Хабр!

В многопоточном программирование постоянно нужно решать задачи, связанные с доступом к данным из нескольких потоков одновременно. И тут очень кстати ConcurrentBag — коллекция, которая была добавлена в .NET Framework 4.0 специально для таких случаев. Она подходит для ситуаций, где порядок элементов не важен. Если нужно просто кидать данные в мешок, пока куча потоков их туда же добавляет.

Поэтому ConcurrentBag создана для сценариев, где один и тот же поток часто и добавляет, и извлекает данные. Поэтому эта коллекция идеальна для паттернов типа Producer-Consumer, где один поток наполняет коллекцию, а другой извлекает данные для дальнейшей обработки. Но самое классное, что работает она по принципу work-stealing.

+16

@t3chnowolf Jun 13 2024 at 14:55

Библиотека программиста: книги о том, как построить карьеру в IT

5 min

МТС corporate blogIT careerReading room

Успешная карьера разработчика — это не только навыки и знания, но и умение «продавать» себя, сохранять баланс между работой и личной жизнью, а также избегать выгорания. В этой подборке рассмотрим книги, которые помогут пройти путь от новичка до профессионала, оставаясь на гребне волны в быстро меняющейся IT-индустрии.

@SantrY May 28 2024 at 09:05

Настоящий хоррор: кибербезопасность в автомобильной индустрии

Easy

14 min

11K

Бастион corporate blogTransportInformation Security * Legislation in IT

Analytics

Автопром сделал первый шаг в цифровую эпоху еще в 1967 году, когда в Германии выпустили Volkswagen Typ 3 с электронной системой впрыска D-Jetronic от Bosch. Сегодня же компьютерные системы управляют почти всеми функциями большинства авто — от режимов работы двигателя до стеклоочистителей.

Как всегда, технический прогресс имеет свою оборотную сторону: чем больше роль ПО в работе техники, тем серьезнее угрозы информационной безопасности. Риски стали выше с появлением так называемых подключенных автомобилей — connected cars. Дошло до того, что хакеры могут дистанционно перехватить контроль над машиной в реальности: теперь это не просто фантазии сценаристов «Форсажа».

В статье рассмотрим основные виды автомобильных кибератак и связанные с ними риски. Также поговорим о том, как в мире и в России пытаются бороться с такими угрозами и какие это приносит результаты.

Читать дальше →

+40

@Stefanio Mar 12 2024 at 09:00

Самый простой и подробный гайд по конкурентным коллекциям в C#

Easy

18 min

47K

RUVDS.com corporate blog.NET * C# * Concurrent computing * Programming *

FAQ

Когда несколько потоков обращаются к общим ресурсам, должна быть обеспечена потокобезопасность, чтобы избежать повреждения данных и неожиданного поведения.

Конкурентные коллекции в C# предлагают встроенные механизмы для обработки конкурентного доступа, что делает их мощным инструментом в программировании с конкурентным доступом.

В рамках статьи я попробую объяснить System.Collections.Concurrent настолько, насколько это возможно, включая примеры и сценарии использования. Также будет затронута тема сравнения с неизменяемыми (immutable) и замороженными (frozen) коллекциями.

Читать дальше →

+60

@DandyDan Feb 19 2024 at 14:04

Алгоритм Monte Carlo Tree Search простыми словами

11 min

20K

Selectel corporate blogPopular scienceMachine learning *

Можно ли научить ИИ играть в настольную игру и выигрывать в ней, если мы сами не знаем как это сделать? Да! И один из способов — использовать алгоритм Monte Carlo Tree Search (MCTS). Он актуален даже сейчас, в эпоху развития нейронных сетей.

У многих людей, в том числе и у меня, поначалу были сложности с пониманием алгоритма, как и с верой в то, что он может хорошо играть. В этой статье хочу рассказать об MCTS максимально просто и помочь разобраться в нем новичкам. В первой главе расскажу об основах, с которыми многие могут быть уже знакомы. Однако считаю, что они действительно важны для понимания. Подробности под катом!

Читать дальше →

+40

@rukhi7 Feb 12 2024 at 04:45

Как на самом деле Async/Await работают в C#. Часть 6. Анализ результатов компиляции асинхронных вызовов

Hard

24 min

7.2K

Programming * Perfect code * .NET * C# * ООP *

Tutorial

В этой статье мы продолжим разбирать содержание работы Stephen Toub-а: «How Async/Await Really Works in C#». В этот раз, в след за автором исходного Поста мы рассмотрим код, который генерирует C# компилятор для реализации асинхронных вызовов и множество связанных с этим сущностей-понятий-приемов, таких как: контекст исполнения, боксинг, стейт машина, стек, потоки, … Эта 6-я часть, пожалуй, основная часть всей работы, которая непосредственно отвечает на вопрос: «Как на самом деле Async/Await работают (и компилируются) в C#»

Там, где мне придется цитировать содержание исходного текста в переводе (то есть более-менее дословно переводить), оно будет выделено подчеркнутым курсивом.

Возможно вам будет интересно сравнить эту мою работу с первоначальным переводом.

@aasmc Feb 13 2024 at 11:53

Использование Postgres и JSONB для хранения товаров, характеристик и цен

Medium

17 min

19K

Kotlin * Java * PostgreSQL *

Tutorial

Всем привет! Меня зовут Александр, в данное время я на фрилансе занимаюсь проектом по созданию очередного маркетплейса. В процессе работы мы столкнулись с далеко не новой проблемой организации хранения информации о товарах, имеющих различные характеристики и цену, зависящую от характеристик. На нашем проекте применяется принцип CQRS: запись осуществляется в Postgres, чтение происходит из OpenSearch, а данные между ними перемещаются по шине, реализованной на Kafka. Такой подход обусловил использование реляционной БД для решения несвойственной ей задачи.

Чтобы увидеть, почему эта задача не нак проста, как кажется с первого взгляда, представим, что в нашем каталоге есть футболки мужские всего с двумя атрибутами: цвет и размер. Мы хотим хранить товар с названием "Футболка Junior Developer", она представлена в синем, красном и зеленом цветах, и каждый цвет доступен в нескольких размерах. Добавляя немного сложности, представим, что цена конкретной футболки также варьируется в зависимости от цвета и размера. Как представить эту сущность в реляционной базе данных, с учетом того, что продавец футболки может в какой-то момент добавить новые атрибуты для своего товара, например, габариты упаковки для отправки (длина, ширина, высота)?

С одной стороны, можно использовать подход: Entity-Attribute-Value. Он позволяет гибко настраивать связи между сущностями, их атрибутами и значениями, сохраняя возможность динамического добавления новых атрибутов сущности. Однако у такого подхода есть свои недостатки. На них останавливаться не буду - в статье: "Замена EAV на JSONB в PostgreSQL" они приведены, также там есть сравнение по производительности и памяти EAV и JSONB.

@DRoman0v Feb 6 2024 at 23:45

Как я в Испании с интернетом на горе два года мучился, а Starlink меня спас. Тест интернета от Илона Маска. Часть 1

7 min

25K

Selectel corporate blogWireless technologies * GadgetsNetwork hardware

«Я джва года ждал» — реально про меня. Только ждал не игры, а нормального интернета, но как раз два года. И вовсе не потому, что интернет-связь в Испании, где живу, плохая. Когда жил под Гранадой, у меня был канал на 300 Мбит/с со стационарной телефонной линией и двумя номерами мобильной связи по цене в примерно 40 евро. За несколько лет работы отключили интернет лишь раз — когда во всем доме что-то там чинили. Все работало без «единого разрыва». Так, два мема в одном абзаце задействовал, теперь уже ближе к делу.

Проблемы начались два года назад, когда я переехал под Валенсию. Поселился в доме на горе — виды красивейшие (можно глянуть вот в этом посте), место крутое, да вот беда — с интернетом тут плохо. Именно потому, что гора. О своих злоключениях и спасении в виде Starlink (с его тестированием, конечно, плюс видео) — под катом.

Читать дальше →

+112

104

@MaxRokatansky Jul 13 2023 at 15:14

Погружение в индексы PostgreSQL

Easy

9 min

80K

OTUS corporate blogPostgreSQL *

Review

Автор статьи: Артем Михайлов

В данной статье мы сделаем погружение в индексы PostgreSQL — мощного и гибкого реляционного СУБД с открытым исходным кодом. Мы рассмотрим концепции, типы индексов и методы их применения для ускорения запросов к данным. Статья будет полезна как для начинающих разработчиков, так и для опытных, желающих углубить свои знания в области индексирования в PostgreSQL.

Индексы представляют собой структуры данных, которые позволяют базе данных быстрее находить и извлекать информацию. Они аналогичны оглавлениям в книгах, которые упрощают поиск определенной информации, указывая на ее местоположение. Правильное использование индексов может существенно улучшить производительность запросов, сокращая время обработки и уменьшая нагрузку на систему.

Читать дальше →

@Boctopr Jan 13 2024 at 00:41

Книги, о которых редко говорят

4 min

54K

Programming * Mathematics * Professional literature * Reading roomPopular science

Дал ему подборку книг, он приходит месяца через два, и с порога такой сразу:
— Я с друзьями не могу разговаривать.
— Ну да есть такой, недостаточек.
интервью Жака Фреско

+86

3 4