Статьи / Закладки / Профиль mishanio / Хабр

@mishanio^{read⁠-⁠only}

Пользователь

Профиль Закладки 92

MaxRokatansky 3 окт в 17:49

Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

16 мин

Блог компании OTUSGo*Машинное обучение*

Перевод

В этой статье я поделюсь с вами своим опытом использования Golang, Kafka и Clickhouse на примере простого ETL-конвейера для параллельной передачи JSON-данных в базу данных с последующим прогнозированием температуры на основе машинного обучения.

RukInDaHouse 5 июл в 14:07

Дом, милый дом: нюансы работы с ClickHouse. Часть 2, репликация

Средний

12 мин

Блог компании NixysSQL*Администрирование баз данных*DevOps*

Обзор

Всем привет, меня зовут Пётр. В первой части этого цикла статей мы взглянули на некоторые базовые концепции ClickHouse. В этой же статье продолжим изучать тонкости работы с этой колоночной базой данных и подробно рассмотрим такой аспект как репликация. А ещё разберёмся с сервисами координации Zookeeper и ClickHouse Keeper.

Давайте разбираться!

spring_aio 27 авг в 17:11

Виртуальные потоки Java 21 — чувак, где мой lock?

Простой

12 мин

10K

Блог компании Spring АйОПрограммирование*Java*

Перевод

Как показывает опыт Netflix, использование виртуальных потоков, представленных в Java 21, может спровоцировать возникновение неожиданных проблем. В новом переводе от команды Spring АйО мы подробно исследуем уникальные трудности, возникшие у команды Netflix при интеграции виртуальных потоков в Spring Boot на Tomcat.

Давайте же посмотрим, как виртуальные потоки могут повлиять на производительность и стабильность системы.

+20

m11 28 июн в 16:15

Что нового в документации YDB во втором квартале 2024 года

Простой

4 мин

1.4K

Блог компании YDBSQL*Java*Высокая производительность*Администрирование баз данных*

Дайджест

Перевод

Документация YDB продолжает развиваться, отвечая на растущие потребности своей разнообразной аудитории. Наша цель остаётся прежней — улучшение ясности, доступности и глубины предоставляемой информации. В этом квартале мы ввели значительные обновления и новые разделы.

Evgeniya_Mironova 23 июл в 19:10

Как вести документацию, чтобы никто ничего не понял. Немного теории и вредные советы от МТС Диджитал

8 мин

10K

Блог компании МТСУправление проектами*Подготовка технической документации*

Привет, Хабр! Это Евгения Миронова — Senior Business Analyst, Павел Орлов — Senior System Analyst и Мансур Сафиуллин — Middle Business Analyst из МТС Диджитал. Сегодня будем говорить о проектной документации — той самой, в которой так часто «черт ногу сломит». Чтобы читать было интереснее, мы дополнили теорию практическими советами. Но не спешите их тестировать — сначала дочитайте пост до конца. Поехали!

+16

Vadimyan 16 авг в 16:00

Математика надёжности. Доклад Яндекса

Простой

18 мин

12K

Блог компании ЯндексВысокая производительность*Анализ и проектирование систем*Алгоритмы*

Вадим Мартынов, руководитель команды платформы надёжности в Яндекс Go, в своём докладе рассказал, как влияют те или иные решения на надёжность системы и как это учитывать при разработке.

+85

dobrostas 7 авг в 11:00

Кунг-фу спикера: словесные трюки, вербальная дрессировка и другие приемы речевой борьбы

Простой

4 мин

12K

ИнтервьюDeveloper Relations*

FAQ

Представим ситуацию: вас позвали на подкаст. Вы обсудили материал с ведущим, подготовили тему, пришли и вам буквально не дали сказать и пары слов.

Нередко на важных для нас мероприятиях мы можем переволноваться, растеряться, нарваться на тролля и т.д. В этой статье я попробую разобрать разные сложные ситуации, которые могут возникнуть во время публичных активностей.

+62

ig_rudenko 13 мая в 09:14

PostgreSQL 16. Организация данных. Часть 1

Средний

14 мин

21K

Open source*PostgreSQL*Администрирование баз данных*

Из песочницы

PostgreSQL очень популярная СУБД. Её используют во многих проектах, как новички, так и профессионалы. Однако не все понимают, как именно работает данная система и какое у неё внутренне устройство.

Давайте разберемся вместе на основе книги «PostgreSQL 16 изнутри» и официальной документации!

+35

bidzo 10 июл в 16:32

Локальные LLM в разработке: а почему бы и да?

Средний

12 мин

9.4K

Блог компании Альфа-БанкПрограммирование*Искусственный интеллект

Туториал

Меня зовут Антон Гращенков, и я занимаюсь развитием Java в Альфа-Банке. Программированием увлекаюсь ещё со школы: писал на множестве разных языков — от Pascal до TypeScript, мне это просто нравится. В статье я на примерах покажу, для каких задач я использую локальные модели. Да, существует много инструментов доступных в облаке, — тот же ChatGPT, Copilot или YandexGPT. Однако можно запустить такую модель и локально, и сделать это крайне просто.

Ведь если хочется, то почему бы и да?

+51

mrcoolinhabr 9 июл в 01:20

Искусство общения с LLM: Гайд по техникам Prompt Engineering

Средний

8 мин

7.8K

Python*Искусственный интеллектМашинное обучение*Natural Language Processing*

Из песочницы

Привет, Хабр! Меня зовут Никита Кулин, ML-Engineer NLP моделей.

В этом гайде мы поговорим о подготовке к prompt-engineering, о базовых принципах написания промпта, про его структуру и про типы решаемых задач, о продвинутых техниках через рассуждения для повышения качества ответа и снижения вероятности появления галлюцинаций. Гайд будет полезен для всех, кто начинает погружаться в промптинг.

Это мой первый пост, поэтому буду рад любой обратной связи!

+11

DrArgentum 1 июл в 13:30

systemD с 0 до 1: библия сисадмина

Средний

27 мин

26K

Блог компании Timeweb Cloud*nix*Python*Настройка Linux*Системное администрирование*

Туториал

Что бы кто не говорил, systemD становится стандартом систем инициализацией в линуксе. И с 80% вероятностью все сервера будут с systemD. Не факт, конечно, есть и личные сервера, на которых может стоять хоть Gentoo, хоть Devuan, хоть NixOS.

Некоторые дистрибутивы хотят даже перейти с загрузчика Grub на systemd-boot! Потому знать, как работать с данной системой инициализации, должен каждый сисадмин и просто программист, ибо сейчас он практически везде.

В этой статье мы разберем — создание сервисов и юнитов, как облегчить работу при помощи systemd, отслеживать состояние системы и управлять ей.

А также напишем небольшой скрипт на Python для автомизации некоторых задач. Приятного чтения, господа линуксоиды и просто пользователи!

Читать дальше →

+53

cobiot 4 фев 2016 в 16:18

Создание архитектуры программы или как проектировать табуретку

25 мин

693K

Проектирование и рефакторинг*Анализ и проектирование систем*Веб-разработка*

Из песочницы

Взявшись за написание небольшого, но реального и растущего проекта, мы «на собственной шкуре» убедились, насколько важно то, чтобы программа не только хорошо работала, но и была хорошо организована. Не верьте, что продуманная архитектура нужна только большим проектам (просто для больших проектов «смертельность» отсутствия архитектуры очевидна). Сложность, как правило, растет гораздо быстрее размеров программы. И если не позаботиться об этом заранее, то довольно быстро наступает момент, когда ты перестаешь ее контролировать. Правильная архитектура экономит очень много сил, времени и денег. А нередко вообще определяет то, выживет ваш проект или нет. И даже если речь идет всего лишь о «построении табуретки» все равно вначале очень полезно ее спроектировать.

К моему удивлению оказалось, что на вроде бы актуальный вопрос: «Как построить хорошую/красивую архитектуру ПО?» — не так легко найти ответ. Не смотря на то, что есть много книг и статей, посвященных и шаблонам проектирования и принципам проектирования, например, принципам SOLID (кратко описаны тут, подробно и с примерами можно посмотреть тут, тут и тут) и тому, как правильно оформлять код, все равно оставалось чувство, что чего-то важного не хватает. Это было похоже на то, как если бы вам дали множество замечательных и полезных инструментов, но забыли главное — объяснить, а как же «проектировать табуретку».

Хотелось разобраться, что вообще в себя включает процесс создания архитектуры программы, какие задачи при этом решаются, какие критерии используются (чтобы правила и принципы перестали быть всего лишь догмами, а стали бы понятны их логика и назначение). Тогда будет понятнее и какие инструменты лучше использовать в том или ином случае.

Данная статья является попыткой ответить на эти вопросы хотя бы в первом приближении.

Читать дальше →

+82

artemy_kravtsov 17 июн в 12:07

Краеугольные камни ClickHouse

Простой

21 мин

16K

Блог компании WBTECHSQL*Big Data*Хранение данных*Data Engineering*

Обзор

Привет, Хабр! Меня зовут Артемий Кравцов, я работаю инженером в Wildberries. Сегодня расскажу про то, что люблю – про ClickHouse. Моя цель – осветить некоторые ключевые особенности в архитектуре ClickHouse и в том, как он хранит данные.

Что такое куски и слияния? Как быть с частыми вставками? Как обновлять значения в строках? Что не так с точечными чтениями? Как сделать тяжёлый JOIN?

Статья рассчитана на тех, кто только знакомится с ClickHouse.

+37

DistributedLab 4 июн 2018 в 20:33

Введение в смарт-контракты

23 мин

58K

Блог компании Distributed LabИнформационная безопасность*КриптовалютыКриптография*Платежные системы*

В этой статье мы рассмотрим, что такое смарт-контракты, какие они бывают, познакомимся с разными платформами смарт-контрактов, их особенностями, а также обсудим, как они устроены и какие преимущества могут в себе нести. Данный материал будет очень полезен для читателей, которые недостаточно хорошо знакомы с темой смарт-контрактов, но хотят приблизиться к ее пониманию.

Читать дальше →

+10

The-Founder-1 14 июн в 04:56

Кратко о KAN для самых неподготовленных

Простой

5 мин

Машинное обучение*Искусственный интеллект

Обзор

В апреле практиками-исследователями и математики анонсировали новую архитектуру нейросетей. Крупного резонанса открытие не принесло, хотя с нашей точки зрения, KAN может претендовать на интересную технологию Важнее, что это не просто новая вариация трансформера или исправленная рекуррентная нейронная сеть – это новый подход к нейросетям в принципе, новая архитектура вместо MLP.

Мы написали большую статью по KAN со всеми подробностями, здесь мы совсем кратко пробежимся по основным положениям архитектуры и ее проблемах для самых неподготовленных читателей.

Но надеемся, что некоторое понимание базовой линейной алгебры и математического анализа присутствует.

MLP – обычная полносвязная нейросеть, где благодаря послойной активации нейронов мы получаем какой-то конечный результат (данные) на последнем слое. Похоже на имитацию действия мозговых нейронов: благодаря передаче импульса от нейрона к нейрону – мы получаем результат в виде ассоциации, воспоминаний...

Так вот суть KAN сводится к переносу акцента с “активации нейронов” к активации “связей” между ними.

Конечно, сами связи никуда не деваются, но. Теперь вместо обычных весовых отношений между нейронами – мы получаем обучаемые функции активации – связываем нейроны B-spline’ами. Веса – это такие числовые коэффициенты, которые определяют уровень активации нейронов. Больше вес – сильней сигнал.

Нейросети с большим числом слоев превращаются в черный ящик. Мы не можем понять, как конкретно числовые значения отвечают за те или иные признаки — и как именно признаки в них преобразуются. Поэтому внутренняя часть нейросети нам недоступна.

+11

andrey_stepanov1 11 июн в 13:35

Ловушка фичеризма: почему продукт страдает, когда мы зациклены на функциональности

Простой

7 мин

2.7K

Блог компании fuse8Управление разработкой*Управление проектами*Управление продуктом*

Мнение

Перевод

Наполняя сервис функциями, которые непременно будут нужны и понятны для пользователя, легко перестараться и произвести эффект ровно противоположный. Часто те, кто «живут» своим продуктом, забывают, что все его преимущества и удобства — не данность для пользователя, а дополнительная когнитивная нагрузка, которая может начать зашкаливать, если создатели сервиса не будут периодически заземляться.

Под катом небольшое, но осмысленное размышление о том, почему фичеристский подход может убить пользу продукта, и как подойти к разработке так, чтобы этого все‑таки не произошло.

apzakharov 3 дек 2021 в 12:31

[Пятничное] Теория Жоп

5 мин

229K

Управление проектами*Карьера в IT-индустрии

Из песочницы

Эту полу-шуточную теорию о проектном управлении я излагал коллегам по ИТ цеху лет 15 назад, и тогда же неоднократно слышал советы загрузить этот текст на Хабр, но руки не дошли. На днях, разгребая старые файлы наткнулся на свои записи и решил все таки поделиться ими с Вами. Частое употребление ключевого слова к сожалению, неизбежно и не отделимо для целостности этого текста, прошу принимать или нет 'as is'. Итак...

Каждая карьера развивается от Жопы к Жопе, и никак иначе. Хочешь повышения - ищи Жопу и принимай, как говорят в Америке, "challenge". Если Вам предлагают возглавить новый проект, либо занять какую то должность, да что угодно - знайте, там Вас ждет Жопа. Иначе не предложили бы, а сами бы справились. Равно как и если Вы ожидаете избавиться от надоевшей Вам сейчас деятельности, надеясь вырваться из "этого ада" и заняться "чем то новеньким" - будьте готовы встретиться с Большой Жопой.

+473

107

kirillverkin 5 июн в 10:25

Как я написал для своей команды бот-напоминалку на Golang и втрое сократил время на ревью задач

Простой

9 мин

5.8K

Блог компании КуперУчебный процесс в ITУправление разработкой*Go*

Кейс

Привет, Хабр! На связи Кирилл Веркин. Вообще, я занимаю в СберМаркете должность Senior QA, но ради большей производительности команды стал немного кодером.

Эта статья может быть интересна тем, кто замечает, что задачи в команде часто теряются, и хочет автоматизировать процесс напоминалок. Я делюсь кодом, поясняя ключевые моменты для таких же новичков в Go. Мой код написан для сочетания GitLab, Jira и Mattermost (корпоративный мессенджер, которым мы пользуемся в СберМаркете), но подобное решение можно реализовать и с другими сервисами.

+10

Rast1234 30 сен 2022 в 09:05

Человеческим языком про метрики 3: перцентили для чайников

10 мин

123K

Блог компании ТочкаАнализ и проектирование систем*IT-инфраструктура*DevOps*Микросервисы*

Туториал

Это третья статья из цикла. В прошлой части мы разбирали типы метрик, и уже там начали встречаться перцентили. Это полезная штука, но для неподготовленного читателя она выглядит просто как математическая дичь. Эта статья поможет разобраться в перцентилях по-инженерному, не заканчивая профильный факультет.

+19

MaxRokatansky 11 сен 2019 в 17:11

Разбираемся в основах Blockchain: Задача Византийских Генералов. Часть 1

6 мин

29K

Блог компании OTUSАлгоритмы*Криптовалюты

Перевод

Перевод статьи подготовлен специально для студентов курса «Архитектор высоких нагрузок», который стартует уже в этом месяце.

Блокчейн – это децентрализованная система, состоящая из различных субъектов, которые действуют в зависимости от своих стимулов и имеющейся у них информации.

Всякий раз, когда новая транзакция транслируется по сети, узлы могут включить эту транзакцию в копию своего леджера или проигнорировать ее. Когда большинство участников сети принимают решение о принятии определенного состояния, достигается консенсус.

Читать дальше →

+13

2 3 4 5

Строим ETL-конвейер для машинного обучения с помощью Kafka, Clickhouse и Go

Дом, милый дом: нюансы работы с ClickHouse. Часть 2, репликация

Виртуальные потоки Java 21 — чувак, где мой lock?

Что нового в документации YDB во втором квартале 2024 года

Как вести документацию, чтобы никто ничего не понял. Немного теории и вредные советы от МТС Диджитал

Математика надёжности. Доклад Яндекса

Кунг-фу спикера: словесные трюки, вербальная дрессировка и другие приемы речевой борьбы

PostgreSQL 16. Организация данных. Часть 1

Локальные LLM в разработке: а почему бы и да?

Искусство общения с LLM: Гайд по техникам Prompt Engineering

systemD с 0 до 1: библия сисадмина

Создание архитектуры программы или как проектировать табуретку

Краеугольные камни ClickHouse

Введение в смарт-контракты

Кратко о KAN для самых неподготовленных

Ловушка фичеризма: почему продукт страдает, когда мы зациклены на функциональности

[Пятничное] Теория Жоп

Как я написал для своей команды бот-напоминалку на Golang и втрое сократил время на ревью задач

Человеческим языком про метрики 3: перцентили для чайников

Разбираемся в основах Blockchain: Задача Византийских Генералов. Часть 1

Информация

Специализация