Articles / Bookmarks / Profile of Mephi1984 / Habr

Vladislav Khorev @Mephi1984

Developer

ProfileArticles5PostsNewsComments128

MaFrance351 Jul 4 at 08:05

Звоним через полстраны по dial-up модему в 2025 году

Easy

5 min

12K

Timeweb Cloud corporate blogComputer hardwareDevelopment of communication systems*Network standards*Old hardware

Retrospective

Приветствую всех!
Многие из нас застали лично и всё ещё помнят «модемную» эпоху. И даже мне самому доводилось ими пользоваться, а много позже я писал про то, каково в нынешних реалиях сидеть в интернете через старый аналоговый модем. Но вот мне стало интересно: а как насчёт попробовать позвонить не через мини-АТС, а на модем в другом районе или даже в другом городе? Именно этим мы сейчас и займёмся.

Итак, в сегодняшней статье проверим на практике, реально ли заставить два модема связаться друг с другом в наши дни заката эпохи медных линий. Узнаем, насколько стабильным будет соединение и будет ли оно вообще. Традиционно будет много интересного.

Читать дальше →

+64

IvanZiv972003 Jul 4 at 16:04

Как провалить собеседование по System Design: ошибки, которые допускают даже опытные разработчики

Medium

4 min

9.2K

Development for Android*Java*Python*

Собеседование по System Design — это не просто проверка технических знаний, а настоящее испытание вашего инженерного мышления. В отличие от алгоритмических задач, где есть чёткие правильные и неправильные ответы, здесь всё строится на умении анализировать, взвешивать компромиссы и предвидеть проблемы до их появления. Ирония в том, что даже опытные разработчики часто проваливают эти собеседования, потому что сосредотачиваются не на том. Они могут идеально знать, как работает Kafka или Cassandra, но если не умеют структурировать свои мысли и задавать правильные вопросы, их шансы резко падают.

Shannon Jun 29 at 08:46

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

20 min

36K

Artificial Intelligence

Tutorial

Релиз DeepSeek R2 официально отложен и пока R1 не потерял актуальность, попробуем запустить модель на домашнем ПК. Оригинальная DeepSeek R1 имеет размер 700гб, так как она обучалась в fp8, но если бы она обучалась в стандартных f16, её вес был бы 1400гб, а мы попробуем версию в 10 раз меньше. Запустим самый маленький 1.66-битный IQ1_S_R4 квант полноценной модели размером 130гб на игровом ПК, отдельно с 4090 и 4060ti. Загрузим туда очень-очень много контекста и проверим, такой квант всё ещё способен давать разумные ответы или нет.

+140

sierra_xr Jun 27 at 07:32

Доморощенный OSINT для соискателя. Краткая инструкция

Easy

9 min

10K

IT careerArtificial IntelligenceOpen data*Lifehacks for geeksPersonnel Management*

Opinion

Это всё о том, сколько чудесного и неожиданного можно узнать о потенциальном работодателе из открытых данных, и что делать, чтобы не проработать месяц-два бесплатно и не обмануться с другими ожиданиями. Спойлер: увидеть можно многое — от потенциального банкротства компании до дела о мошенничестве.

Никто из работодателей не напишет на сайте или в описании вакансии: «Ну да, так-то у нас иногда кассовые разрывы бывают, но мы тут держимся». Вместо этого будет: «Мы — признанные лидеры там-то и сям-то, нам доверяют, мы меняем мир, мы — динамично развивающаяся компания с сильным корпоративным духом (да, такие описания и кислотой не вытравить) и прочие «выше нас только горы».

Самое замечательное может начаться, если найти 10-15 минут времени и всмотреться в эту бездну успеха.

Где и что искать

+44

lynikol May 19 at 13:51

На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта

Medium

20 min

17K

Альфа-Банк corporate blogMachine learning*Artificial IntelligenceProject management*DIY

Tutorial

Однажды я устал расшифровывать аудио пачкой инструментов в духе «Балерино-Капучино и Бобрито-Бандито» и решил собрать свой пайплайн.

В статье расскажу, как я подключил ИИ к обработке голосовых записей буквально за вечер. Мне нужно было загружать запись голоса в нейросетку и на выходе получать выжимку с итогами встречи — саммари/фоллоу‑апами/«минутками». Я хотел от софта безопасности данных, локального запуска и минимума вложений (в идеале 0 затрат). Я системный аналитик, поэтому не был готов писать приложение целиком.

По моей инструкции вы сможете сделать подобный конвейер своими силами даже без навыков кодинга.

+86

moyadoska Jun 19 at 11:59

Как повторить успех крутых продуктов или почему JTBD — обязаловка для всех маркетологов

Easy

6 min

2.7K

МояДоска corporate blogBusiness Models*Product Management*System Analysis and Design*Internet marketing*

Review

Что такое JTBD

Jobs To Be Done, «Работы‑Которые‑Надо‑Сделать» — это маркетинговая теория о том, почему люди принимают те или иные решения о покупке. Эта теория помогает предпринимателям, компаниям, менеджерам и теоретикам лучше понимать потребности людей и создавать действительно нужные этим самым людям продукты...

+15

NeyroEntuziast Jun 12 at 08:26

HeyGen представила AI Studio. Как получить доступ и пользоваться HeyGen, чтобы сгенерировать аватара

Easy

5 min

1.6K

Artificial IntelligenceThe future is hereMachine learning*

Review

Translation

Тренд на видео с ИИ-аватарами не сбавляет оборотов. Если в последнее время вы проводили много времени, прокручивая ролики TikTok или Instagram, то наверняка сталкивались с этими ИИ-видео с говорящими персонажами Это и обезьяна, ведущая влог, и день из жизни Джорджа Вашингтона, и многие другие.

Они привлекают внимание, и очевидно, что спрос на такой контент растет.

HeyGen - одна из платформ, которая сделала этот процесс проще и доступнее. Теперь они сделали еще один шаг вперед, представив HeyGen AI Studio.

В этой статье я расскажу вам о том, как работает HeyGen AI Studio, и покажу, какого качества видео вы можете сгенерировать.

Давайте начнем.

kucev Jun 12 at 11:00

Хочешь своего AI-бота? Пошаговый план для новичков и не только

6 min

5.9K

Data Mining*Artificial IntelligenceMachine learning*Big Data*Data Engineering*

Translation

AI-чатботы стремительно трансформируют способы взаимодействия бизнеса и пользователей с технологиями. Эти интеллектуальные виртуальные ассистенты способны обрабатывать клиентские обращения, давать рекомендации и даже автоматизировать сложные бизнес-процессы.

В результате, около 65% организаций заявляют об использовании генеративного ИИ как минимум в одной бизнес-функции на регулярной основе — почти в два раза больше, чем десять месяцев назад.

Viacheslav-hub Jun 13 at 07:00

Создаем свой RAG: от загрузки данных до генерации ответов с LangGraph. Часть 2

Medium

7 min

5.2K

Python*Artificial IntelligenceProgramming*

Tutorial

Привет, Хабр!

Технология RAG (Retrieval-Augmented Generation) сочетает поиск информации с генерацией ответов, делая AI-системы более точными и осмысленными. В этой статье разберём практическую реализацию RAG с помощью LangGraph — гибкого инструмента для построения агентов и графов.

snakers4 May 27 at 17:42

Играемся с RTX 5090 (GB202) для инференса

Medium

7 min

6.7K

Machine learning*Computer hardwareArtificial IntelligenceVideo cards

Review

Продолжаем статьи про практические тесты актуальных картонок от Nvidia (A5000 Ada, A100, 3090 и A10). В этот раз мне предложили (не реклама) денёк погонять Nvidia RTX 5090 в хостинге (себе такую брать я бы не стал), и я не мог отказаться от такого предложения.

За день что‑то стоящее натренировать нынче уже проблематично, поэтому будем «снимать» уже привычных обратно совместимых «попугаев» через gpu-burn и также замерим скорость инференса одной нашей довольно прожорливой сетки в продакшене.

Все шутки про Nvidia давно уже не шутки, санкции и торговые войны идут своим чередом, но тем не менее в России новинки появляются с завидной регулярностью несмотря на все запреты.

На фоне сильно негативного новостного фона со стороны игрового сообщества про новый релиз Nvidia и своеобразных «успехов» Nvidia по ~~наращиванию своей капитализации~~ продвинутой «сегментации» рынка (все уже пошутили про новый коннектор, огромный рост TDP и размера карт), мне лично было интересно, а есть ли рост 50* поколения карт для наших задач против 30* поколения.

Если верить техно‑ и игровым блоггерам, их новое поколение совсем не впечатлило. Меня зато так «впечатлило» 40* поколение, что мы даже не рассматривали апгрейд 3090. Но обо всём по порядку.

Давайте разбираться!

+22

Banakhovich Jun 9 at 14:21

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

18 min

29K

Artificial Intelligence

From sandbox

Локальный DeepSeek-R1-0528 на скромном железе? Реально. Со скоростью улитки? Первоначально – да. Но итог моего эксперимента: эту 'улитку' можно заставить работать вдвое быстрее.

+72

112

huraligne Jun 5 at 15:19

RAG: Дообучение модели эмбеддингов для повышения точности поиска

10 min

3.9K

Первая грузовая компания (ПГК) corporate blogMachine learning*Artificial Intelligence

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.

Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддингов для улучшения качества поиска в RAG-системе. Это позволило нам получить более точные представления документов и пользовательских запросов, что напрямую сказалось на релевантности финальных ответов. Давайте перейдём к деталям.

Nataliia-L Jun 5 at 20:02

Топ нейросетей для пересказа и суммаризации текста

Easy

13 min

6.1K

BotHub corporate blogContent-marketing*Artificial IntelligenceThe future is hereMachine learning*

Review

Представьте: вы стоите по горло в море текста — полезного и не очень, от души разбавленного водой, может быть написанного сложным языком, — а времени у вас в обрез. Да даже и представлять не надо — знакомая ведь ситуация? Кто из нас ни разу не тонул в этом текстовом океане, ну? Но вместо того, чтобы тонуть, можно научиться ходить по воде — а надёжными проводниками станут нейросети‑суммаризаторы.

Стили и задачи текста бывают разные, и их соотнесением с наиболее сильными сторонами нейросетей мы и займёмся.

+15

mipt_digital Jun 4 at 09:00

От задачи до решения: LLM с RAG-конфигурацией и ROC-AUC. Эксперимент на 121 прогоне за 40 часов с помощью ИИ

15 min

2.4K

Центр «Пуск» МФТИ corporate blogArtificial IntelligenceMachine learning*

Tutorial

Меня зовут Антон, сейчас занимаюсь прикладными проектами индекса цифровой зрелости БРИКС. Пробую за счет инструментов ИИ собирать каскады моделей ИИ для выявления неочевидных зависимостей в разных экономических и культурных процессах на основе данных извлекаемых из открытых источников.

В рамках эксперимента я поставил себе задачу применить ИИ в прикладной задаче, при этом использовать только доступные всем инструменты и понятные нарративы. Одним словом, решил примерить на себя роль «Сделай там что-то с ИИ-шечкой, только быстро!» Рассказываю, что из этого поучилось (ссылки на рабочие блокноты, промпты и скриншоты прилагаются).

FatMR Jun 1 at 12:11

Я устал писать плохой фидбек на алгоритмических собеседованиях

Easy

7 min

3.3K

Algorithms*Entertaining tasksProgramming*

Interview

Draft

Уверен, ты уже был на алгоритмическом собеседовании. А если нет, то напомню: это крышесносный квест, где тебе предстоит выложить всю подноготную университетской программы, блеснуть знанием структур данных — и за час решить пару задач.

Начинаю с юмора, потому что лично у меня, как у интервьюера, внутри всё сжимается, когда вижу, как кандидаты совершают одни и те же ошибки.

Так вот. Я расскажу тебе историю одного показательного собеседования, чтобы ты не наступил на те же грабли — и зашёл на алгоритмическое собеседование не с одной, а сразу с трёх ног.

Ну всё, погнали.

-13

MaxRokatansky May 24 at 12:02

RAG‑агент для автоматизации инцидент‑менеджмента

20 min

4.5K

OTUS corporate blogBig Data*Python*Artificial Intelligence

Современные крупные организации сталкиваются с большим числом ИТ‑инцидентов — счет может идти на тысячи в месяц. Инциденты нередко повторяются со временем, однако найти похожий случай в базе знаний или в системе регистрации инцидентов непросто: стандартный поиск по ключевым словам часто неэффективен, а «держать в голове» детали всех инцидентов невозможно.

valentina-p May 20 at 07:37

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

Medium

8 min

13K

SberDevices corporate blogArtificial IntelligenceMachine learning*

В этой статье мы расскажем о нашей новой модели FRIDA, которая сейчас (20.05.2025) занимает первое место в русскоязычном бенчмарке MTEB (ссылка на таблицу лидеров).

Ранее мы уже рассказывали на Хабре о создании русскоязычных задач для MTEB. Напомним, что этот бенчмарк предназначен для оценки моделей, способных создавать эмбеддинги текста — векторные представления, применяемые в различных задачах NLP.

+55

yadro_team May 20 at 11:39

ML на «плюсах»: 5 материалов о необычном подходе к обучению моделей

Medium

2 min

3.3K

YADRO corporate blogC++*Machine learning*Conferences

Digest

Когда мы говорим о машинном обучении, то автоматически подразумеваем Python. Это справедливо: на Python есть множество удобных ML-инструментов, например, популярная библиотека PyTorch. Тем не менее, некоторые задачи можно решать с помощью С++. И не только ради эксперимента, а для увеличения производительности сервисов и упрощения работы с кодом.

Кирилл Колодяжный, разработчик СХД в YADRO, несколько лет изучает машинное обучение на С++. Он уже написал программы для поиска лица на фото и для распознавания объектов в реальном времени. Под катом — пять материалов Кирилла, после которых инженерам захочется «пересесть» с Python на C++. Хотя бы на время.

+12

neuromancertdi May 20 at 13:03

Основы глубокого обучения. Часть 4: Рекуррентный слой. Теория и реализация на torch

Easy

13 min

3.1K

Machine learning*

Tutorial

Очередной туториал по рекуррентному слою. Эта статья для новичков. Изначально хотел сделать на собственной реализации autograd, но в этом нужно дополнительно разбираться, там много нюансов. Да и не думаю, что это кому-то нужно, поэтому сделал всё-таки на torch.

alizar May 19 at 09:01

Читерство в законе. Как пройти собеседование и устроиться на работу в дивном новом мире

Easy

6 min

20K

RUVDS.com corporate blogArtificial IntelligenceIT careerRemote workStudying in IT

Opinion

Требования к вакансии — во многом обман. Также как резюме от кандидатов, которые часто накручивают опыт. Собеседование похоже на театральное выступление, к которому готовятся отдельно. Будущего программиста учат не только работать, но ещё и проходить собесы, в том числе врать, использовать LLM для решения задач, чтобы хакнуть эту идиотскую систему найма… Появились менторы, которые помогают «вкатываться» в IT — они советуют, как эффективнее ~~врать~~ продавать себя, и публикуют статьи на Хабре.

Почему так происходит? Возможно, программирование перестало быть романтической профессией, а стало прибыльным ремеслом. «Вкатыши» идут в профессию просто ради денег, сильно выросла конкуренция на всех позициях.

Ситуация неприятная для тех, кто давно наблюдает за рынком.

Читать дальше →

+59

2 3 ...

14 15

Звоним через полстраны по dial-up модему в 2025 году

Как провалить собеседование по System Design: ошибки, которые допускают даже опытные разработчики

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

Доморощенный OSINT для соискателя. Краткая инструкция

На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта

Как повторить успех крутых продуктов или почему JTBD — обязаловка для всех маркетологов

HeyGen представила AI Studio. Как получить доступ и пользоваться HeyGen, чтобы сгенерировать аватара

Хочешь своего AI-бота? Пошаговый план для новичков и не только

Создаем свой RAG: от загрузки данных до генерации ответов с LangGraph. Часть 2

Играемся с RTX 5090 (GB202) для инференса

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

RAG: Дообучение модели эмбеддингов для повышения точности поиска

Топ нейросетей для пересказа и суммаризации текста

От задачи до решения: LLM с RAG-конфигурацией и ROC-AUC. Эксперимент на 121 прогоне за 40 часов с помощью ИИ

Я устал писать плохой фидбек на алгоритмических собеседованиях

RAG‑агент для автоматизации инцидент‑менеджмента

Знакомьтесь, FRIDA. Открытая эмбеддинг-модель для русского языка

ML на «плюсах»: 5 материалов о необычном подходе к обучению моделей

Основы глубокого обучения. Часть 4: Рекуррентный слой. Теория и реализация на torch

Читерство в законе. Как пройти собеседование и устроиться на работу в дивном новом мире

Information

Specialization