Статьи / Закладки / Профиль Mephi1984 / Хабр

Vladislav Khorev@Mephi1984

Developer

ПрофильСтатьи5ПостыНовостиКомментарии131

@PashaPodolsky 6 окт в 11:10

Garbage In, Garbage Out: как мы учили ИИ искать не в веб-помойке, а в библиотеке. И чему мы научились сами

Средний

17 мин

Поисковые технологии * Искусственный интеллектПроектирование API *

Обзор

Ищем как Perplexity по базам научных публикаций, стандартам, книгам, мессенджерам и социальным сетям.

+14

@Daniyar94 27 авг в 03:55

Смирись: ты ненормальный

Простой

10 мин

60K

МозгЧитальный залНаучно-популярное

Мнение

Перевод

Я встречал много людей, которым не нравится их работа. И когда я их спрашиваю, чем бы они занимались вместо, около 75% из них отвечают что‑то вроде: «Хммм, не знаю. Я бы хотел открыть свою небольшую кофейню!» Если в тот день я в хорошем настроении, я задаю им встречный вопрос: «Тогда где бы ты взял кофейные зерна?»

Если они не знают что ответить, то я задаю ещё пару наводящих вопросов:

+437

330

@discodum 26 авг в 15:49

Библиотека Asio для начинающих: работаем с корутинами без сегфолтов

15 мин

12K

Блог компании YADROC++ * Хранение данных *

Когда я начал работать с Asio и изучал документацию библиотеки, прочитал мнение, что доку писали «для роботов». Описание каждого концепта, функции или особенности приводится лишь однажды, без перекрестных ссылок и других удобных для разработчика деталей. Документация составлена так, что понять ее может разве что машина, «просканировав» текст целиком.

Я подумал, что было бы здорово написать статью, которая служила бы введением в библиотеку. Статью, которая помогла бы начать пользоваться Asio, даже если раньше вы с ней не работали. Что получилось, читайте под катом.

+22

@GeeksCat 24 авг в 15:05

История игровой журналистики в России. Часть 6. Журналы «Магазин Игрушек» и «Game.EXE»

Простой

14 мин

12K

Блог компании Timeweb CloudИгры и игровые консолиЧитальный залУправление медиа * Контент и копирайтинг *

Ретроспектива

Вернёмся в 1995 год. На тот момент издательский дом «Компьютерра» уже три года выпускал одноимённый еженедельник, посвящённый новостям компьютерного рынка, языкам программирования, информационным технологиям и программному обеспечению (в том числе российскому). В журнале редко писали о компьютерных играх, но читатели часто рассказывали о них в своих письмах.

В то время в редакцию «Компьютерры» иногда заглядывали студенты и школьники старших классов, которые интересовались компьютерами и очень хотели работать в журнале. Дмитрий Мендрелюк, главный редактор и владелец издательского дома, поначалу отказывал им, так как денег едва хватало на поддержку других изданий. К его удивлению, молодые люди не только согласились работать чуть ли не за бесплатно, но и организовали сплочённый коллектив. Их объединяло одно — любовь к играм и компьютерам.

+55

@antipov_dmitry 19 авг в 06:13

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One

Средний

9 мин

6.5K

Искусственный интеллектМашинное обучение * ЗвукBig Data * Анализ и проектирование систем *

Привет! Распознаванием речи (ASR) уже никого не удивишь, но качественное распознавание на разговорном русском языке, а особенно в телефонии — очень сложная штука: люди редко говорят как профессиональные дикторы, часто бывает плохое качество звука с постоянными шумами на фоне и в целом есть миллиарды прочих нюансов. Наша компания занимается голосом больше 8 лет, есть собственные классные модели синтеза, распознавания и продукты на их основе, поэтому экспериментов мы проводим очень много и за появлением новых голосовых моделей следим очень внимательно.

В свободном доступе уже есть самый узнаваемый Whisper, есть интересные модели GigaAM от Сбера, не так давно Т-Банк выложил в открытый доступ свою модель T-One — давайте заглянем под капот нашего внутреннего бенчмарка и посмотрим насколько кто хорош.

Поехали!

+10

@ulechka 11 авг в 07:09

Agile в эпоху удалёнки: что делать, если митинги больше не работают?

12 мин

7.5K

Блог компании BegetУправление проектами * Удалённая работаУправление разработкой * Agile *

Пандемия заставила нас работать из дома, но перенесла в Zoom все офисные проблемы. Бесконечные стендапы, тотальный контроль и выгорание от видеозвонков — классический Agile даёт сбой. Но его можно спасти асинхронными практиками.

Читайте в статье:

✔️ Почему 80% митингов можно заменить письменной коммуникацией?
✔️ Как GitLab добиться результатов без ежедневных созвонов?
✔️ Чек-лист перехода на async-работу без потери эффективности.

+19

@IldarAltynbaev 7 авг в 13:15

Нейросетевой помощник для Catan Universe: как я научил ИИ считать карты соперников

Средний

6 мин

5.1K

Python *

Из песочницы

Привет, коллеги-катановцы!

Знакомо чувство, когда в пылу битвы за овец и кирпичи напрочь забываешь, сколько ресурсов только что сбросил соперник? Вот и я вечно путался — пока не загорелся безумной идеей: А что если заставить нейросеть следить за картами вместо меня?

Пару месяцев, несколько килограммов кофе и одна сгоревшая видеокарта спустя — представляю вам Catan Neural Assistant — шпаргалку, которая в реальном времени подсчитывает ресурсы оппонентов!

Но сначала — лирическое отступление для тех, кто вдруг не в теме.

кто вдруг не в теме.

@GeeksCat 3 авг в 07:06

Наглядное пособие начинающего ретрогеймера. С чего начать путь в мир старых шедевров

5 мин

17K

Блог компании Timeweb CloudИгры и игровые консолиСтарое железо

Ретроспектива

Не так давно мы разбирались, какие консоли стоит купить для того, чтобы окунуться в мир ретро-игр от 3 до 7 поколения.

Но ведь железку под телевизор кинуть мало, нужно же понять, во что на ней играть, ведь так? Я понимаю, что большинству первым делом на ум придут хиты с «Денди» типа Battle City, Contra и так далее. Всё это, конечно, круто, но очень банально.

Поэтому представляем максимально субъективный, но от того во многом личный эдвайс-лист проектов прошлого, которые вы могли пропустить, но они заслуживают вашего внимания и прошли проверку временем.

+30

@MaFrance351 4 июл в 08:05

Звоним через полстраны по dial-up модему в 2025 году

Простой

5 мин

16K

Блог компании Timeweb CloudКомпьютерное железоСистемы связи * Стандарты связи * Старое железо

Ретроспектива

Приветствую всех!
Многие из нас застали лично и всё ещё помнят «модемную» эпоху. И даже мне самому доводилось ими пользоваться, а много позже я писал про то, каково в нынешних реалиях сидеть в интернете через старый аналоговый модем. Но вот мне стало интересно: а как насчёт попробовать позвонить не через мини-АТС, а на модем в другом районе или даже в другом городе? Именно этим мы сейчас и займёмся.

Итак, в сегодняшней статье проверим на практике, реально ли заставить два модема связаться друг с другом в наши дни заката эпохи медных линий. Узнаем, насколько стабильным будет соединение и будет ли оно вообще. Традиционно будет много интересного.

Читать дальше →

+84

121

@IvanZiv972003 4 июл в 16:04

Как провалить собеседование по System Design: ошибки, которые допускают даже опытные разработчики

Средний

4 мин

11K

Android * Java * Python * Проектирование API * Анализ и проектирование систем *

Собеседование по System Design — это не просто проверка технических знаний, а настоящее испытание вашего инженерного мышления. В отличие от алгоритмических задач, где есть чёткие правильные и неправильные ответы, здесь всё строится на умении анализировать, взвешивать компромиссы и предвидеть проблемы до их появления. Ирония в том, что даже опытные разработчики часто проваливают эти собеседования, потому что сосредотачиваются не на том. Они могут идеально знать, как работает Kafka или Cassandra, но если не умеют структурировать свои мысли и задавать правильные вопросы, их шансы резко падают.

@Shannon 29 июн в 08:46

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

21 мин

35K

Искусственный интеллект

Туториал

Релиз DeepSeek R2 официально отложен и пока R1 не потерял актуальность, попробуем запустить модель на домашнем ПК. Оригинальная DeepSeek R1 имеет размер 700гб, так как она обучалась в fp8, но если бы она обучалась в стандартных f16, её вес был бы 1400гб, а мы попробуем версию в 10 раз меньше. Запустим самый маленький 1.66-битный IQ1_S_R4 квант полноценной модели размером 130гб на игровом ПК, отдельно с 4090 и 4060ti. Загрузим туда очень-очень много контекста и проверим, такой квант всё ещё способен давать разумные ответы или нет.

+150

@sierra_xr 27 июн в 07:32

Доморощенный OSINT для соискателя. Краткая инструкция

Простой

9 мин

9.2K

Управление персоналом * Лайфхаки для гиковОткрытые данные * Искусственный интеллектКарьера в IT-индустрии

Мнение

Это всё о том, сколько чудесного и неожиданного можно узнать о потенциальном работодателе из открытых данных, и что делать, чтобы не проработать месяц-два бесплатно и не обмануться с другими ожиданиями. Спойлер: увидеть можно многое — от потенциального банкротства компании до дела о мошенничестве.

Никто из работодателей не напишет на сайте или в описании вакансии: «Ну да, так-то у нас иногда кассовые разрывы бывают, но мы тут держимся». Вместо этого будет: «Мы — признанные лидеры там-то и сям-то, нам доверяют, мы меняем мир, мы — динамично развивающаяся компания с сильным корпоративным духом (да, такие описания и кислотой не вытравить) и прочие «выше нас только горы».

Самое замечательное может начаться, если найти 10-15 минут времени и всмотреться в эту бездну успеха.

Где и что искать

+46

@lynikol 19 мая в 13:51

На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта

Средний

20 мин

20K

Блог компании Альфа-БанкDIY или Сделай самУправление проектами * Искусственный интеллектМашинное обучение *

Туториал

Однажды я устал расшифровывать аудио пачкой инструментов в духе «Балерино-Капучино и Бобрито-Бандито» и решил собрать свой пайплайн.

В статье расскажу, как я подключил ИИ к обработке голосовых записей буквально за вечер. Мне нужно было загружать запись голоса в нейросетку и на выходе получать выжимку с итогами встречи — саммари/фоллоу‑апами/«минутками». Я хотел от софта безопасности данных, локального запуска и минимума вложений (в идеале 0 затрат). Я системный аналитик, поэтому не был готов писать приложение целиком.

По моей инструкции вы сможете сделать подобный конвейер своими силами даже без навыков кодинга.

+86

@moyadoska 19 июн в 11:59

Как повторить успех крутых продуктов или почему JTBD — обязаловка для всех маркетологов

Простой

6 мин

3.1K

Блог компании МояДоскаБизнес-модели * Управление продуктом * Анализ и проектирование систем * Интернет-маркетинг *

Обзор

Что такое JTBD

Jobs To Be Done, «Работы‑Которые‑Надо‑Сделать» — это маркетинговая теория о том, почему люди принимают те или иные решения о покупке. Эта теория помогает предпринимателям, компаниям, менеджерам и теоретикам лучше понимать потребности людей и создавать действительно нужные этим самым людям продукты...

+15

@NeyroEntuziast 12 июн в 08:26

HeyGen представила AI Studio. Как получить доступ и пользоваться HeyGen, чтобы сгенерировать аватара

Простой

5 мин

3.3K

Искусственный интеллектБудущее здесьМашинное обучение *

Обзор

Перевод

Тренд на видео с ИИ-аватарами не сбавляет оборотов. Если в последнее время вы проводили много времени, прокручивая ролики TikTok или Instagram, то наверняка сталкивались с этими ИИ-видео с говорящими персонажами Это и обезьяна, ведущая влог, и день из жизни Джорджа Вашингтона, и многие другие.

Они привлекают внимание, и очевидно, что спрос на такой контент растет.

HeyGen - одна из платформ, которая сделала этот процесс проще и доступнее. Теперь они сделали еще один шаг вперед, представив HeyGen AI Studio.

В этой статье я расскажу вам о том, как работает HeyGen AI Studio, и покажу, какого качества видео вы можете сгенерировать.

Давайте начнем.

@kucev 12 июн в 11:00

Хочешь своего AI-бота? Пошаговый план для новичков и не только

6 мин

6.4K

Data Mining * Искусственный интеллектМашинное обучение * Big Data * Data Engineering *

Перевод

AI-чатботы стремительно трансформируют способы взаимодействия бизнеса и пользователей с технологиями. Эти интеллектуальные виртуальные ассистенты способны обрабатывать клиентские обращения, давать рекомендации и даже автоматизировать сложные бизнес-процессы.

В результате, около 65% организаций заявляют об использовании генеративного ИИ как минимум в одной бизнес-функции на регулярной основе — почти в два раза больше, чем десять месяцев назад.

@Viacheslav-hub 13 июн в 07:00

Создаем свой RAG: от загрузки данных до генерации ответов с LangGraph. Часть 2

Средний

7 мин

4.6K

Python * Искусственный интеллектПрограммирование *

Туториал

Привет, Хабр!

Технология RAG (Retrieval-Augmented Generation) сочетает поиск информации с генерацией ответов, делая AI-системы более точными и осмысленными. В этой статье разберём практическую реализацию RAG с помощью LangGraph — гибкого инструмента для построения агентов и графов.

@snakers4 27 мая в 17:42

Играемся с RTX 5090 (GB202) для инференса

Средний

7 мин

5.4K

Машинное обучение * Компьютерное железоИскусственный интеллектВидеокарты

Обзор

Продолжаем статьи про практические тесты актуальных картонок от Nvidia (A5000 Ada, A100, 3090 и A10). В этот раз мне предложили (не реклама) денёк погонять Nvidia RTX 5090 в хостинге (себе такую брать я бы не стал), и я не мог отказаться от такого предложения.

За день что‑то стоящее натренировать нынче уже проблематично, поэтому будем «снимать» уже привычных обратно совместимых «попугаев» через gpu-burn и также замерим скорость инференса одной нашей довольно прожорливой сетки в продакшене.

Все шутки про Nvidia давно уже не шутки, санкции и торговые войны идут своим чередом, но тем не менее в России новинки появляются с завидной регулярностью несмотря на все запреты.

На фоне сильно негативного новостного фона со стороны игрового сообщества про новый релиз Nvidia и своеобразных «успехов» Nvidia по ~~наращиванию своей капитализации~~ продвинутой «сегментации» рынка (все уже пошутили про новый коннектор, огромный рост TDP и размера карт), мне лично было интересно, а есть ли рост 50* поколения карт для наших задач против 30* поколения.

Если верить техно‑ и игровым блоггерам, их новое поколение совсем не впечатлило. Меня зато так «впечатлило» 40* поколение, что мы даже не рассматривали апгрейд 3090. Но обо всём по порядку.

Давайте разбираться!

+22

@Banakhovich 9 июн в 14:21

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

18 мин

21K

Искусственный интеллект

Из песочницы

Локальный DeepSeek-R1-0528 на скромном железе? Реально. Со скоростью улитки? Первоначально – да. Но итог моего эксперимента: эту 'улитку' можно заставить работать вдвое быстрее.

+69

114

@huraligne 5 июн в 15:19

RAG: Дообучение модели эмбеддингов для повышения точности поиска

10 мин

3.6K

Блог компании Первая грузовая компания (ПГК)Машинное обучение * Искусственный интеллект

Привет, Хабр! Меня зовут Саприн Семён. Я занимаюсь анализом данных и машинным обучением в компании ПГК Диджитал. Сегодня мы продолжаем серию статей, в которой я рассказываю о том, как мы с командой разрабатывали ИИ-помощника. В прошлой статье мы обсудили, почему стандартные подходы к работе с документами не всегда работают, и какие шаги помогли нам повысить качество поиска без существенных затрат памяти на GPU.

Сегодня речь пойдёт о следующем этапе: дообучении (fine-tuning) модели эмбеддингов для улучшения качества поиска в RAG-системе. Это позволило нам получить более точные представления документов и пользовательских запросов, что напрямую сказалось на релевантности финальных ответов. Давайте перейдём к деталям.

2 3 ...

14 15

Garbage In, Garbage Out: как мы учили ИИ искать не в веб-помойке, а в библиотеке. И чему мы научились сами

Смирись: ты ненормальный

Библиотека Asio для начинающих: работаем с корутинами без сегфолтов

История игровой журналистики в России. Часть 6. Журналы «Магазин Игрушек» и «Game.EXE»

Бенчмарк качества распознавания речи (ASR) в телефонии: как мы сравниваемся с Whisper, GigaAM и T-One

Agile в эпоху удалёнки: что делать, если митинги больше не работают?

Нейросетевой помощник для Catan Universe: как я научил ИИ считать карты соперников

Наглядное пособие начинающего ретрогеймера. С чего начать путь в мир старых шедевров

Звоним через полстраны по dial-up модему в 2025 году

Как провалить собеседование по System Design: ошибки, которые допускают даже опытные разработчики

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

Доморощенный OSINT для соискателя. Краткая инструкция

На входе аудио, на выходе — саммари. Собираем локальный транскрибатор из бесплатного софта

Как повторить успех крутых продуктов или почему JTBD — обязаловка для всех маркетологов

HeyGen представила AI Studio. Как получить доступ и пользоваться HeyGen, чтобы сгенерировать аватара

Хочешь своего AI-бота? Пошаговый план для новичков и не только

Создаем свой RAG: от загрузки данных до генерации ответов с LangGraph. Часть 2

Играемся с RTX 5090 (GB202) для инференса

Локальный DeepSeek-R1: Когда скорость улитки – не приговор, а точка старта

RAG: Дообучение модели эмбеддингов для повышения точности поиска

Информация

Специализация