Articles / Bookmarks / Profile of apoltavcev / Habr

How to become an author

Артём Полтавцев @apoltavcev

Продакт-менеджер Хабра

ProfileArticles16Posts21NewsComments182

Jaylla Aug 20 2021 at 11:55

Рекомендательные системы: проблемы и методы решения. Часть 2

15 min

21K

Prequel corporate blogAlgorithms*Machine learning*Artificial Intelligence

Привет! Меня зовут Екатерина Ванская, и я занимаюсь data science в компании Prequel. В этой статье я продолжу обзор рекомендательных алгоритмов, которым мы начали в предыдущем моем материале

(вот ссылка на первую часть).

Область рекомендаций усложняется по мере расширения сферы ее применения, с каждым новым вызовом и нюансом использования. По мере увеличения объемов данных и усложнения задач появлялись новые подходы, отличные от рассмотренных ранее простых коллаборативных моделей.

Читать далее

+5

Jaylla Jul 14 2021 at 10:16

Рекомендательные системы: проблемы и методы решения. Часть 1

14 min

33K

Prequel corporate blogMachine learning*Algorithms*

Technotext 2021

Привет! Я хочу рассказать вам о рекомендательных алгоритмах. Мы в Prequel создаем фильтры и эффекты для редактирования фото и видео. Создаем давно, и постепенно этих эффектов стало очень много. А с ними и пользовательского контента. Мы захотели помочь с выбором из этого многообразия, для чего нам и понадобилась система рекомендаций. Если масштабы вашей системы такие, что пользователям сложно в ней ориентироваться, возможно, что рекомендации могут помочь и вам.

Задуманный систем оказался слишком объемным для одной статьи, поэтому мы разбили его на две части. Перед вами первая, она посвящена постановке задачи и базовым методам решения. В этой части мы разберем коллаборативные модели от матричного разложения (на примере ALS) до neural collaborative filtering. Кроме того, будет небольшой обзор метрик и техник борьбы с проблемой холодного старта.

Читать далее

+9

dmitrifriend Jan 31 at 20:45

«Будущее за узкой специализацией»: судьбоносное интервью Ляна Вэньфэна, основателя DeepSeek, посвящённое v2

Easy

17 min

24K

BotHub corporate blogArtificial IntelligenceMachine learning*The future is here

Interview

Translation

Кремниевая долина потрясена: в сфере искусственного интеллекта назревает тектонический сдвиг, и весь мир следит за Китаем. DeepSeek-r1 произвела эффект разорвавшейся бомбы, сравнявшись по возможностям с топовыми решениями OpenAI. Восток диктует новые правила игры, и перед всем миром встаёт важный вопрос: а что если будущее ИИ создаётся вовсе не в Кремниевой долине?

Перед вами интервью с основателем DeepSeek, опубликованное в июле 2024 года. Оно состоялось вскоре после выхода в открытый доступ модели DeepSeek-v2, мгновенно сделавшей компанию известной на весь мир. В этой беседе Лян рассказывает, как маленький китайский стартап осмелился перепрыгнуть титанов индустрии и переопределить саму концепцию инноваций.

Приятного прочтения (-:

Читать далее

+71

Danila4545 Jan 31 at 10:29

D&D: математика и удача

Easy

9 min

10K

Lemana Tech corporate blogPopular science

Analytics

Приветствую, искатели приключений!
Меня зовут Данила Бахтин, и я специалист по анализу данных отдела управления ценностью данных в Лемана Тех (Леруа Мерлен).

Помимо работы у меня есть несколько увлечений. Одно из самых времязатратных — настольные ролевые игры и в частности — Dungeons & Dragons (aka DnD). В настольных играх очень много зависит от бросков костей, и в какой‑то момент моя профессия проникла в мои увлечения. В своей первой статье я расскажу, как попытался подойти к анализу результатов бросков двадцатигранного кубика в партиях, в коих участвовал лично, как дата‑аналитик.

Читать далее

+22

looi Jan 31 at 07:03

Продуктовый дизайн во власти карго-культа: как перестать бесконечно исследовать и начать делать

Easy

6 min

3.8K

Garage Eight corporate blogUsability*Research and forecasts in IT*Product Management*Design

Opinion

Всем привет. Меня зовут Артур Арсёнов, я Product Design Lead в Garage Eight. За 20 лет в продуктовом дизайне я успел поработать дизайнером, арт-директором, владел собственной компанией и стал дизайн-лидом.

Десять лет назад я был одним из тех дизайнеров, кто говорил: «Давайте исследовать, давайте тестировать, давайте разбираться как можно глубже». И вот спустя десять лет и 200+ проектов я могу сказать, что исследования из решения превратились в проблему. Как так вышло и что с этим делать, разбираю в статье. Если в вашей компании из-за бесконечных исследований цикл разработки продукта растянулся на месяцы и годы, то го читать.

Читать далее

+15

itGuevara Jan 28 at 21:49

Digital Twin. Часть 1. Цифровой двойник vs цифровой самозванец

27 min

4K

CAD/CAM*System Analysis and Design*Data visualization*IOTResearch and forecasts in IT*

Сегодня распространённым (модным) явлением стало называть «старое» моделирование новым термином «Производство цифровых двойников» (Digital Twin), тем самым создавая туман-интригу, при котором соблазн монетизации пафосного бренда и хайп вокруг Цифрового двойника побеждают здравый смысл. За редким исключением все, что сейчас называют Цифровой трансформацией и Цифровым двойником – по сути ими не являются, отсюда и желание разобраться в термине «цифровой двойник». Первый шаг на пути «от путаницы к ясности» - это определиться с терминологий. Так необходимым условием идентификации Digital Twin предлагается считать наличие трех раздельных компонентов (два близнеца и связь между ними) и адекватность модели (точность, т.е. «as-really-is», и требуемая детализация).

По тексту приведены в основном цитаты из [DTatom20] / [DTatom19min] и [Dozortsev22] / [Dozortsev23]. Однако эти и подобные исследования (вкл. [Pavlov23]) носят описательный (обзорный) характер, а хороших (внятных) классификаций, концепций и framework для DT не встречал. Вообще, по DT информации – тьма, но после прочтения хотя бы указанных книжек и ссылок становится вопросов только больше.

Пока что красивая метафора «Цифровой двойник» \ Digital Twin (ЦД \ DT) имеет скупую концептуальную проработку: требуется даже не уточнение концепции, а скорее ее формирование, т.к. это пока только аморфная и противоречивая парадигма, точнее множество парадигм DT/ Pseudo DT, в которых называют одним именем (DT) разные вещи (размытие концепции). По большому счету сегодня имеем только концепт Майкла Гривса и массу «маркетинговых оберток», которые не соответствуют даже его концепту 2002 года. Попытки концептуализации, классификации, разработки таксономий хоть и проводятся, например, [Archetypes], но пока они не очень результативны.

Читать далее

+7

kesn Mar 17 2022 at 09:54

Как я опять Хабр сломал

6 min

43K

Information Security*Website development*HabrProgramming*Bug hunters*

Всегда хотел взломать Хабр. Мечта такая, но как-то руки не доходили. И вот, вдохновившись статьей о праведном взломе через iframe src , я, как и автор поста @Maxchagin, решил исследовать функционал Хабра на предмет уязвимостей.

Начать решил с нового редактора, рассуждая следующим образом: раз он новый, то и уязвимости там точно должны быть.

Читать далее

+193

Maxchagin Feb 22 2022 at 13:31

Как я Хабр взломал

3 min

64K

Information Security*Website development*HabrBug hunters*

Technotext 2022

Всегда хотел взломать Хабр. Мечта такая, но как-то руки не доходили. И вот, вдохновившись статьей о праведной борьбе с Безумным Максом, я, как и автор поста, решил исследовать функционал Хабра на предмет уязвимостей.

Читать далее

+465

ItwithMisha Jan 22 at 09:14

Старики будут править IT

Easy

6 min

111K

IT careerReading room

Opinion

Периодически на просторах интернета натыкаюсь на различные мнения по-тому, что в "Нарнии для разработчиков" нельзя находиться людям, которые уже преодолели барьер в 30 лет. И вообще этим людям пора либо перейти в менеджмент или запускать процесс само-утилизации и просто исчезнуть, для того, чтобы "молодые, успешные" 20 летние сеньоры пришли и начали перфомить так, что 30 летнему деду и не снилось.

Но так ли - это на самом деле, что более молодой разработчик может в базовых задачах выдавать большую производительность или вообще хотят ли текущие зумеры идти работать в айтишечку, чтобы перфомить? Давайте разберемся.

Читать далее

+244

Ingirov Jan 19 at 06:28

У вас не будет серьезных перемен в жизни, пока вы не смиритесь. Почему это именно так и как работает?

Easy

5 min

80K

BrainHealthIT career

Было у вас такое, что вам отчаянно хотелось глобальных перемен? Сменить профессию, жениться/выйти замуж/развестись, а то и вовсе стать другим человеком, который, к примеру, не теряет голову в сложной ситуации, принимает верные решения или всем нравится. У меня было. И получалось отвратительно, пока я не понял одну вещь.

Читать далее

+48

sima_cianea Jan 10 at 11:28

А если без A/B-тестов? Как мы оценивали эффективность контент-продукта через квазиэксперименты

Medium

10 min

3.1K

Lamoda Tech corporate blogMobile App Analytics*

Case

Бывает, что привычные A/B-тесты кажутся слишком сложными или затратными, и возникает соблазн искать быстрые альтернативы. Но насколько они эффективны?

Меня зовут Сима Гиззатуллина, я продуктовый аналитик в Lamoda Tech. Я расскажу, как мы искали инструмент для оценки контентного продукта, какие подводные камни обнаружили, и почему в итоге простые пути оказались не такими уж простыми. Поделюсь, как проводили исследование от построения модели атрибуции до разных сортов мэтчинга, и к чему в итоге пришли.

Читать далее 🔥

+16

Keep_lookout Dec 29 2024 at 10:50

О карме

Easy

2 min

4.1K

BrainPopular scienceSocial networks and communitiesCommunity management*

Opinion

Альберт Эйнштейн:

"Если люди хороши только из-за боязни наказания и желания награды, то мы действительно жалкие создания"

Когда я смотрю на то, как одни люди минусуют карму другим, то представляю себе приблизительно такой образ.

Вот я стою перед автором, написавшим множество различных статей, в которых он выразил свои мысли и идеи, результаты проделанной работы и поделился с сообществом.
В руках у меня кнут и пряник, и я властен казнить его или миловать.

Я никогда и никому не буду минусовать карму. Это принципиальная позиция.

Читать далее

+20

El_Gato_Grande Dec 6 2024 at 10:38

Геймификация любви: как соцсети и приложения для знакомств изменили отношения

6 min

12K

Selectel corporate blogHealthBrainSocial networks and communitiesReading room

Давайте начистоту: время от времени приходит мысль, что онлайн-знакомства — это хорошая идея. Вы регистрируетесь в очередном приложении, заполняете данные профиля, подбираете настройки и оплачиваете подписку. А в следующее мгновение начинается игра, в которой сложно победить. Именно игра, потому что онлайн-знакомства — это, простите за тавтологию, не знакомства. Это их геймификация.

Читать дальше →

+60

slavashel Nov 27 2024 at 04:54

Об инциденте с NTP-серверами

5 min

83K

Яндекс corporate blogNetwork technologies*High performance*IT Infrastructure*

Retrospective

Недавно на Хабре вышла статья об аномальной нагрузке на публичные NTP‑серверы в рунете. К сожалению, к этой ситуации привела ошибка в прошивке Яндекс Станций.

Как наши Станции синхронизируют время, что спровоцировало инцидент и как мы планируем поступить дальше — обо всём этом расскажем в статье. Хочется верить, что описание ситуации и принятые меры помогут не только нам, но и коллегам по индустрии избежать подобного в будущем.

Читать далее

+498

Saygin Nov 25 2024 at 15:58

Справочник статистических методов для менеджеров продукта и маркетологов

Easy

1 min

5.5K

Statistics in ITProduct Management*Internet marketing*Growth Hacking*

Tutorial

Давно замечаю, что подавляющее большинство менеджеров (продакты, маркетологи, growth-менеджеры) ограничиваются, в основном, одним статистическим методом — хи-квадратом (Chi-squared test) — что уже неплохо, но это только верхушка айсберга. Методов гораздо больше, и каждый из них может закрывать свои задачи.

Я долго искал, что могло бы стать готовым помощником для менеджеров, но ничего, что отвечало бы всем требованиям, так и не нашёл.

Поэтому собрал свой справочник с методами частотной аналитики. Старался сделать всё максимально просто: без формул, сложных терминов и заумных объяснений. Главное — чтобы было интуитивно понятно, какой метод выбрать и для какой задачи

Читать далее

+29

TilekSamiev Nov 18 2024 at 16:31

Книжные пираты: современные Робины Гуды или преступники?

9 min

9.6K

History of ITMedia management*Data storage*Content-marketing*

Литература — это атрибут цивилизации. Писатели и поэты — первые наставники людей. Чем дольше развивается цивилизация, тем более обширное должно быть общественное литературное достояние. Поэтому Пушкина и Чехова нужно переводить в Америке. Фолкнера и Уитмена нужно переводить в России. К их работам нужно делать комментарии. Поэтому всех поэтов, философов, писателей, всех создателей величия ума нужно переводить, комментировать, публиковать, печатать, перепечатывать, объяснять, декламировать, распространять. Давать читать книги всем, давать дешево, давать даром.

Так считал и Stiver, создатель онлайн-библиотеки Flibusta (запрещена на территории РФ). Роскомнадзор внес Flibusta в черный список из-за многочисленных заявлений о нарушении авторских прав. Flibusta удается оставаться в сети благодаря многочисленным зеркальным сайтам. В этой онлайн-библиотеке с 2009 года собрано около 620 тысяч книг разных жанров и зарегистрировано более 1,3 миллиона пользователей. Большинство книг на русском, украинском и белорусском языках.

В сентябре 2024 года Stiver опубликовал пост о том, что неизлечимо болен (глиобластома), и что вероятно, электронная библиотека вскоре прекратит свое существование. Для многих Флибуста была одним из главных и уникальных сетевых ресурсов просвещения людей, говорящих и читающих на русском языке. А 22 октября стало известно, что Stiver скончался.

В этой статье рассмотрим современное книжное пиратство и деятельность онлайн-библиотек, ставящих своей целью сохранение книг.

Читать далее

+56

ivan_leontyev Jul 4 2023 at 13:29

Как мы посчитали уровень Data Driven’ности в компании и вклад в него каждого аналитика?

7 min

4.7K

Купер corporate blogIT-companiesIT Standards*Statistics in ITE-commerce management*

Case

Салют! Меня зовут Ваня Леонтьев, я директор по аналитике в СберМаркете. Эта статья о том, как мы оцифровали такую сложную концепцию как data-культура в компании. Поделюсь предпосылками, нашим подходом к расчету и планами по её развитию. Думаю, наш опыт будет интересен аналитикам, лидам аналитических команд, руководителям продукта и компаний в целом — всем тем, кто кто стремится продвигать культуру данных в своей компании. А также тем, кто хочет иметь инструмент для приоритизации и управления в команде аналитики.

Читать далее

+5

m0rtymerr Nov 13 2024 at 10:07

Ты — ненастоящий айтишник / Дедовщина в IT

Easy

8 min

86K

Development Management*Personnel Management*IT career

Opinion

IT — пилюля от бедности. Нет другой сферы, где без связей, выдающихся способностей или нарушения закона можно так быстро начать получать комфортный доход. Область растет, прибывают новые люди и вроде все хорошо… Но появилась каста людей, считающая смыслом жизни унижение и обесценивание пытающихся войти в IT.

Читать далее

+66

m0rtymerr Nov 3 2024 at 08:38

Рекрутеры — паразиты? Отказ на свою же должность в IT

Easy

5 min

112K

IT careerResearch and forecasts in IT*Personnel Management*

Analytics

Я провел эксперимент, в котором попросил айтишников попытаться устроиться на свою же должность в свою же компанию. Результаты можно посмотреть внутри, выявилась полная некомпетентность и лень рекрутеров. В текущем сломанном найме виноваты только они.

Читать далее

+191

Spacelight Oct 31 2024 at 08:17

Не можешь победить — автоматизируй. Упрощаем рутину в аналитических задачах

Easy

6 min

13K

Сравни corporate blogSystem Analysis and Design*IT-companiesProduct Management*

Case

Автоматизация — краеугольный камень современной аналитики, и речь здесь не только о том, чтобы оптимально настроить масштабные базовые процессы вроде CI/CD. Точечное внедрение инструментов и фреймворков, исходя из конкретной задачи, могут дать ощутимый быстрый эффект как минимум на уровне экономии времени. И стать предпосылками к более крупным оптимизациям.

Одним из наших локальных кейсов автоматизации в Сравни делимся под катом. Рассказываем, как наладили регулярный процесс сверки данных из десятков таблиц силами одного специалиста, с помощью уже имеющихся в компании инструментов — low code-платформы и мессенджера.

По итогу автоматизации остались довольны и аналитики, и аккаунт-менеджеры: теперь вместо недели рабочего времени задача сверки данных из таблиц занимает несколько часов (с перспективой дальнейшего ускорения).

Читать далее

+27

3