Привет в Новом году. Я тут добрался на праздниках до одной темы, которая пылится у меня уже полгода в закладках. Поговорим сегодня о метриках лексического разнообразия. Эти метрики показывают насколько богат текст на разные слова, помогая нам оценить его сложность. В этой небольшой заметке я кратко расскажу историю вопроса, о современных метриках, а в конце покажу результаты предварительных экспериментов. Тетрадка доступна по ссылке.
Team Lead
Математика для Data Science и машинного обучения за 8 месяцев. Подробный план обучения
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/9bf/a65/0db/9bfa650db8901d1c9160f903a58a1dd3.jpg)
Беспилотные автомобили, продвинутые голосовые ассистенты, рекомендательные системы – это только малая часть тех классных продуктов, которые создаются с помощью инженеров по машинному обучению и, думаю, не для кого не секрет, что за кулисами сего чуда стоит математика. Именно она играет главную роль в понимании алгоритмов машинного и глубокого обучения.
Машинное обучение держится на трёх основных столпах:
YOLOv7 пользовательское обнаружение объектов
![](https://habrastorage.org/getpro/habr/upload_files/f4f/a37/aed/f4fa37aedee11855ccd0653dee08ec9d.gif)
Статья по обучению YOLOv7 на своих данных, для обнаружения выбоин на дорогах
С момента своего создания семейство моделей обнаружения объектов YOLO прошло долгий путь. YOLOv7 является самым последним дополнением к этому знаменитому семейству детекторов объектов с одним выстрелом на основе привязки. Он поставляется с множеством улучшений, которые включают в себя самую современную точность и скорость. В этой статье мы проведем точную настройку модели обнаружения объектов YOLOv7 на основе реального набора данных для обнаружения выбоин.
Я обучил нейросеть на своих рисунках и отдаю модель бесплатно (и научу вас делать это)
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/928/030/369/9280303698bcfb634f23a55cfac31069.png)
Модель подходит для создания бесшовных узоров, абстрактных рисунков и стилизованных под акварель образов. Как использовать модель и как обучить нейросеть на своих картинках?
Делаем документацию здорового человека в Git на примере Docs Ozon
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/f53/1c4/f1e/f531c4f1ee4040f7304549f963abccfd.jpg)
Казалось бы, с документацией всё просто — пишешь, публикуешь, поддерживаешь актуальность. Например, вот у нас в Ozon есть пользовательские инструкции на docs.ozon.ru: выглядит просто как текст на сайтике, что ж необычного-то в его размещении и в целом в работе техписателей?
Если начать раскапывать, всплывёт ещё несколько вопросов:
• где хранить тексты и почему Confluence не подходит?
• как красиво оформить документацию с помощью статических генераторов сайтов
• зачем техписателям знать git и CI/CD?
• в какой момент пора искать разработчиков в команду и превращать документацию в платформу?
На связи Катя — руководитель отдела технических писателей в Ozon, и сегодня расскажу о платформе Docs Ozon изнутри.
Что нужно знать, чтобы вдохнуть жизнь в вашу визуализацию
Цвет одинаково важен в любом дизайне и визуализации данных. Он не только «задаёт тон», но и меняет восприятие. Цвет воздействует на уровне подпорогового внимания. Визуальные свойства этого уровня воспринимаются моментально и не требуют обдумывания. Они влияют на восприятие незаметно. Этот процесс бессознателен и обусловлен культурой и опытом. У разных людей восприятие различается. К счастью, есть руководства, помогающие внимательно относиться к цвету; я рекомендую посмотреть Color in Culture graph от Дэвида Маккэдлеса. Подробности — к старту нашего флагманского курса по Data Science.
Молодежь нынче пошла не та, или поиск системного аналитика «за 200»
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/e4a/23b/bd5/e4a23bbd598ca740cc57afff372acb9f.png)
Всем привет!
Меня зовут Коля, и я периодически собеседую кандидатов на позицию системного аналитика. За последние два месяца провёл порядка 20 десятков собеседований. В основном были кандидаты с опытом 1.5-3 года, на пути к уровню Middle и с зарплатными ожиданиями 150-200 тысяч рублей в месяц.
В данной статье хочу побрюзжать про несколько расстроивших меня особенностей, которыми обладало большинство кандидатов данного уровня.
25 правил разработки программных интерфейсов [издание третье, дополненное и расширенное]
Это — очередная (уже третья) ревизия главы 11 мой книги о разработке API. Если вы найдёте этот текст полезным, я буду очень благодарен за рейтинг на Амазоне.
Обзор паттернов интеграции микросервисов. Часть 2
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/5f3/556/716/5f35567165d55b6c967833795071bb15.jpg)
Продолжаем обзор паттернов интеграции микросервисов. В первой части мы рассказали, зачем IT-специалистам нужны шаблоны интеграции, и для каких задач они подходят. Подробно остановилисьна Circuit Breaker, Sidecar, Ambassador, Anti-Corruption Layer и Async Request-Reply. Сегодня по плануразобрать Backends for Frontends, Cache-Aside, Gateway, Gateway Aggregation и Gateway Routing.
Обзор паттернов интеграции микросервисов. Часть 1
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/a32/ab3/6f7/a32ab36f7abb741bd7299bfb877f70f6.jpg)
Недавно мы проводили вебинар «Обзор паттернов интеграции микросервисов». На нём энтерпрайз архитектор Пётр Щербаков рассказал, зачем IT-специалистам нужны шаблоны интеграции, и разобрал, для каких задач они подходят, а для каких нет. Для тех, кто пропустил или предпочитает читать, а не смотреть подготовили текстовый обзор интеграционных паттернов: Circuit Breaker, Sidecar, Ambassador, Anti-Corruption Layer и Async Request-Reply.
Эксперимент Базермана: как мы ежедневно теряем деньги
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/b6c/c86/fa6/b6cc86fa661e48e20a5ab2f8e9a5a8a4.jpg)
Вы ещё не слышали, как профессор Гарвардской школы бизнеса «наживается» на своих студентах? Тогда вам, наверное, будет интересно узнать о том, как продать 20 долларов за гораздо большую сумму. Скажем, долларов за 200.
Профессор Макс Базерман придумал эксперимент, который демонстрирует необъяснимое иррациональное поведение будущих профессиональных бизнесменов и менеджеров в их родной стихии — управлении проектами. Кстати, в эту же ловушку попадают и топ-менеджеры крупных компаний, с которыми профессор проводит свои семинары.
WireMock – швейцарский нож в арсенале тестировщика. Часть 2
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/7db/00a/787/7db00a787f7ac9a2253bb8ab6d738c3f.png)
Всем привет! В предыдущей части я рассказал, что такое WireMock, в каких случаях его необходимо использовать, как его разворачивать и настраивать, как правильно сопоставлять запросы с заглушками и как пользоваться журналированием. Настало время рассмотреть все что связано с HTTP ответом, который возвращает заглушка, а также затронем сценарии.
Создание архитектуры программы или как проектировать табуретку
К моему удивлению оказалось, что на вроде бы актуальный вопрос: «Как построить хорошую/красивую архитектуру ПО?» — не так легко найти ответ. Не смотря на то, что есть много книг и статей, посвященных и шаблонам проектирования и принципам проектирования, например, принципам SOLID (кратко описаны тут, подробно и с примерами можно посмотреть тут, тут и тут) и тому, как правильно оформлять код, все равно оставалось чувство, что чего-то важного не хватает. Это было похоже на то, как если бы вам дали множество замечательных и полезных инструментов, но забыли главное — объяснить, а как же «проектировать табуретку».
Хотелось разобраться, что вообще в себя включает процесс создания архитектуры программы, какие задачи при этом решаются, какие критерии используются (чтобы правила и принципы перестали быть всего лишь догмами, а стали бы понятны их логика и назначение). Тогда будет понятнее и какие инструменты лучше использовать в том или ином случае.
Данная статья является попыткой ответить на эти вопросы хотя бы в первом приближении.
Паттерны проектирования, реализующие наблюдаемость в микросервисах
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/f2e/478/0e8/f2e4780e86b334842c2b5114e48a01f3.png)
Наблюдаемость (observability) — это супермножество мониторинга. В дополнение к подробному анализу неявных состояний, приводящих к сбоям, это свойство предполагает высокоуровневый обзор работоспособности системы. Кроме того, наблюдаемая система предоставляет подробную информацию о своей внутренней работе, что позволяет обнаруживать более глубокие системные проблемы.
Времена в английском языке
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/484/0a2/c9b/4840a2c9b98fecbfb3ec089973b86c1e.jpeg)
Пространственно-временно́й континуум обходится одним временны́м и тремя пространственными измерениями. M-теория струн расширяет физическую модель до невообразимых девяти пространственных измерений, но сохраняет время линейным.
В отличие от точных наук, учебники английской грамматики используют парадигму двухмерного времени, безжалостно разбивая наши попытки осмысления подобного представления о традиционную таблицу времён размером три на четыре.
Как сделать удобную дизайн-систему. Цвета. Часть 1
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/da1/0b9/73b/da10b973b04eba8a6f74747d55362a93.png)
Дизайн-система позволяет быстро взаимодействовать с компонентами, легко вносить изменения во все макеты и в целом прививает дизайнеру навык организации больших объемов информации.
Зачастую, дизайнер начинает делать дизайн-систему аккуратно, придавая ей должное внимание. Но в по мере увеличения экранов становится, как мне кажется, морально труднее вносить новые компоненты и корректировки. Но помните одну вещь - чем больше времени уделить дизайн-системе, тем больше времени она сэкономит в будущем.
Основное правило дизайн-систем: чем меньше компонентов — тем лучше и вам, разработчику и конечному юзеру. Это касается количества цветов, шрифтов, иконок и так далее. Дизайн будет выглядеть более консистентным и единым.
Дизайн система: Иконки
![](https://habrastorage.org/r/w1560/getpro/habr/upload_files/ede/3bc/470/ede3bc4708f4549d36ef642f5daa5662.png)
Подготовка иконок к работе в дизайн системе
В этой серии статей я хотел бы поделиться своим опытом построения дизайн-систем и предложить несколько идей по автоматизации. В первой статье мы поговорим на довольно простую, но важную тему — иконки. Поехали!
Путь наполнения резюме и его необычная подача
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/c8e/f23/c18/c8ef23c18f5e5e628001a4535eb3a973.jpg)
Я занимаюсь компьютерной графикой и уже делаю это достаточно много времени. У меня всегда был к этому интерес и я стремительно набирал обороты в этой сфере. В 16 лет я пошел на работу...
Микросервис головного мозга. Пилим всё, что движется
![](https://habrastorage.org/r/w780/getpro/habr/upload_files/026/f9b/84c/026f9b84c2f012cac5bd4f49ea0cfdc5.jpg)
Это история о том, как увеличить скорость выкатки фич, но сохранить качество продукта. О болевых точках, которые замедляют разработку, и новой «болезни» — микросервисе головного мозга, которую диагностировал Михаил Трифонов, техлид фронтов в SberСloud. Он утверждает, что она приводит к росту функциональности ML Space на 683% при увеличении команды разработки всего в 2 раза. Невероятно, но бизнес-аналитика это подтверждает. Так что давайте разбираться по порядку.
Information
- Rating
- Does not participate
- Location
- Москва, Москва и Московская обл., Россия
- Date of birth
- Registered
- Activity