Articles / Bookmarks / Profile of resetme / Habr

@resetme^{read⁠-⁠only}

Скромный пастух нулей и единиц…

ProfileComments196Bookmarks884

ru_vds Feb 22 2023 at 13:00

Почему понимание ограничений — ключ к будущему человечества

Easy

13 min

14K

RUVDS.com corporate blogEcologyPhysicsPopular scienceEnergy and batteries

Translation

Последние новости о прорыве в исследованиях ядерного синтеза провозглашают о возможности «неограниченной» энергии. Каждый раз, когда я вижу слово неограниченный, я вздрагиваю, потому что воспринимаю это как команду читателям «пожалуйста, теперь перестаньте думать». Спустя десятилетия ложных обещаний неограниченной энергии нам нужно начать думать и исследовать ограничения — как очевидные, так и сокрытые. Благодаря этому, мы обычно начинаем понимать, как всё работает.

К счастью, множество других людей уже успешно рассеяло мифы о «неограниченной энергии» в отношении ядерного синтеза, поэтому мне необязательно этим заниматься. Однако стоит объяснить, почему само обещание неограниченности сбивает с толку и иногда даже смертельно опасно. И почему ограничения в конечном счёте желанны.

Читать дальше →

+73

Bright_Translate Feb 24 2023 at 13:00

Руководство по реализации отзывчивого дизайна в 2023 году

Medium

17 min

39K

RUVDS.com corporate blogCSS*HTML*Web design*

Translation

Сегодня построение отзывчивых макетов уже не основывается на контрольных точках (breakpoints) с фиксированной шириной. Вместо этого современные макеты должны работать на устройствах практически любого размера. Однако, к своему удивлению, я всё ещё встречаю сайты, где используется паттерн отзывчивого дизайна – когда присутствует контейнер, получающий новое значение max-width в соответствии с шириной области просмотра.

Термин «отзывчивый» сегодня отражает уже очень многое. У нас есть медиа-запросы, которые проверяют пользовательские настройки, а также современные возможности CSS, которые помогают создавать отзывчивые макеты вообще без использования медиа-запросов. Отзывчивость нынче изменилась, и мы живём в поистине прекрасное время.

Читать дальше →

+56

aapsoftware Aug 29 2020 at 10:10

Технология видео поиска «Video Color»

10 min

18K

Search engines*Image processing*

From sandbox

Немного о поиске

Когда мы говорим о поиске, то сразу представляем себе поисковую систему Google с формой для ввода текстовой строки и многие сотни результатов ссылок на найденные страницы. Однако задумаемся о предмете нашего поиска.

Что мы ищем?

Текст
Документы
HTML странички
Изображения
Аудио
Видео
Двоичные файлы

Для некоторых видов данных существуют специализированные поисковые системы. Например, существуют сайты специализирующиеся на поиске DLL файлов.

Поиск видео

Давайте рассмотрим поиск видео информации. Каким образом можно это сделать? Чисто теоретически?

По тексту
По изображению
По короткому видео фрагменту
По короткому аудио фрагменту

Читать дальше →

+10

Mr-Geekman Feb 14 2023 at 09:00

Стратегии прогнозирования временных рядов в ETNA

7 min

8.8K

Т-Банк corporate blogOpen source*Python*Machine learning*

Tutorial

Меня зовут Дима, я разработчик библиотеки ETNA в Тинькофф. Расскажу о том, как в задаче прогнозирования временных рядов появляются стратегии, какими они бывают и как воспользоваться стратегией в библиотеке ETNA.

+22

dmitriizolotov Feb 21 2023 at 16:11

Микросервисные приложения на GoMicro

Easy

5 min

15K

OTUS corporate blogGo*Microservices*

Tutorial

Go благодаря возможностям компиляции и встроенным механизмам конкурентной многозадачности очень хорошо подходит для создания сетевых приложений и активно используется в создании инструментов для DevOps и распределенных приложений. В этой статье мы рассмотрим некоторые возможности фреймворка GoMicro для реализации микросервисных приложений на Go.

+11

AnatolyBelov Feb 22 2023 at 06:07

Обработка естественного языка (NLP). Личный опыт — мой первый запуск BERT

4 min

4.3K

Programming*Machine learning*Artificial IntelligenceNatural Language Processing*Python*

Machine learning season

BERT — Bidirectional Encoder Representations from Transformers

Здесь не будет рассказываться о том, что такое BERT, как это работает и для чего применяется — в сети об этом достаточно информации.

Это статья про личный опыт — как конкретно у меня получилось запустить BERT с чистого Colab по конкретным описаниям.

OkoloWEB Feb 21 2023 at 07:25

Javascript: базовые вопросы и понятия для самых маленьких

Easy

15 min

51K

ГК ЛАНИТ corporate blogJavaScript*Programming*

Tutorial

Javascript ― язык весьма оригинальный. Его можно любить, ненавидеть и даже бояться, но равнодушным он вас вряд ли оставит. Не знать или не понимать, с чем ты работаешь ― самая частая ошибка, допускаемая современными фронтенд‑разработчиками. Вам бы понравилось, если бы дантист, к которому вы пришли, не понимал, какой он инструмент использует и какие у него особенности работы? Очевидно, что нет. И рано или поздно, если вы действительно хотите стать профессионалами, вы разберётесь во всём, но как сделать так, чтоб это случилось раньше?

В этой статье в блоге ЛАНИТ хотелось бы показать, что о сложных вещах можно и нужно говорить просто.

+115

PatientZero Feb 21 2023 at 06:43

Пишем GPT в 60 строк NumPy (окончание, 2/2)

Medium

15 min

14K

Python*Algorithms*Artificial IntelligenceMathematics*Machine learning*

Tutorial

Translation

В первой части поста мы начали реализацию с нуля GPT всего в 60 строках numpy.

Во завершающей части мы загрузим в нашу реализацию опубликованные OpenAI веса обученной модели GPT-2 и сгенерируем текст.

Читать дальше →

+16

PatientZero Feb 16 2023 at 06:45

Пишем GPT в 60 строк NumPy (часть 1 из 2)

Medium

16 min

77K

Python*Algorithms*Artificial IntelligenceMathematics*Machine learning*

Tutorial

Translation

В этом посте мы начнём реализацию с нуля GPT всего в 60 строках numpy. Во второй части статьи мы загрузим в нашу реализацию опубликованные OpenAI веса обученной модели GPT-2 и сгенерируем текст.

Читать дальше →

+93

skillfactory_school Feb 10 2023 at 18:23

Реверс-инжиниринг искусного двоичного сложения в нейросети

Medium

10 min

4.4K

Skillfactory corporate blogArtificial IntelligenceMachine learning*Reverse engineering*

Case

Translation

Много внимания в последнее время уделяют крупным нейронным сетям с миллиардами параметров, и это не случайно. Комбинируя множество параметров с мощными архитектурами, такими как трансформеры и диффузия, нейросети способны достичь удивительных высот. Под катом — к старту нашего флагманского курса по Data Science — разберём, как именно работает маленькая нейросеть-сумматор. Возможно, это удивит вас.

Читать дальше →

Amet13 Sep 29 2018 at 09:25

Как я диплом в LaTeX писал с GitHub, Docker и TravisCI

5 min

46K

LaTeX*Open source*PDF

Еще со времен обучения в университете я использовал LaTeX для оформления лабораторных и курсовых работ. Познакомился впервые с LaTeX на Coursera, на курсе "Документы и презентации в LaTeX".

В этой заметке я расскажу, как я писал диплом с помощью LaTeX и почему я использовал GitHub, Docker и TravisCI.

Но зачем?

Читать дальше →

+73

AADogov Dec 15 2015 at 07:31

Несколько лайфхаков, которые могут быть полезны при верстке диссертации или больших документов в MS Word

4 min

54K

Lifehacks for geeksIT-companies

From sandbox

Каждый из нас знает, насколько MS Word удобный инструмент для подготовки небольших документов. И каждый из тех, кто сталкивался с подготовкой документа, количество страниц в котором превышает сотню (плюс необходимо придерживаться строгих требований к форматированию), знает об основных недостатках этого инструмента. Мне пришлось в своей жизни столкнуться с версткой 500 страничного документа, причем количество и расположение рисунков таблиц и формул в нем постоянно менялось от версии к версии. Я бы хотел поделиться своими «лайфхаками», которые мне пришлось применить при верстке этого документа. Некоторые из них мне подсказали друзья; на некоторые наткнулся на форумах; некоторые придумал сам.

Эти простые хитрости помогут вам при верстке диссертации дипломной работы или отчета.

В данной статье рассмотрены решения проблем:

создание списка литературы
Склонения перекрёстных ссылок на рисунки таблицы и формулы
Перенос таблиц на новую страницу
Вставка формул

Читать дальше →

+27

boygenius Jan 31 2023 at 11:29

Теория вероятностей в машинном обучении. Часть 1: модель регрессии

28 min

31K

Open Data Science corporate blogArtificial IntelligenceStatistics in ITMachine learning*Mathematics*

В данной статье мы подробно рассмотрим вероятностную постановку задачи машинного обучения: что такое распределение данных, дискриминативная модель, i.i.d.-гипотеза и метод максимизации правдоподобия, что такое регрессия Пуассона и регрессия с оценкой уверенности, и как нормальное распределение связано с минимизацией среднеквадратичного отклонения.

В следующей части рассмотрим метод максимизации правдоподобия в классификации: в чем роль кроссэнтропии, функций сигмоиды и softmax и как кроссэнтропия связана с "расстоянием" между распределениями вероятностей и почему модель регрессии тоже обучается через минимизацию кроссэнтропии. Затем перейдем от метода максимизации правдоподобия к байесовскому выводу и его различным приближениям.

Данная серия статей не является введением в машинное обучение и предполагает знакомство читателя с основными понятиями. Задача статей - рассмотреть машинное обучение с точки зрения теории вероятностей, что позволит по новому взглянуть на проблему, понять связь машинного обучения со статистикой и лучше понимать формулы из научных статей. Также на описанном материале строятся более сложные темы, такие как вариационные автокодировщики (Kingma and Welling, 2013), нейробайесовские методы (Müller et al., 2021) и даже некоторые теории сознания (Friston et al., 2022).

+23

franky_d_zoro Jan 30 2023 at 11:17

SEO Выводы из утечки кода поисковика Яндекс

6 min

105K

Search engine optimization*Increasing Conversion Rate*Web analytics*Search engines*

Opinion

Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

+179

130

avshkol Jan 28 2023 at 13:59

Разбираем Теорию Игр с python-библиотеками nashpy и axelrod

16 min

9.3K

Python*Game development*Mathematics*Logic games

Review

Translation

Пожалуй, самый простой и понятный разбор основ Теории игр, из всех, которые я встречал, с демонстрацией результатов нескольких наиболее популярных игр на питоновских библиотеках nashpy и axelrod.

Это перевод сразу двух статей Mythili Krishnan , аналитика с medium.com

Дочитавших до конца и желающих быстро испытать пару стратегий, ждет небольшой бонус...

+ поучаствуйте в опросе, что вы вообще думаете о теории игр?

dimanosov007 Jan 26 2023 at 14:14

Введение в диффузионные модели для генерации изображений – полное руководство

22 min

42K

Data Engineering*Artificial IntelligenceMachine learning*Data Mining*Python*

Review

Translation

Диффузионные модели могут значительно расширить мир творческой работы и создания контента в целом. За последние несколько месяцев они уже доказали свою эффективность. Количество диффузионных моделей растет с каждым днем, а старые версии быстро устаревают

+29

Anna_sokol22 Jan 26 2023 at 16:00

Тестирование автоматизации Ansible с помощью Molecule Часть 2

21 min

Слёрм corporate blogDevOps*IT careerIT Infrastructure*

Translation

Больше работайте с Molecule, чтобы убедиться, что ваша инфраструктура работает. Используйте компоновку, идемпотентность, несколько контейнеров и внутренние зависимости, чтобы при развертывании веб-сайта ваши роли Ansible вели себя должным образом.

В первой части статьи мы рассмотрели основы настройки Molecule и провели нескольких простых тестов. В этой статье мы углубимся в конфигурацию Molecule и различные проверки, которые она может выполнять.

+12

Kilor Jul 29 2022 at 12:17

PostgreSQL Antipatterns: где скаляру в GiST место?

3 min

3.4K

Тензор corporate blogDatabase Administration*High performance*SQL*PostgreSQL*

В PostgreSQL есть "волшебный" тип индекса GiST, который позволяет быстро искать разные сложные вещи - от интервалов до массивов и даже реализовывать полнотекстовый поиск.

Про его внутреннее устройство и возможности подробно рассказывал Егор Рогов, а я в статье "PostgreSQL Antipatterns: работаем с отрезками в «кровавом энтерпрайзе»" показал, как с помощью расширения btree_gist он позволяет решать типовые бизнес-задачи.

Одной из таких задач является поиск отрезков внутри сегмента со скалярным идентификатором. И если для btree очевидно, что поле с меньшей кардинальностью должно стоять в индексе раньше - индекс от этого и меньше и быстрее (см. "DBA: находим бесполезные индексы"), то так ли это однозначно для btree_gist?

+10

anazarta Jan 25 2023 at 07:02

Как Яндекс научился распознавать, что написано в рукописных архивах

11 min

37K

Яндекс corporate blogSearch engines*Image processing*Machine learning*Artificial Intelligence

✏️ Technotext 2023

Привет, Хабр. Меня зовут Саша, в прошлый раз я рассказывал сообществу про поиск организаций в Яндексе. В этот раз мы вновь поговорим про поиск, но уже совершенно другого рода. Сегодня расскажем про «Поиск по архивам». Этот проект вырос из моего личного интереса к истокам семьи, но в итоге (хочется верить!) поможет тысячам других таких же пользователей чуть больше узнать о своих корнях.

Генеалогическое исследование — очень трудоёмкий процесс. Информация о родственниках разбросана по разным архивам, запросы на получение данных могут обрабатываться долго, а доступ даже в открытые архивы ограничен. Несмотря на то что оцифровка архивных документов ведётся уже более десяти лет, по ним не так-то просто искать — придётся отсматривать вручную множество сканов в надежде найти фамилию предка.

Чтобы упростить этот процесс, мы научились превращать в текст сканы архивных документов. Основная сложность этой задачки заключалась в том, что текст в архивах написан от руки. Машинописный текст всё-таки создан по предсказуемым правилам: автор использует набор уже известных шрифтов. А рукописный текст уникальный, потому что каждый человек пишет по-своему. Кроме того, архивные документы написаны не просто от руки, но и на дореволюционном русском языке, который существенно отличается от современного.

Решению этой задачи мы и посвятим историю. А поможет мне с ней Таня @miryable из команды, которая уже много лет развивает в Яндексе технологию оптического распознавания символов (OCR).

+143

104

sergree Jan 4 2023 at 21:21

Как создать эвристический алгоритм онлайн-мастеринга и получить предупреждение от RIAA

Medium

24 min

17K

Python*Algorithms*Start-up developmentBiography of geeksSound

Case

From sandbox

Добрый день, меня зовут Сергей. В своей статье я бы хотел осветить тему аудио мастеринга, а именно: автоматизированного онлайн-мастеринга музыки.

Я расскажу о своём пути от продюсера психоделического транса до мейнтейнера самой популярной open source библиотеки автоматизированного референсного мастеринга на Python, получившей предупреждение от американской ассоциации звукозаписывающих компаний RIAA.

+141

1 2 ...

22 23

25 26 ...

43 44