Search
Write a publication
Pull to refresh
8
0
Oleksandr Piekhota @aslikeyou

User

Send message

Реализация алгоритма шинглов на Node.JS. Поиск нечетких дубликатов для английских текстов

Reading time5 min
Views11K
При работе с информацией часто возникают задачи парсинга веб-страниц. Одной из проблем в этом деле является определение похожих страниц. Хороший пример такого алгоритма — «Алгоритм шинглов для веб-документов».

Часть проекта по парсингу реализована на Node.JS, поэтому и алгоритм нужно было реализовать на нем. Реализаций на javascript или npm-пакетов я не нашел — пришлось писать свою.
Читать дальше →

Information

Rating
Does not participate
Location
Киев, Киевская обл., Украина
Date of birth
Registered
Activity

Specialization

Software Developer, DevOps
Lead
Git
Python
PostgreSQL
Docker
SQL
OOP
MySQL
Database
PHP
Golang