Comments / Profile of maxood / Habr

@maxood

User

ProfileArticlesPostsNewsComments149

REST в реальном мире и практика гипермедиа

maxood Oct 27 2017 at 16:53

websockets и grpc

Look

REST в реальном мире и практика гипермедиа

maxood Oct 27 2017 at 13:04

ИМО, REST умер, как технология, года 3 как.
Зачем вспоминать о ней сейчас?

-2

Look

Полезные скрипты при миграции из Oracle в PostgreSQL

maxood Oct 22 2017 at 06:11

Похоже, что переход с Oracle на Postgres становится массовым. Еще заметил, что не менее массово проекты переносят с Hadoop/Hive/Spark на тот же Postgres.

Look

Реализация классификации текста свёрточной сетью на keras

maxood Nov 13 2016 at 20:12

Да, но! Предобученных вариантов надо иметь много и постоянно их обновлять. Скажем, если речь идет об анализе медицинских текстов, то обучать модель на спортивных текстах не имеет смысла. Или другой пример — несколько месяцев назад не было термина brexit. Соответственно, анализ текстов СМИ на базе старых моделей будет просто игнорировать это слово со всеми вытекающими… Это я к тому, что предобученные модели надо использовать с осторожностью или не использовать вообще.

Look

Реализация классификации текста свёрточной сетью на keras

maxood Nov 13 2016 at 20:02

word2vec, как алгоритм, ничем не отличается для русского, английского или какого-либо еще языка. Для обучения и последующего использования модели желательно, но не обязательно, использовать нормализованные тексты.

Look

Реализация классификации текста свёрточной сетью на keras

maxood Nov 13 2016 at 13:04

Возможно пригодится — набор русских текстов (около 500 000 статей СМИ)

Look

JSON-сериализатор на быстрых шаблонах

maxood Sep 29 2016 at 13:26

Rapidjson появилася в ноябре 2011 на Google Code

Look

JSON-сериализатор на быстрых шаблонах

maxood Sep 29 2016 at 10:50

Использую много лет rapidjson — очень быстрая и стабильная библиотека.
По поводу бенчмарков — есть такой проект Native JSON Benchmark. Можете добавить туда свою библиотеку и сравнить с другими (на данный момент — 41 библиотека).

Look

Работа мечты и бесплатный кластер на 1 миллион мета-данных

maxood Jun 21 2016 at 20:02

В вашей таблице есть уникальный ключ? Как вы собираетесь проверять результат исследований?
В JSON-файле 1 013 063 записей, при этом уникальных idExternal — 1 011 071.
Например — cat ./messages.json | grep \«idExternal\»:\«5-41:\» | wc -l
1205

Уникальных url еще меньше — 977462.

Поясните, как вы будете сопоставлять «эвристики» с исходными данными и, вообще, что вы подразумеваете под термином «эвристика»?

Look

1 2 ...

6 7