Как стать автором
Обновить
3
0
Виктор @Wik0

Гравировка

Отправить сообщение

Как превратить книгу о Гарри Поттере в граф знаний

Время на прочтение12 мин
Количество просмотров10K

Обработка естественного языка — это не только нейронные сети, а данные — это не только строки, числа и перечисления. Область работы с данными простирается намного дальше. К старту флагманского курса по Data Science представляем вашему вниманию перевод из блога разработчиков графовой базы данных neo4j о том, как при помощи SpaCy и Selenium извлечь из книги граф взаимоотношений героев. Подробности и код, как всегда, под катом.

Читать далее
Всего голосов 18: ↑13 и ↓5+11
Комментарии0

Планет какого типа во Вселенной больше всего?

Время на прочтение10 мин
Количество просмотров6K

Как художник видит экзопланету Проксима b. Считается, что она недружелюбна для жизни из-за того, что не имеет атмосферы из-за свойств родительской звезды. Это, как говорят астрономы, «глазеющий» мир – одна сторона планеты постоянно смотрит на звезду, и жарится в её свете, а другая замерзает. Возможно, именно таких планет больше всего во Вселенной.

В астрономии есть один популярный миф о том, что Солнце – это типичная звезда. Если речь о том, что Солнце ничем особенным не выделяется – то да, так и есть. Оно состоит из тех же ингредиентов, что и остальные звёзды. Это 70% водорода, 28% гелия, 1-2% других элементов. Энергию оно получает из ядерного синтеза, происходящего в ядре. В каком-то смысле, это «типичная» звезда, входящая в подавляющее большинство из примерно 1024 звёзд, содержащихся в границах наблюдаемой Вселенной.

Однако на самом деле Солнце ярче и массивнее, а продолжительность его жизни короче, чем у 95% звёзд Вселенной. Если выбрать любую случайную звезду, то с вероятностью 80% это будет красный карлик – он будет меньше, холоднее, тусклее и меньше по массе, чем наше Солнце. Большинство звёзд не такие, как наше Солнце.
Читать дальше →
Всего голосов 14: ↑13 и ↓1+18
Комментарии3

Используя Луну в качестве зеркала, ученые подтвердили, что Земля обитаема

Время на прочтение1 мин
Количество просмотров13K
Астрономы придумали новый способ поиска экзопланет и потенциально обитаемых миров — с помощью их спутников. Проверили они это на примере Луны и Земли.

image
Читать дальше →
Всего голосов 44: ↑18 и ↓26-4
Комментарии28

Личный опыт невыгорания на удалённой работе

Время на прочтение4 мин
Количество просмотров37K
Уже не помню когда, и при каких обстоятельствах услышал, что работу нужно менять каждые пять лет. Этого времени достаточно, чтобы достичь профессионализма и… чтобы работа стала рутиной, наскучила. Это первый, хотя и не обязательный шаг к выгоранию. В любом случае, скука ещё никому не добавляла здоровья и могла подтолкнуть к действиям с нехорошими последствиями. Лекарства от рабочей рутины ровно два: либо работа и хобби должны совпадать, либо в жизни должно быть что-то ещё, что придавало бы ей вкус и тягу продолжать жить и работать. В конце концов, мы живём на контрасте. Устаём от одного и получаем отдых в другом.
Читать дальше →
Всего голосов 45: ↑31 и ↓14+17
Комментарии83

Целостность данных в микросервисной архитектуре — как её обеспечить без распределенных транзакций и жёсткой связности

Время на прочтение9 мин
Количество просмотров63K

Всем привет. Как вы, возможно, знаете, раньше я все больше писал и рассказывал про хранилища, Vertica, хранилища больших данных и прочие аналитические вещи. Сейчас в область моей ответственности упали и все остальные базы, не только аналитические, но и OLTP (PostgreSQL), и NOSQL (MongoDB, Redis, Tarantool).


Эта ситуация позволила мне взглянуть на организацию, имеющую несколько баз данных, как на организацию, имеющую одну распределенную гетерогенную (разнородную) базу. Единую распределенную гетерогенную базу, состоящую из кучи PostgreSQL, Redis-ов и Монг… И, возможно, из одной-двух баз Vertica.


Работа этой единой распределенной базы порождает кучу интересных задач. Прежде всего, с точки зрения бизнеса важно, чтобы с данными, движущимися по такой базе, все было нормально. Я специально не использую здесь термин целостность, consistency, т.к. термин это сложный, и в разных нюансах рассмотрения СУБД (ACID и CAP теорема) он имеет разный смысл.


Ситуация с распределенной базой обостряется, если компания пытается перейти на микросервисную архитектуру. Под катом я рассказываю, как обеспечить целостность данных в микросервисной архитектуре без распределенных транзакций и жесткой связности. (А в самом конце объясняю, почему выбрал для статьи такую иллюстрацию).


Всего голосов 77: ↑76 и ↓1+75
Комментарии73

Информация

В рейтинге
Не участвует
Откуда
Тамбов, Тамбовская обл., Россия
Дата рождения
Зарегистрирован
Активность