Pull to refresh
18
0
Елена @ElenaHell

User

Send message

NULL-значения в PostgreSQL: правила и исключения

Reading time 8 min
Views 41K

Навскидку многим кажется, что они знакомы с поведением NULL-значений в PostgreSQL, однако иногда неопределённые значения преподносят сюрпризы. Предлагаем вашему вниманию расшифровку доклада Алексея Борщева с PGConf.Russia 2022 — он был полностью посвящён особенностям NULL-значений в Postgres.

NULL простыми словами

Что такое SQL база данных? Согласно одному из определений, это просто набор взаимосвязанных таблиц. А что такое NULL? Обратимся к простому бытовому примеру: все мы задаём друг другу дежурный вопрос: «Как дела?». Часто мы получаем в ответ: «Да ничего...» Вот это «ничего» нам и нужно положить в базу данных — NULL, неопределённое, некорректное или неизвестное значение.

Читать далее
Total votes 35: ↑34 and ↓1 +33
Comments 22

DDIA book (книга с кабанчиком) — сделай level up в понимании баз данных

Reading time 4 min
Views 33K
Несколько месяцев назад на одной из ретроспектив мы решили попробовать совместное чтение.

Наш формат:

  1. Выбираем книгу.
  2. Определяем часть, которую необходимо прочитать за неделю. Выбираем небольшой объем.
  3. В пятницу обсуждаем прочитанное.
  4. Читаем в нерабочее время, обсуждаем в рабочее.
  5. После окончания книги совместно выбираем следующую.

Что дает:

  1. Мотивация на чтение и дочитывание.
  2. Развитие скиллов (в том числе на будущее).
  3. Выравнивание майндсета и терминологии в команде.
  4. Рост доверия.
  5. Лишний повод пообщаться.

Одна из недавних книг, которую мы читали — Designing Data-Intensive Applications. Да-да, та самая книга с кабанчиком. И эта книга настолько всем понравилась, что я решил сделать здесь обзор, чтобы большее количество людей ее прочитали.


Карта в исходном качестве
Читать дальше →
Total votes 22: ↑22 and ↓0 +22
Comments 11

Особенности Jupyter Notebook, о которых вы (может быть) не слышали

Reading time 10 min
Views 356K
Jupyter Notebook – это крайне удобный инструмент для создания красивых аналитических отчетов, так как он позволяет хранить вместе код, изображения, комментарии, формулы и графики:



Ниже мы расскажем о некоторых фишках, которые делают Jupyter очень крутым. О них можно прочитать и в других местах, но если специально не задаваться этим вопросом, то никогда и не прочитаешь.
Читать дальше →
Total votes 49: ↑45 and ↓4 +41
Comments 14

Основы анализа данных на python с использованием pandas+sklearn

Reading time 9 min
Views 172K
Добрый день уважаемые читатели. В сегодняшней посте я продолжу свой цикл статей посвященный анализу данных на python c помощью модуля Pandas и расскажу один из вариантов использования данного модуля в связке с модулем для машинного обучения scikit-learn. Работа данной связки будет показана на примере задачи про спасенных с "Титаника". Данное задание имеет большую популярность среди людей, только начинающих заниматься анализом данных и машинным обучением.
Читать дальше →
Total votes 26: ↑25 and ↓1 +24
Comments 7

Как начать работать с GitHub: быстрый старт

Reading time 6 min
Views 1.2M


Распределенные системы контроля версий (DVCS) постепенно замещают собой централизованные. Если вы еще не используете одну из них — самое время попробовать.

В статье я постараюсь показать, как можно быстро начать экспериментировать с git, используя сайт github.com.

В статье не будут рассмотрены различия между разными DVCS. Также не будет детально рассматриваться работа с git, по этой теме есть множество хороших источников, которые я приведу в конце статьи.
Читать дальше →
Total votes 182: ↑165 and ↓17 +148
Comments 51

Базы знаний. Часть 2. Freebase: делаем запросы к Google Knowledge Graph

Reading time 24 min
Views 40K
image
Больше года назад Google объявил, что отныне в их поиске используется таинственная Сеть Знаний (официальный перевод Knowledge Graph). Возможно, не все знают, что значительная часть данных Сети доступна для использования всеми желающими и доступна по прекрасно описанному API. Этой частью является база знаний Freebase, поддерживаемая Google и энтузиастами. В этой статье мы сначала немного подурачимся, а потом попробуем сделать несколько простеньких запросов на языке MQL.
Эта статья — вторая из цикла Базы знаний. Следите за обновлениями.

  • Часть 1 — Введение
  • Часть 2 — Freebase: делаем запросы к Google Knowledge Graph
  • Часть 3 — Dbpedia — ядро мира Linked Data
  • Часть 4 — Wikidata — семантическая википедия

Читать дальше →
Total votes 63: ↑62 and ↓1 +61
Comments 10

Продолжаем разбирать Caesar III© (Игровая механика)

Reading time 15 min
Views 95K
Алгоритмы получения текстур игры Caesar III© и отрисовки города разобраны, осталась самая «сладкая» часть, которая притягивает «древнеримских архитекторов» уже больше 15 лет — игровая логика. Используя различные подходы к анализу игры, выношу на ваш суд результат этого небольшого исследования. Я заранее прошу прощения за большую статью, но, как говорится, слов из песни не выкинешь. В заключении будет несколько слов о судьбе исходников, восстановленных из исполняемого файла оригинальной игры.


Все гениальное просто
Total votes 114: ↑113 and ↓1 +112
Comments 26

Подальше от обыденной реальности: фантастические романы, которые стоит прочитать

Reading time 4 min
Views 141K
image

Фантастика как жанр заставляет читателей и писателей выйти за пределы разумного, дать волю своему воображению и отправиться в неизведанные миры. За это мы и любим этот жанр. RoboHunter этой осенью предлагает с головой погрузиться в мир научной фантастики.
Читать дальше →
Total votes 63: ↑59 and ↓4 +55
Comments 273

Мировые шедевры классической музыки без копирайта

Reading time 1 min
Views 38K
Несмотря на то, что такие признанные классики, как Бетховен, Чайковский, Брамс, Сибелиус жили уже очень и очень давно и их произведения давно не попадают под законы о копирайте, найти их великолепную музыку, распространяемую свободно, практически невозможно. То есть если вы захотите использовать 9 симфонию Бетховена в качестве саундтрека, воспроизвести отрывки из симфоний Чайковского на каком-нибудь мероприятии, вам таки придётся заплатить деньги правообладателям записей, которые вы будете использовать.

И проблема тут в том, что для того, чтобы выложить классическую музыку в свободное достояние, необходимо, чтобы её кто-нибудь записал и отказался от своих исключительных прав на запись. А поскольку для записи нужен оркестр, то это создаёт некоторые финансовые сложности: целый оркестр и толпа звукорежиссёров вряд ли будут работать за идею.

К счастью, нашлись энтузиасты из проекта Musopen, которые смогли организовать сбор средств с целью нанять целый оркестр, записать бессмертную классику и выложить её в наилучшем качестве под лицензией CC0, то есть фактически в неограниченное пользование.

Уже собрано более 41 000 долларов, хотя изначально организаторы рассчитывали только на 11 тысяч.

Пожертвовать немного денег, а так же ознакомиться с акцией можно на официальной странице. Сбор средств закончится 15 сентября в 6 часов утра по московскому времени, то есть осталось чуть более дня и желающим помочь нужно поспешить.
Total votes 179: ↑175 and ↓4 +171
Comments 130

Внутренняя жизнь клетки и другие проекты студии XVIVO

Reading time 2 min
Views 1.9K
image

После просмотра заметки Наглядно о ДНК удивился тому, что на Хабре этого ещё не было. Решил восполнить пробел. К тому же в коментариях упомянули один из самых популярных роликов, с него и начну.
В 2006 по заказу Гарвардского университета студией XVIVO была создана серия анимационных видео посвященных биологии клетки. Первый ролик «Внутренняя жизнь клетки» («The inner life of cell») демонстрирует механизм, благодаря которому белые кровяные тельца способны чувствовать окружающую среду и реагировать на внешние сигналы.
Видео впоследствии опубликовали на сайте Гарвардского университета BioVisions

UPD: версия с коментариями (на английскийском).

Подробнее об этой и других анимационных работах XVIVO
Total votes 80: ↑73 and ↓7 +66
Comments 39

Величественные пески: Пустынные дюны, вид из космоса

Reading time 6 min
Views 1.9K
imageСегодня же пятница? Тогда почему бы не отвлечься на научно-популярную фото-статью о том, что занимает четвертую часть суши нашей планеты?

Пустыни слывут безлюдными и безжизненными, но вместе с тем они невероятно красивы, особенно при взгляде на них сверху. Различные типы песка, топография, ветер и климат все вместе создают колоссальное количество ландшафтов. Блуждающие дюны образуют бесконечное число постоянно меняющихся фигур.

Фотографии в этой коллекции были сделаны астронавтами и спутниками и запечатлели самые красивые, самые запоминающиеся, огромные пустынные области нашей планеты.

Оригинал статьи на wired.com
Перевод статьи на translated.by
Над переводом работали



А оформленная статья, как обычно, под катом
Total votes 84: ↑76 and ↓8 +68
Comments 29

Заметки об NLP (часть 3)

Reading time 5 min
Views 9.7K
(Начало: 1, 2) Что ж, подходим к самому интересному — разбору предложений. Тема эта многогранна и многоуровнева, так что подступиться к ней не очень просто. Но ведь трудности лишь закаляют :) Да и выходные, текст пишется легко…

Начнём с такого понятия, как синтаксический анализ предложений (по-английски parsing). Суть этого процесса состоит в построении графа, «каким-либо образом» отражающего структуру предложения.
Читать дальше →
Total votes 54: ↑47 and ↓7 +40
Comments 53

Заметки об NLP (часть 2)

Reading time 4 min
Views 5.9K
Хотя в первой части я и говорил, что не собираюсь останавливаться на морфологии, видимо, совсем без неё не получится. Всё-таки обработка предложений сильно завязана на предшествующий морфологический анализ.
Читать дальше →
Total votes 58: ↑47 and ↓11 +36
Comments 43

Заметки об NLP (часть 1)

Reading time 5 min
Views 15K
В преддверии Нового года решил начать небольшой цикл статей, посвящённых наиболее интересующему меня лично направлению в обработке текстов на естественном языке. (То есть NLP в заголовке означает natural language processing — ваш К.О.) Синтаксический анализ, семантика, машинный перевод, поиск смысла слова в контексте — в общем, вся радость компьютерного лингвиста :)

Наверно, сразу имеет смысл определиться с уровнем изложения. Я сам пытаюсь заниматься компьютерной лингвистикой (с переменными успехами). Постараюсь рассказать о том, что конкретно волнует, чего уже можно, чего пока нельзя, и над чем как раз сейчас надо работать. Быть может, эти статьи помогут мне самому отструктурировать информацию в голове и опираться на уже готовую структуру в новом году. А если у читателей появятся свои идеи или мысли о сотрудничестве — ещё лучше.
Интересующихся прошу под кат
Total votes 67: ↑57 and ↓10 +47
Comments 54

Много книг, хороших и разных

Reading time 20 min
Views 96K
Мой список книг, которые мне хочется прочесть, изрядно вырос, спасибо топику “запасаемся на зиму”. Под катом вы обнаружите список книг, составленный по комментариям в том топике.
Читать дальше →
Total votes 139: ↑124 and ↓15 +109
Comments 89

NetHack. Об игре

Reading time 4 min
Views 14K


Многие, уверен, знают эту замечательную игру и убили на нее не одну неделю своей жизни. По моему скромному мнению — это одна из лучших игр из ныне существующих.
Появилась она очень давно — в 1987 году, через семь лет после выхода Roque — прародителя нетхака и основателем жанра "rogue-подобных игр".
Nethack — самый яркий ее представитель.



И что же такого интересного и захватывающего в этой игре? — спросите вы. И я вам отвечу — возможности игры, графика, геймплей, сюжет.
Да-да. Вы не ослышались. Именно это и ценно в этой игре.



Коротко обо всем по-порядочку.
Total votes 118: ↑107 and ↓11 +96
Comments 114

Официальные фотобанки компаний

Reading time 3 min
Views 2.1K
Многие известные (и не очень) компании открывают свободный доступ у себя на сайте не только к пресс-релизам, но и к галереи фотографий своей продукции в высоком разрешении, печатным материалам, рекламным постерам и прочим графическим вкусняшкам. У меня накопилось несколько ссылок на такие хранилища, и я решил сделать эту подборку, наверняка кому-нибудь пригодится, заодно кто-то может еще поделится ссылками, так как у меня ссылки на галереи только некоторых эээм… IT-компаний.


Ссылка на фотобанк Samsung у меня появилась первой, поэтому с неё и начну. Её мне когда-то скинули сами представители компании, когда я для них разрабатывал небольшой буклет.

Фотобанк Samsung
Фотобанк Samsung содержит коллекцию высококачественных изображений продуктов компании Samsung Electronics, элементы корпоративного стиля, а также фотографии, сделанные в галерее (что-то вроде выставочного центра) Samsung.

Дальше больше...
Total votes 72: ↑71 and ↓1 +70
Comments 25

Сообществоводам и сообществоведам, мат часть

Reading time 2 min
Views 651
В поисках материала к диплому добыла замечательную диссертацию, которую рекомендую всем кто занимается сообществами или изучает их в учебных целях.
Автор: Бондаренко Сергей Васильевич.
СОЦИАЛЬНАЯ СТРУКТУРА ВИРТУАЛЬНЫХ СЕТЕВЫХ СООБЩЕСТВ
350 страниц научного материала о сообществах, 500 источников литературы.
Читается на удивление легко для научного текста, особенно рекомендую обратить внимание на главы 5 и 6.
UPD Кто знает еще фундаментальную и прикладную литературу, либо материалы кидайте в комментарии. Возможно подберем библиотеку.
Линк на скачивание или тут
Структура работы
Total votes 41: ↑36 and ↓5 +31
Comments 40

Падаем в чёрную дыру

Reading time 3 min
Views 13K
Приглашаем в путешествие к центру самого простого объекта во Вселенной — чёрной дыры Шварцшильда. Путешествие будет в один конец, и закончится очень неприятно для смелого исследователя, но вместо крови на сцене будет клюквенный сок это только компьютерная симуляция, так что откиньтесь на спинки ваших кресел…


Среднее качество: 640×480 mpeg4 (10MB)
Высокое качество: 640×480 quicktime (84MB)


Поехали!
Total votes 147: ↑132 and ↓15 +117
Comments 50

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Date of birth
Registered
Activity