Статьи / Закладки / Профиль saaivs / Хабр

Alexander @saaivs

Пользователь

Профиль Публикации 7Комментарии 947Закладки 307

Durham 1 июл 2021 в 00:14

30 миллиардов параметров: реально ли обучить русский GPT-3 в «домашних» условиях?

17 мин

32K

Алгоритмы*Машинное обучение*Искусственный интеллектБудущее здесьNatural Language Processing*

Технотекст 2021

Не так давно Сбер, а затем и Яндекс объявили о создании сверхбольших русских языковых моделей, похожих на GPT-3. Они не только генерируют правдоподобный текст (статьи, песни, блоги и т. п.), но и решают много разнообразных задач, причем эти задачи зачастую можно ставить на русском языке без программирования и дополнительного обучения — нечто очень близкое к «универсальному» искусственному интеллекту. Но, как пишут авторы Сбера у себя в блоге, «подобные эксперименты доступны только компаниям, обладающим значительными вычислительными ресурсами». Обучение моделей с миллиардами параметров обходится в несколько десятков, а то сотен миллионов рублей. Получается, что индивидуальные разработчики и маленькие компании теперь исключены из процесса и могут теперь только использовать обученные кем-то модели. В статье я попробую оспорить этот тезис, рассказав о результатах попытки обучить модель с 30 миллиардами параметров на двух картах RTX 2080Ti.

+40

SLY_G 23 июн 2021 в 22:43

Новое астрономическое открытие поставило под вопрос принцип Коперника 500-летней давности

9 мин

49K

Астрономия

Перевод

Гигантское кольцо гамма-всплесков и предполагаемая крупномасштабная структура, связанная с ним. Возможно, конечно, что это лишь псевдоструктура, и мы обманываем себя, считая, что это образование простирается на многие миллиарды световых лет

В течение почти всей истории человечества одно из представлений о нашем месте во Вселенной долго никто не оспаривал: наша планета, Земля, является недвижимым центром космоса. Этому соответствовали все наблюдения:

небеса – включая звёзды, туманности и Млечный Путь, вращаются над нашей головой;
только несколько источников света – такие, как Солнце, Луна и планеты — двигаются относительно этого вращающегося фона;
ни один из экспериментов не демонстрировал вращения Земли или параллакса звёзд.

Читать дальше →

+16

AlesyaSokol 18 мая 2021 в 19:54

Детерминизм vs. квантовая механика, или можно ли предсказывать будущее

10 мин

27K

Из песочницы

Это статья о том, совместима ли детерминистическая картина мира с квантовой механикой, откуда в ней появляется фундаментальный рандом, как это должно влиять на наше мировосприятие, а также можно ли (гипотетически) достаточно точно моделировать будущее, хотя бы в терминах вероятностей (спойлер: вероятно, нет).

+18

AlesyaSokol 31 мая 2021 в 18:19

Квантовый процессор Google осознает себя? Почему квантмех и свобода воли (не) связаны, и почему это неочевидно

11 мин

16K

Квантовые технологииБудущее здесьМозгФизикаНаучно-популярное

Недавно вышел препринт с забавным названием “Есть ли у роботов с квантовым процессором свобода ослушаться?”. Идея статьи в том, что квантовый процессор — возможно, достаточно сложная система, чтобы внутри нее возникло сознание, обладающее свободой воли (да, звучит как научная фантастика).

Обычно про связь квантовой физики и сознания пишут всякие псевдоученые, и основным посылом там является что-то типа “мышление формирует реальность”, что следует просто из неправильной интерпретации проблемы измерения. В общем, я бы проигнорировала эту статью, если бы одним из авторов не был основатель квантовой лабы Google, и если бы статья не была про, собственно, квантовый процессор Google. Поэтому я решила разобраться подробнее, что же там имеется в виду.

К тому же, несмотря на то, что мне кажется, что квантовая механика не имеет отношения к свободе воли, я думаю, что следует искать аргументы против своей позиции. Это важно, чтобы иметь возможность поменять свое мнение в случае, если я неправа. Поэтому я решила разобраться подробнее, что же имеется в виду в этой статье.

+24

223

evil_me 11 мар 2021 в 13:27

Забудьте про div, семантика спасёт интернет

6 мин

118K

Блог компании HTML AcademyВеб-разработка*HTML*Веб-дизайн*Программирование*

Давным-давно (лет пятнадцать назад) почти все делали сайты и не переживали о том, что под капотом. Верстали таблицами, использовали всё, что попадётся под руку (а попадались в основном <div> и <span>) и не особо заморачивались о доступности. А потом случился HTML5 и понеслось.

Семантическая вёрстка — подход к разметке, который опирается не на внешний вид сайта, а на то, какой смысл у каждого блока на конкретной странице. Например, в этой статье есть заголовки разных уровней — это помогает читателю выстроить в голове структуру документа. Так и на странице сайта — только читатели будут немного другими.

Дисклеймер: статья может обидеть тех, кто прикипел к вёрстке дивами. Но <div> — не приговор, и мы не призываем от него целиком отказываться. Ну и всегда можно договориться.

+44

varanio 1 фев 2021 в 22:02

Упрощенный синтаксис для jsonb в PostgreSQL 14

1 мин

9.9K

PostgreSQL*SQL*Программирование*Веб-разработка*

Как сообщает telegram-канал Cross Join, в репозиторий Postgres упал комит, упрощающий работу с jsonb. Теперь можно обращаться к частям jsonb с помощью квадратных скобок, причем это работает как на чтение, так и на запись.

Прощай jsonb_set и прочие костыли типа data = data - 'a' || '{"a":5}'

Несколько примеров:

Обновляем значение объекта по ключу. 25 здесь является числом, но взято в кавычки, потому что присваиваемое значение должно быть jsonb

-- (person_data имеет тип jsonb)
UPDATE users 
SET person_data['age'] = '25';

Читать дальше →

+53

Anna_Kopyrneva 25 янв 2021 в 11:02

Всё как в жизни: законы проектирования космических кораблей

4 мин

8.2K

ДизайнРазработка робототехники*IT-стандарты*Проектирование и рефакторинг*Анализ и проектирование систем*

Перевод

Это перевод оригинальной статьи Дэвида Аткина. Дэвид — инженер, профессор, директор лаборатории космических систем центра робототехники Мэрилэнда. Я работаю продактом-менеджером в ИТ и нашла здесь много релевантных идей. Некоторые законы и вовсе выглядят очень универсальными.

+24

MagisterLudi 14 дек 2020 в 22:18

Бесполезный паттерн в полярных координатах, открывающий полезное свойство простых чисел

2 мин

21K

Началось всё с обсуждение на математическом StackOverflow: Meaning of Rays in Polar Plot of Prime Numbers

«Недавно я начал экспериментировать с gnuplot и быстро сделал интересное открытие. Я построил все простые числа ниже 1 миллиона в полярных координатах, так что для каждого простого p (r, θ) = (p, p). Ничего особенного не ожидал, просто пробовал. Результаты впечатляют».

Если посмотреть на простые числа ниже 30000, можно увидеть спиральный узор.

+78

m1rko 13 дек 2020 в 16:25

Как Uber переписал приложение iOS на Swift

9 мин

15K

Управление проектами*Разработка мобильных приложений*Проектирование и рефакторинг*Компиляторы*Swift*

Перевод

Итак, друзья, садитесь в кружок и послушайте историю самой большой инженерной катастрофы, в которой я участвовал. Это история о политике, архитектуре и логической ошибке невозвратных затрат (вы уж извините, просто сейчас пью Aberlour Cask Strength Single Malt Scotch).

Шёл 2016 год. Трампа ещё не избрали президентом, поэтому движение #DeleteUber пока не началось. Трэвис Каланик оставался гендиром, мы переживали фазу гиперактивного роста с открытием филиалов в других странах, общественные настроения в целом позитивные, все довольны, Uber на высоте.

+34

oldadmin 10 дек 2020 в 12:29

Личный IM-мессенджер со сквозным шифрованием только для своих

10 мин

47K

Блог компании RUVDS.comСистемное администрирование*Настройка Linux*Мессенджеры*Информационная безопасность*

В этой статье я рассказал, как сделать собственный безопасный мессенджер только для своей тусовки параноиков.

Сейчас есть много IM-мессенджеров с end-to-end шифрованием, но вариантов, которые можно быстро развернуть на своем сервере гораздо меньше.

Изучая варианты, мой взгляд упал на Delta Chat, о котором на Хабре уже упоминали — мессенджер без централизованной серверной инфраструктуры, использующий почтовые сервера для доставки сообщений, что позволяет развернуть его, например, на своем домашнем сервере и общаться с устройств, в том числе не имеющих доступ в интернет.

Среди преимуществ этого подхода можно отметить:

Вы сами управляете своей информацией, в том числе ключами шифрования.
Вы не отдаете свою адресную книгу никому.
Нет необходимости использовать телефонный номер для регистрации.
Наличие клиентов под все популярные системы: Windows, Linux, Android, MacOS, iPhone.
Дополнительное шифрование STARTTLS/SSL при передаче сообщений, обеспечиваемое почтовым сервером.
Возможность настроить удаление старых сообщений с устройства (исчезающие сообщения).
Возможность настроить удаление сообщений с сервера, при получении.
Быстрая доставка, благодаря IMAP push.
Групповые защищенные чаты.
Поддержка передачи файлов, фото и видео.
Сервер и клиент относятся к открытому ПО и совершенно бесплатны.

Возможные недостатки:

Нет возможности создавать нативные аудио и видео конференции.
Необходимость экспортировать/импортировать ключи шифрования, для настройки одного аккаунта на нескольких устройствах.

Интересный факт: Роскомнадзор уже требовал от разработчиков Delta Chat предоставить доступ к пользовательским данным, ключам шифрования и зарегистрироваться в государственном реестре провайдеров, на что Delta Chat ответили отказом, т.к. не имеют собственных серверов и не имеют доступа к ключам шифрования.

Читать дальше →

+45

HellMaus 15 ноя 2016 в 00:56

Автоматика из ДНК и белков: что у нее общего с электроникой?

7 мин

19K

Научно-популярноеБиотехнологии

(ответ биолога на статью «Вы неправильно пишете животных»)

В каждой клетке есть тысячи генов. Никогда не бывает так, чтобы они все работали одновременно. Клетки мышц, печени и мозга несут одинаковый набор генов. Они такие разные, потому что в них работают разные гены. Все клетки умеют включать и выключать отдельные гены в ответ на разные внешние воздействия. То есть система, которая управляет активностью генов — это такая система автоматического управления. Ученые хотят понимать, как такая автоматика работает, чтобы уметь ее чинить и взламывать. Например, в клетках человека есть система из примерно трехсот генов и белков, которая управляет делением клетки. Когда она ломается и клетка начинает все время делиться, возникает рак.

Читать дальше →

+39

OlegSivchenko 7 дек 2020 в 19:23

Природа – не репозиторий, а мастерская. Еще раз о сходстве и отличии ДНК и программного кода

5 мин

7.2K

Научно-популярноеЧитальный зал

Технологические достижения начала XXI века, в частности, расшифровка генома человека и общее понимание принципов редактирования генома, вполне естественно побуждают сравнивать синтетическую биологию с программированием. Действительно, онтогенез и биохимия во многом сравнимы с программируемыми процессами, так как подчиняются внутренней логике, выполняются пошагово, зависят от контекста, реагируют на внешнее вмешательство (редактируются). Соблазнительно сравнить четырехбуквенный код ДНК с двоичным машинным кодом.

Тем не менее, в этой статье мы предположим, что такие аналогии являются более смелыми, чем точными, и попробуем рассмотреть, почему ДНК может считаться субстратом для полноценного генетического программирования, но сама по себе достаточно далека от языка программирования и языка как такового.

Читать дальше →

+12

KD637 8 дек 2020 в 15:52

Ноам Хомский о будущем глубокого обучения

7 мин

11K

Блог компании SkillfactoryИнтервьюМашинное обучение*Читальный зал

Перевод

В течение последних нескольких недель я вёл переписку по электронной почте с моим любимым анархо-синдикалистом Ноамом Хомским. Сначала я обратился к нему, чтобы спросить, не заставили ли его недавние разработки в области ANNs (искусственных нейронных сетей) пересмотреть свою знаменитую лингвистическую теорию универсальной грамматики. Наш разговор коснулся возможных ограничений глубокого обучения, того, насколько хорошо на самом деле ANN моделирует биологический мозг, а также побеседовали на философские темы. Здесь я не буду напрямую цитировать профессора Хомского, поскольку наша дискуссия была неофициальной, но попытаюсь резюмировать ключевые выводы.

И, между прочим, вчера, 7 декабря, Ноаму Хомскому исполнилось аж 92 года!

Приятного чтения!

+24

m1rko 19 окт 2020 в 13:19

Нет, Microsoft не переносит Windows на Linux

5 мин

47K

Open source*Разработка под Linux*Разработка под Windows*

Перевод

Выбор будет не между Windows и Linux, а что сначала загружается: Hyper-V или KVM, а уже стеки Windows и Ubuntu будут хорошо совместимы друг с другом.

В последнее время развернулась некоторая дискуссия о том, что Microsoft может в будущем перенести свою операционную систему Windows на ядро Linux.

Я как никто другой знаю о проектах Linux в Microsoft, поскольку работаю в подразделении настольных компьютерных систем в Canonical и помогаю выпустить Ubuntu на WSL (Windows Subsystem for Linux). По работе приходится регулярно общаться со многими сотрудниками Microsoft, которые занимаются Linux и различными проектами с открытым исходным кодом. Мне приходят сводки по продуктам Microsoft и стратегии. Обращаю внимание, что в этой статье только мои личные мысли, я не разглашаю никакой секретной информации.

+39

397

Nikitius_Ivanov 18 окт 2020 в 03:11

Квантовая теория. Вселенная из волн вероятностей

24 мин

81K

Научно-популярное

Квантовая теория является одной из самых точных моделей, описывающих окружающий нас мир, а технические решения, разработанные благодаря применению аппарата квантовой механики, прочно вошли в повседневную жизнь современного общества. И тем удивительнее, что понимание даже базовых концепций этой сферы знаний вступает в серьезные противоречия с интуицией, не только людей далеких от науки, но и самих исследователей, подтверждением чему является большое количество различных интерпретаций. В этой статье, предлагаю рассмотреть основные понятия квантовой теории с показавшейся автору наиболее интуитивно-понятной точки зрения, несколько модифицированной теории вероятностей.

Что будет, если по аналогии с двущелевым опытом, все пространство на пути частицы до экрана будет заполнено щелями?

Читать дальше →

+68

153

slavent77 13 окт 2020 в 11:16

WorkBox: ваш toolkit в мире сервис-воркеров

6 мин

15K

Блог компании ДомкликБраузерыJavaScript*

Всем привет!

Меня зовут Святослав. Я лидирую разработку сервисов оформления ипотеки в компании Домклик. Не так давно наша компания взяла курс на внедрение философии Progressive Web Application в наших клиентских сервисах.

Одним из важных аспектов PWA является использование технологии Service Worker API. Однако технология не так проста, как кажется на первый взгляд. Для эффективного использования нужно пройти тернистый путь из квестов, связанных с особенностями жизненного цикла воркеров, неполной поддержкой браузерами, проблемами с политикой кэширования и попутно встречающимися сайд-эффектами (кэширование устаревшего контента, сломанные ссылки и другое).

Workbox - это набор инструментов, предоставляющих высокоуровневый API для конфигурации и работы с такими браузерными технологиями как Service Worker API и Cache Storage API. Инструментарий состоит из набора изолированных модулей, которые помогут сделать ваше приложение "offline-ready".

+29

erogov 12 окт 2020 в 18:59

«Жизнь» на PostgreSQL

4 мин

20K

Блог компании Postgres ProfessionalНенормальное программирование*SQL*PostgreSQL*

Недавно на Хабре была опубликована статья Морской бой в PostgreSQL. Должен признаться: я обожаю решать на SQL задачи, для SQL не предназначенные. Особенно одним SQL-оператором. И полностью согласен с авторами:

Использование специальных инструментов не по назначению часто вызывает негатив со стороны профессионалов. Однако решение бессмысленных, но интересных задач тренирует нестандартное мышление и позволяет изучить инструмент с разных точек зрения в поиске подходящего решения.

И еще. Будем честны: всегда использовать SQL по назначению — тоска зеленая. Вспомните, какие примеры приводятся во всех учебниках, начиная с той самой статьи Кодда? Поставщики да детали, сотрудники да отделы… А где же удовольствие, где же фан? Для меня один из источников вдохновения — сравнение процедурных решений с декларативными.

Я, позвольте, не буду объяснять, что такое Жизнь Джона Конвея. Скажу только, что — оказывается — используя клеточный автомат Жизни, можно построить универсальную машину Тьюринга. Мне кажется, это грандиозный факт.

Так вот, можно ли реализовать игру Жизнь одним оператором SQL?

Конечно можно

+77

SLY_G 12 окт 2020 в 14:27

Новый алгоритм проверки пересечений в графах прятался на виду

4 мин

20K

Математика*Научно-популярное

Перевод

Два специалиста по информатике нашли в весьма неожиданном месте идею, которая как раз пригодилась им для прорыва в теории графов

В октябре 2019 Якоб Хольм и Ева Ротенберг пролистывали работу, опубликованную ими за несколько месяцев до этого – и вдруг поняли, что наткнулись на нечто серьёзное.

Десятилетиями специалисты по информатике пытались разработать быстрый алгоритм для определения того, можно ли добавить к определённому графу рёбра так, чтобы он остался «планарным» – то есть, чтобы его рёбра не пересекались. Однако ни у кого не получалось улучшить алгоритм, опубликованный более 20 лет назад.

Хольм и Ротенберг с удивлением обнаружили, что в их работе есть идея, позволявшая достаточно сильно улучшить этот алгоритм. Она «разобралась с одним из главных препятствий на пути к реальному алгоритму», — сказал Хольм, специалист по информатике из Копенгагенского университета. «Возможно, мы полностью раскрыли этот вопрос».

Читать дальше →

+50

SLY_G 2 окт 2020 в 14:15

Как математический «фокус» спас физику частиц

7 мин

11K

Математика*Научно-популярноеФизика

Перевод

Перенормировка, возможно, оказалась самым важным прорывом в теоретической физике за последние 50 лет

Не нужно анализировать поведение отдельных молекул воды, чтобы понять поведение капель, или анализировать капли, чтобы понять волны. Возможность переключать фокус между разными масштабами – это и есть суть перенормировки

В 1940-х годах физики-первопроходцы наткнулись на новый слой реальности. Место частиц заняли поля – всеобъемлющие и волнующиеся сущности, заполнявшие всё пространство на манер океана. Одна небольшая рябь в таком поле могла обозначать электрон, другая – фотон, а их взаимодействия, судя по всему, могли объяснить все электромагнитные явления.

Была только одна проблема – вся эта теория держалась на надеждах и молитвах. Только при помощи такой техники, как "перенормировка", позволявшей тщательно скрывать бесконечные величины, исследователи могли обойти бессмысленные предсказания этой теории. Схема работала, но даже те, кто разрабатывал эту теорию, подозревали, что она может оказаться карточным домиком, держащимся за счёт извращённого математического трюка.

Читать дальше →

+18

HoroSamiK 10 окт 2020 в 08:05

Создание favicon для сайта 2020

10 мин

142K

Веб-разработка*HTML*

Из песочницы

Что такое favicon и для чего он нужен?

Favicon – это значок (иконка), который отображается во вкладке браузера, закладках, а также в сниппетах результатов поиска.

Favicon играет важную роль в веб-приложениях. Он может улучшить внешний вид сайта в выдаче, повышает узнаваемость вашего сайта, помогает пользователю быстро найти необходимую страницу в закладках и вкладках.

Кроме того, пользователь может добавить страницу вашего сайта на главный экран телефона или сохранить как веб-приложение. В таком случае с помощью favicon можно быстро найти сайт среди большого количества других приложений.

Какой формат использовать для favicon?

Раньше в качестве основного формата использовали ICO. Особенность данного формата – мульти-размерность. Данный файл может хранить в себе несколько размеров иконки. На смену ICO пришел формат PNG. ICO все еще поддерживаемый, но большинство современных браузеров выбирают PNG формат иконки, который легче. Некоторые браузеры не могут выбрать правильный значок в файле ICO, что приводит к неправильному использования значка с низким разрешением.

О каких платформах пойдет речь в этой статье?

Десктопные браузеры
Chrome на Android
Иконка закладки в iOS (PWA)
macOS
Windows

Читать дальше →

+46

3 4 ...

14 15