Как стать автором
Обновить
14
0
Димитрий Зуйков @dimitrii_z

Руководитель отдела технических писателей

Отправить сообщение

Взгляд в будущее: причудливая реальность интернета в Северной Корее

Время на прочтение10 мин
Количество просмотров50K


Для 25 миллионов жителей Северной Кореи доступ в интернет невозможен. Только несколько тысяч привилегированных членов общества могут получить доступ к глобальной сети. Но эта прослойка растет, и их запросы тоже увеличиваются. Мы знаем об этом очень мало, информация закрыта. Но есть организации и разные правозащитники, которые пытаются, что могут, анализировать.


И мы видим, что даже этот интернет, на удивление, продолжает развиваться. Особенно активно — в последние годы. Появляются первые интернет-сервисы, а некоторые люди даже умудряются играть в онлайн-игры. Давайте посмотрим, что происходит с северокорейским интернетом под санкциями, и что может ждать нас.


Осторожно, дальше идет много фото с сайтов Северной Кореи.

Читать дальше →
Всего голосов 89: ↑67 и ↓22+66
Комментарии467

Почему телевизоры за последние годы упали в цене на 97%. И почему вам стоит этого бояться

Время на прочтение8 мин
Количество просмотров55K

Вы, может быть, не заметили, но с телевизорами в последнее время творится что-то неладное.

Лет тридцать назад телевизор был почти предметом роскоши. И не только в странах бывшего СССР. Даже в Америке они, цветные и ламповые, продавались минимум за 800 долларов (то есть около 2500 долларов сегодня с поправкой на инфляцию). Семьи пользовались одним и тем же телевизором на протяжении нескольких поколений. Он хранился у многих дольше, чем автомобиль.

Но сейчас с телевизорами происходит какая-то интересная история. Как и многие другие устройства, за последние десятилетия они стали намного лучше и технологичнее. Но в то время как, скажем, новые автомобили стоят примерно столько же, как и 10 лет назад, а новые смартфоны даже растут в цене, телевизоры стали на порядки (!) дешевле. Что, казалось бы, противоречит элементарной логике.

Читать далее
Всего голосов 62: ↑50 и ↓12+59
Комментарии409

Poetry: from zero to hero

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров39K

Привет, Хабр! Меня зовут Тимур, я тружусь ML-инженером в одной сибирской IT-компании.

Данная статья представляет собой руководство по Poetry. Я постарался покрыть все основные сценарии использования и возможности данного инструмента: создание проекта, работа с зависимостями из различных источников, управление виртуальными окружениями, сборка и публикация.

В качестве бонусов - готовая GitLab CI джоба для сборки и публикации пакетов, а также шаблон Dockerfile для multi-stage сборки образов в проектах с использованием Poetry.

Добро пожаловать под кат!

Читать далее
Всего голосов 4: ↑4 и ↓0+4
Комментарии15

Что делает ChatGPT… и почему это работает?

Уровень сложностиСредний
Время на прочтение75 мин
Количество просмотров155K

То, что ChatGPT может автоматически генерировать что-то, что хотя бы на первый взгляд похоже на написанный человеком текст, удивительно и неожиданно. Но как он это делает? И почему это работает? Цель этой статьи - дать приблизительное описание того, что происходит внутри ChatGPT, а затем исследовать, почему он может так хорошо справляться с созданием более-менее осмысленного текста. С самого начала я должен сказать, что собираюсь сосредоточиться на общей картине происходящего, и хотя я упомяну некоторые инженерные детали, но не буду глубоко в них вникать. (Примеры в статье применимы как к другим современным "большим языковым моделям" (LLM), так и к ChatGPT).

Читать далее
Всего голосов 248: ↑248 и ↓0+248
Комментарии121

PromptGPT: оптимизируем промт для GPT-4

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров13K

Допустим, нам нужно решить задачу NLP, в которой мы принимаем и возвращаем текст (seq2seq). Существует великое множество таких задач, например: генерация текста/кода, перевод/стилизация, суммаризация, коррекция текста, распознавание именованных сущностей, даже классификацию текста можно свести к seq2seq.

Если нам нужно очень быстро написать высококачественное решение и у нас есть возможность платить за API, тогда нам подойдет использование GPT-4 API.

При решении seq2seq-задачи с использованием GPT-4 API нам нужно будет составить промт, который состоит из системного сообщения и набора примеров для модели (few-shot learning). Туториал по GPT-4 API можно найти в моей предыдущей статье.

Далее возникает задача измерения качества модели и оптимизации промта:

1. Непонятно, как изменение системного сообщения влияет на результат

2. Неясно, как подбирать примеры

3. Чем длиннее промт, тем дороже использование модели. Хочется найти минимальную длину промта, при которой качество нас устраивает

Вдобавок, можно использовать либо GPT-3.5, либо GPT-4 (если у вас есть к ней доступ). GPT-4 гораздо дороже. Хочется понять, даст ли GPT-4 достаточный буст к качеству, который оправдает ее цену.

Я написал небольшой тул, который измеряет качество модели на различных промтах и позволяет выбрать оптимальный: https://github.com/einhornus/prompt_gpt. В этой статье я сначала расскажу, как он работает, а потом покажу процесс оптимизации промта на конкретном примере - на задаче коррекции грамматики из своей предыдущей статьи.

Читать далее
Всего голосов 3: ↑3 и ↓0+3
Комментарии6

Сравнение нейросетей для перевода

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров52K

С помощью GPT-4 можно решать самые разнообразные задачи по преобразованию текста, включая перевод на разные языки.

Мне стало интересно, кто переводит лучше: GPT-4 или специализированные нейронки для перевода, такие как Google Translate и DeepL?

Сегодня мы сравним качество перевода от различных нейросетей на 24 языковых парах.

Читать далее
Всего голосов 55: ↑54 и ↓1+69
Комментарии59

Человек человеку — человек: на работе без общения не получится

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров7.3K

На своей первой «большой» работе я совершила глупую ошибку: увидев токсичного руководителя и хор активных подпевал, я не уволилась. В свои 22 года «вузовско-тепличная» я решила, что главное — хорошо работать, и тогда никто тебя не тронет. Ну то есть ты сидишь в роли компьютера, чётко выполняешь задачи, не косячишь и считай, дело в шляпе, а заботиться о выстраивании отношений не нужно. Ну это же работа! Между тем, оказалось, что работа — это отдельный социум со своими законами и правилами, все сотрудники — люди и характер на крючок рядом с курткой не вешают, а при желании можно найти провалы и пробелы в абсолютно любой задаче. На усвоение довольно строгих и важных уроков у меня ушло 4 года, которые закончились увольнением…из-за чисто человеческого конфликта на уровне «кто кого выживет». После такой практики вот уже 11 лет практически ни одного рецидива, не считая мелких и чисто личностных стычек. Главные выводы тех лет: 1) общаться придётся; 2) над отношениями нужно работать; 3) работать на фоне конфликта нереально тяжело и непродуктивно; 4) конфликты сажают здоровье. 

Позже выяснилось, что таких исследователей отношений в коллективе немало — так почему бы с высоты социально опыта не собрать пачку лучших статей. Учитесь на чужих ошибках :-)

Читать далее
Всего голосов 17: ↑14 и ↓3+20
Комментарии10

Самый детальный разбор закона об электронных повестках через Госуслуги. Как сняться с военного учета удаленно

Уровень сложностиПростой
Время на прочтение19 мин
Количество просмотров243K

Новый закон об электронных повестках потенциально касается практически всех российских мужчин от 18 до 70 лет. Я узнал у адвоката со специализацией в вопросах мобилизации, чем конкретно нам грозят эти нововведения, и можно ли как-то «выписаться из военкомата» удаленно.

Читать далее
Всего голосов 267: ↑228 и ↓39+260
Комментарии612

Как настроить Alpaca (аналог ChatGPT) на своём арендованном сервере. Гайд для самых маленьких

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров41K

После публикации https://habr.com/ru/news/t/723638/ меня попросило несколько человек написать гайд для новичков, как же это всё запустить поиграться где-нибудь на арендованном сервере, если локальная машина не позволяет? На всё про всё нам потребуется минут 20 и сто рублей денег.

Но уже появились бесплатные варианты на HuggingFace

Читать далее
Всего голосов 28: ↑28 и ↓0+28
Комментарии45

Что нового в Chrome 111?

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров7K

Давайте погрузимся внутрь и посмотрим, что нового ждет разработчиков в Chrome 111.

Читать далее
Всего голосов 10: ↑10 и ↓0+10
Комментарии0

Остап Бендер из мира нейросетей: как ChatGPT играет в шахматы

Время на прочтение10 мин
Количество просмотров22K

В перерывах между изучением .NET решил я узнать, насколько хорошо ChatGPT умеет играть в шахматы, и есть ли у меня хоть какие-то шансы на выигрыш, пусть даже я буду использовать современные компьютерные движки.

Заодно во время партий можно интересоваться у чата, почему он пошел именно так, чем руководствовался, глубокий анализ в режиме реального времени - это именно то, что нужно изучающим шахматное дело. Персональный тренер по цене подписки. И стоить признаться, результат игры в шахматы меня очень сильно удивил.

Читать далее
Всего голосов 39: ↑38 и ↓1+50
Комментарии109

Микроразметка сайта для Яндекс и Google с примерами

Уровень сложностиПростой
Время на прочтение20 мин
Количество просмотров24K

Микроразметка сайта для поисковых систем Яндекс и Google в формате Schema.org, JSON-LD и Open Graph. Разметку старался делать без js, т.к. Яндекс ее не учитывает. Микроформат Schema.org подходит для Яндекс/Google. Преимущество данного метода - не нужно ждать бота, который придет, просканирует страницу с включенным js и поймет что там находится. Ускоряет обработку данных в микроданных.

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии1

Кофе и повышение работоспособности организма. Часть первая

Время на прочтение4 мин
Количество просмотров25K

В попытке обеспечить повышение работоспособности организма, мы чаще всего приходим к кофе. Кофе пьют примерно 90% взрослого населения планеты и примерно 50% подростков. Вопрос только в том, есть ли в нем польза? А если нет, то как её извлечь?

Читать далее
Всего голосов 37: ↑34 и ↓3+39
Комментарии29

Страх и ненависть в переговорке: курим VideoSDK API, Vosk и Python

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров6.8K

Сегодня поговорим о кастомных решениях для видеоконференцсвязи (далее — ВКС) с минимальными затратами человеко-часов и финансов на их создание. Я параноик Брать готовый open-source – меня не устраивает, всем известны случаи встраивания bad code в проекты с открытым исходным кодом с целью нанести ущерб пользователям из России. Поэтому за основу берём что-то отечественное с корпоративным уклоном, с открытым API и подходом «без регистрации и смс».

Читать далее
Всего голосов 7: ↑6 и ↓1+8
Комментарии9

Интернет-цензура и обход блокировок: не время расслабляться

Время на прочтение10 мин
Количество просмотров168K

Disclaimer: практически всё описанное в статье, не является чем-то принципиально новым или инновационным - оно давно известно и придумано, используется в разных странах мира, реализовано в коде и описано в научных и технических публикациях, поэтому никакого ящика Пандоры я не открываю.

Нередко на Хабре в темах, посвященных блокировкам ресурсов встречаются забавные заявления, вида "Я настроил TLS-VPN, теперь будут смотреть что хочу и цензоры мой VPN не заблокируют", "Я использую SSH туннель, значит все ок, не забанят же они SSH целиком", и подобное. Что ж, давайте проанализируем опыт других стран и подумаем, как же оно может быть на самом деле.

Читать далее
Всего голосов 258: ↑253 и ↓5+318
Комментарии518

Английский, которому меня не учили

Время на прочтение14 мин
Количество просмотров76K

Или максимы Английского языка, которые бы я хотел знать 20 лет назад.

Чем отличается хороший геймер от плохого? Хороший геймер сидит и изучает игру. Он знает каждый закуток. Он может без запинки назвать все характеристики всех юнитов в Star Craft. А самый крутой игрок знает все пропускные способности желтых, красных и синих конвейеров. А плохой игрок использует чит-коды или assistant apps. 

Можно сколько угодно сидеть и жаловаться о том, что правила сложны. А можно просто взять, изучить эти правила и уделать наисложнейшую игру.

Я не раз в своей жизни слышал, что Английский чрезвычайно сложен. Подобные заявления фактически являются чит-кодом. Вы просто сдаётесь и перестаёте пытаться. А зря. В английском языке есть очень много полезных и понятных вещей. 

В этой статье я хочу вам показать основные моменты, которые помогли мне хорошо овладеть языком. И надеюсь, что понимание этих моментов поможет и вам. 

Okay, let's go...
Всего голосов 103: ↑101 и ↓2+130
Комментарии174

Про аудирование, или Из чего состоит знание иностранного языка

Время на прочтение10 мин
Количество просмотров21K

Часто люди, отчаявшись добиться желаемого прогресса после многих лет нерационального изучения языка, делают вывод: «Учу-учу, ничего не получается… Что-то идёт не так. Наверно, сделать качественный рывок мне поможет только погружение в языковую среду».

Покупают курс в Лондоне. Возвращаются с отличными впечатлениями, почти без денег и растущей убеждённостью: «Мой случай уникален, нужен какой-то особый подход».

Ни черта уникального на самом деле нет, ситуация очень типичная. Всё это — от тотального повсеместного непонимания, из чего, собственно, состоит знание иностранного языка. Да и разобраться непросто — весь эфир забит рекламной демагогией. 9 из 10 жалуются: я плохо воспринимаю речь на слух… что делать… У рекламщиков ответ уже готов: «Улучшить восприятие на слух? — Не проблема! Приходите! Поможем!»

Ну приходят. Заканчивается всё очередным разочарованием и ещё более глубокой убеждённостью в «уникальности» своего случая. В общем, давайте разберёмся, из чего состоит «знание» иностранного языка.

Во-первых, не верьте знакомым, которые говорят, что хорошо понимают носителей на слух. Носители сами друг друга часто переспрашивают, даже понимая контекст разговора. И если ты не вырос в Англии, у тебя ВСЕГДА будут проблемы с восприятием речи британца. Сейчас расскажу, почему.

Вспомните ситуации, когда вы понимали носителя, пока он говорит с вами, но мгновенно переставали его понимать, когда он начинал говорить с другим носителем. Как так?

Реальные живые носители произносят не совсем те слова, которые мы ожидаем услышать, читая субтитры. Ни в одном словаре нет слова forya (ударение на первый слог), а оно, между тем, распространённое (в субтитрах будет написано for you). Не менее распространено слово whaddaya (в субтитрах пишут what do you). То же самое происходит в скоростной русской речи: вместо «он говорит» в реальной жизни мы обычно используем слово «онгрьт» с невнятной «н». Очсомневаюсь, что оно есть в словаре. Однажды при мне темнокожий парень объяснял посреди Москвы темнокожей девушке: «…and instead of “shto” they say “chyo” (вместо «што» они говорят «чё»). «Чё» даже не похоже на «что».

Читать далее
Всего голосов 57: ↑52 и ↓5+60
Комментарии125

30 фильмов про IT и киберпанк, которые можно пересмотреть на новогодних праздниках

Время на прочтение10 мин
Количество просмотров55K
На новогодних праздниках можно позволить себе отдохнуть и посмотреть старое и новое кино. Фильмы про IT подбирал так, чтобы можно было найти на любой вкус. Ниже список, которым решил с вами поделиться.

Читать дальше →
Всего голосов 49: ↑32 и ↓17+28
Комментарии99

К вопросу о математических способностях студентов или как учить переполненный мозг

Время на прочтение23 мин
Количество просмотров233K

Я люблю давать простые задачки студентам на лекции. Во-первых, понятно, скольких мы потеряли, во-вторых, это переключение из режима потребления информации в режим выдачи результатов, в третьих — возможность проявить себя для шустрых. Сплошные плюсы!

Одна из простых задач звучит так: «При переводе картинки из цветового пространства RGB в YUV мы выполняем прореживание, то есть выкидываем каждый четный столбец и каждую четную строку в компонентах U и V (все компоненты пикселя по 1 байту). Вопрос: во сколько раз меньше данных у нас стало?» Эта операция называется chroma subsampling и широко используется при сжатии видео, например.

Забавно, что когда-то давно, когда винчестеры были меньше, а дискеты больше, студенты реально отвечали на этот вопрос быстро. А в последние годы регулярно народ в ступор впадает. Приходится разбирать по частям: «Если выкинуть каждую четную строку и каждый четный столбец, во сколько раз меньше данных будет у компоненты?» Почти хором: «В четыре». Начинаю подкалывать: «Отлично! У нас было 3 яблока, первое осталось как есть, а от второго и третьего осталось по четвертинке. Во сколько раз меньше яблок у нас стало?» Народ ржет, но, наконец-то, дает правильный ответ (заметим, не все). 

Это было бы смешно, если бы от способности быстро в уме прикинуть результат не зависела способность быстрее создавать сложные алгоритмы. 

И хорошо видно, как эта способность в широких массах студентов заметно плавно падает. Причем не только в нашей стране. Придуман даже специальный термин: «цифровое слабоумие» ("digital dementia") — снижение когнитивных способностей, достаточно серьезное, чтобы повлиять на повседневную деятельность человека. 

Кому интересно как теряют мозг студенты масштабы бедствия и что с этим делать — добро пожаловать под кат!

Читать далее
Всего голосов 324: ↑308 и ↓16+373
Комментарии795

Создаем личное файловое облако легко и просто (и дешево)

Время на прочтение13 мин
Количество просмотров134K

А сегодня мы с вами быстро и решительно легко и просто поднимем свое личное файловое облако типа Google Drive или Яндекс.Диск, а если повезет, то еще и очень дешево.

Зачем? Ну, например, потому что не хотим зависеть от корпораций с их кабальными лицензионными соглашениями и сменой условий задним числом. Или потому что нам хочется приватности. Или просто потому что можем. А бонусом на нашем сервере вы потом сможете еще установить VPN или прокси для доступа к запрещенным сайтам, или поднять простенький веб-сайтик.

Я специально будут рассказывать все максимально подробно и пошагово, чтобы даже люди без большого опыта системного администрирования смогли все повторить. В наше время, благодаря развитому инструментарию, такому как docker и snap, установить и настроить все что нужно можно очень быстро всего лишь несколькими командами.

Читать далее
Всего голосов 79: ↑71 и ↓8+84
Комментарии233

Информация

В рейтинге
4 509-й
Откуда
Ростов-на-Дону, Ростовская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Technical Writer
Lead
HTML
CSS
WordPress
Web development
Python