Pull to refresh
13
0

Что делает ChatGPT… и почему это работает?

Level of difficulty Medium
Reading time 75 min
Views 35K
Algorithms *Machine learning *Artificial Intelligence Natural Language Processing *
Translation

То, что ChatGPT может автоматически генерировать что-то, что хотя бы на первый взгляд похоже на написанный человеком текст, удивительно и неожиданно. Но как он это делает? И почему это работает? Цель этой статьи - дать приблизительное описание того, что происходит внутри ChatGPT, а затем исследовать, почему он может так хорошо справляться с созданием более-менее осмысленного текста. С самого начала я должен сказать, что собираюсь сосредоточиться на общей картине происходящего, и хотя я упомяну некоторые инженерные детали, но не буду глубоко в них вникать. (Примеры в статье применимы как к другим современным "большим языковым моделям" (LLM), так и к ChatGPT).

Читать далее
Total votes 172: ↑172 and ↓0 +172
Comments 37

Российские интернет-провайдеры начали блокировать OpenVPN-подключения

Reading time 2 min
Views 101K
Information Security *Network technologies *Legislation in IT

Российские интернет-провайдеры начали блокировать OpenVPN-подключения. Об этом сообщает в своем Telegram-канале "Роскомсвобода", ссылаясь на сообщения от дружественных VPN-провайдеров и пользователей.

Судя по комментариям в Telegram, а также на известном форуме NTC.party, проблема наблюдается в разных регионах России у разных интернет-провайдеров. Среди операторов, на сетях которых зафиксированы факт блокировки, упомянуты Билайн (мобильный интернет в Казани, проводной интернет в Москве), Таттелеком, Дом.ру (Тула), МТС (Челябинск), Мегафон (Краснодар), Ростелеком (Кранодар) и другие. Наличие или отсутствие блокировки, судя по всему, зависит от наличия оборудования ТСПУ (DPI) на сети провайдера, также возможно что новые правила фильтрации пока что были применены только на некоторых сетях или только для определенных групп абонентов в тестовом режиме.

Блокировка осуществляется разрывом OpenVPN-сессии после нескольких пакетов. Соединение полностью устанавливается, но через секунду-две разрывается, либо прекращается обмен трафиком. По сообщениям некоторых пользователей, блокировка происходит только при подключении к серверам за пределами РФ, по сообщениям других пользователей, фильтрации подвержены даже подключения к серверам внутри страны.

Читать далее
Total votes 83: ↑80 and ↓3 +77
Comments 563

Что будет дальше

Reading time 15 min
Views 90K
IT career Conferences Social networks and communities
Opinion


В пять лет я сидел у бабушки дома на уютном ковре, и никак не мог понять, почему герой диснеевского мультика посмотрел вниз, когда бежал над пропастью — ведь до тех пор, пока он не посмотрел, ему удавалось бежать по воздуху! А стоило опустить глаза вниз, и мультяшная физика мгновенно реагирует — всё, реальность, в которой можно бежать по воздуху кончилась, началась реальность, где герой зависает на пару мгновений, и стремительно летит вниз.

В двадцать девять лет я бегу над пропастью и не смотрю вниз, урок детства усвоен хорошо, падать не хочется, и вера в то, что если ты в низ так и не посмотришь, то сможещь перебежать пропасть, зайти на другой край, оказаться в безопасности, раз и навсегда, как будто всегда в ней и был.

Когда живёшь в Иванове, ты не чуствуешь пульс индустрии, страны и мира так, как должен чувствовать. Город, в котором я родился, вырос, построил жизнь и карьеру, их которого я учил всех жить, хоть и находится довольно близко к дефолтному — всё ещё редкое захолустье. Размеренный, спокойный, отдаленный. В городе Иваново легко делать вид, что ты не бежишь ни над какой пропастью, легко не смотреть вниз. Даже если ты известный человек, с огромным количеством друзей и знакомых по всему миру, даже если ты ведешь один из самых популярных индустриальных подкастов, и даже если вся твоя работа подразумевает глубочайшее погружение во всё значимое, что происходит в мире, в регионе, и в твоей индустрии.

Я читал все новости, я до последнего рокового утра был уверен, что ничего страшного не будет, а когда оно настало, не верил, что оно продлится долго, хотя и пропускал через себя абсолютно всё. Всё, все сводки, все фотографии, все новости, все прогнозы и мнения.

Читать далее
Total votes 383: ↑235 and ↓148 +87
Comments 933

Ни одно задание не будет провалено: Spring Boot и Quartz в режиме cluster

Level of difficulty Medium
Reading time 9 min
Views 2.9K
Java *Kotlin *Kubernetes *Openshift *
Sandbox

Туториал по настройке библиотеки Quartz в режиме кластера в Spring Boot приложении с возможностью отслеживания и управления жизненным циклом задания, в том числе переносом задания в случае необходимости.

Читать далее
Total votes 8: ↑8 and ↓0 +8
Comments 10

На $32 млн оштрафована Google в Южной Корее

Reading time 1 min
Views 1.1K
Mobile applications monetization *Games monetization *IT-companies

Корпорацию признали виновной в том, что с июня 2016 года по апрель 2018 года она использовала всё своё влияние на разработчиков игр, чтобы вытеснить с рынка корейского конкурента Google Play Store, One Store. Южнокорейская комиссия по добросовестной торговле (KFTC) уверена, что с момента основания One Store в июне 2016 года и почти на протяжении двух лет Google требовала от корейских компаний, занимающихся видеоиграми, выпускать свои новые релизы исключительно в Play Store.

Читать далее
Total votes 10: ↑10 and ↓0 +10
Comments 0

Современные технологии обхода блокировок: V2Ray, XRay, XTLS, Hysteria, Cloak и все-все-все

Reading time 19 min
Views 59K
Information Security *System administration *Network technologies *

Три месяца назад здесь на Хабре была опубликована статья “Интернет-цензура и обход блокировок: не время расслабляться”, в которой простыми примерами показывалось, что практически все популярные у нас для обхода блокировок VPN- и прокси-протоколы, такие как Wireguard, L2TP/IPSec, и даже SoftEther VPN, SSTP и туннель-через-SSH, могут быть довольно легко детектированы цензорами и заблокированы при должном желании. На фоне слухов о том, что Роскомнадзор активно обменивается опытом блокировок с коллегами из Китая и блокировках популярных VPN-сервисов, у многих людей стали возникать вопросы, что же делать и какие технологии использовать для получения надежного нефильтрованного доступа в глобальный интернет.

Мировым лидероми в области интернет-цензуры является Китай, поэтому имеет смысл обратить на технологии, которые разработали энтузиасты из Китая и других стран для борьбы с GFW (“великим китайским файрволом”). Правда, для неподготовленного пользователя это может оказаться нетривиальной задачей: существует огромное количество программ и протоколов с похожими названиями и с разными не всегда совместимыми между собой версиями, огромное количество опций, плагинов, серверов и клиентов для них, хоть какая-то нормальная документация существует нередко только на китайском языке, на английском - куцая и устаревшая, а на русском ее нет вообще.

Поэтому сейчас мы попробуем разобраться, что же это все такое и как это использоваться и не сойти с ума.

Читать далее
Total votes 157: ↑155 and ↓2 +153
Comments 118

Введение в Spring Boot Actuator

Reading time 10 min
Views 77K
OTUS corporate blog Programming *Java *
Translation
Салют, хабровчане! Уже через неделю стартуют занятия в новой группе курса «Разработчик на Spring Framework». В связи с этим делимся с вами полезным материалом в котором рассказано о том, что такое Spring Actuator и чем он может быть полезен.



  1. Что такое Spring Actuator?
  2. Как добавить Spring Actuator в проект Maven или Gradle?
  3. Создание проекта Spring Boot с зависимостью Spring Actuator.
  4. Мониторинг приложений с Spring Actuator Endpoints.
Читать дальше →
Total votes 13: ↑9 and ↓4 +5
Comments 2

Странно, уже столько времени прошло, а на Хабре до сих пор не упомянули про Alpaca

Reading time 2 min
Views 53K
Machine learning *Artificial Intelligence

Тогда это сделаю я.

Друзья, если вы вдруг пропустили новости, то светлые головы из Стендфорда (университет такой в США), взяли несколько моделей LLama, которые недавно выпустили из недр Meta AI, нагенерировали им дополнительного материала для обучения при помощи GPT-3/3.5/4 и обучили её понимать запросы в стиле InstructGPT.

Модельки получились маленькие и теперь это всё доступно для установки на свой домашний комп. Народ вон даже на Rhaspberry Pi 4B их крутит. Как вам идея иметь свой собственный ChatGPT-alike бот дома, а?

Читать далее
Total votes 69: ↑66 and ↓3 +63
Comments 215

Как работает ChatGPT: объясняем на простом русском эволюцию языковых моделей с T9 до чуда

Level of difficulty Easy
Reading time 30 min
Views 191K
Open Data Science corporate blog Machine learning *Artificial Intelligence The future is here Natural Language Processing *
Review

В последнее время нам почти каждый день рассказывают в новостях, какие очередные вершины покорили языковые нейросетки, и почему они уже через месяц совершенно точно оставят лично вас без работы. При этом мало кто понимает — а как вообще нейросети вроде ChatGPT работают внутри? Так вот, устраивайтесь поудобнее: в этой статье мы наконец объясним всё так, чтобы понял даже шестилетний гуманитарий!

Погнали →
Total votes 357: ↑350 and ↓7 +343
Comments 280

Полное понимание асинхронности в браузере

Reading time 24 min
Views 55K
Яндекс corporate blog JavaScript *Programming *Interfaces *Browsers
Про асинхронность JavaScript написано много статей, документации и книг. Но вся информация сильно распределена по интернету, поэтому сложно быстро и полностью разобраться, что к чему, и составить цельную картину в голове. Не хватает одного исчерпывающего гайда. Именно эту потребность я и хочу закрыть своей статьёй.

Читать дальше →
Total votes 78: ↑78 and ↓0 +78
Comments 25

Моя борьба с санкциями или как появился умный VPN

Reading time 3 min
Views 70K
Configuring Linux *Network technologies *
Tutorial

Зачем людям ранее был нужен VPN (кроме мошенников конечно) - чтоб ходить на Linkedin и обходить всякие разные запреты РКН.

Когда ввели санкции и некоторые сайты перекрасились в сине-желтый цвет, то многие по старой памяти подумали - включим VPN и всё сразу станет как раньше, разве что русские сайты начнут открываться на 50мс медленнее.

Но не тут-то было. Вместе с перекраской сайтов, началась волна DDoS и хакерских атак на различные сервисы в РФ. В итоге, российские сайты закрылись от остального интернета. И с VPN стало очень некомфортно - хочешь пользоваться Terraform или там MatterMost скачать - включаешь VPN и сразу же не можешь сходить ни на Ozon ни на Госуслуги.

Интернет разделился на InnerNet и OuterNet.

Читать далее
Total votes 46: ↑39 and ↓7 +32
Comments 130

Увеличь это! Современное увеличение разрешения в 2023

Level of difficulty Medium
Reading time 26 min
Views 19K
Algorithms *Image processing *Machine learning *Popular science Artificial Intelligence
Review

Почти 4 года назад вашим покорным слугой была опубликована статья Увеличь это! Современное увеличение разрешения, которая набрала +376 хабролайков и 176 тысяч просмотров. Но прогресс на месте не стоит! Новые нейросетевые методы жгут! Их результаты прекрасны и великолепны. 1,5 года назад на хабре была неплохая статья Апскейл, который смог (+160), в которой были показаны плюсы новых алгоритмов.

Но всегда ли все прекрасно? Конечно нет! 

Мой любимый пример фантастических способностей нейросетевых алгоритмов выше. В шарике отражается наша лаборатория. Бюст Зевса был взят в датасет, чтобы оценить работу нейросетей с полутенями, но результат «обработки полутеней» сильно превзошел ожидания. Во-первых, мудрые голубые глаза и покрасневшие губы! Во-вторых, Зевс теперь причесан! В-третьих, его борода стала короче и тоже аккуратно подстрижена! Наконец, Зевс теперь выглядит ощутимо моложе и… человечнее! О, жители Олимпа, согласитесь, это просто божественно! 

Почему нам таки есть что сказать по теме? За последние годы мы создали 3 бенчмарка Video Super-Resolution под разные кейсы использования, которые на данный момент занимают первые 3 (из 14) места в соответствующем разделе на сайте paperswithcode.com.

Подобная деятельность безмерно актуальна, поскольку если 4 года назад на GitHub было меньше 200 репозиториев Super-Resolution, то сейчас их там больше 900 и разобраться в этом море исходников стало совсем непросто.

Естественно, при создании бенчмарков у нас было много чудных примеров. Более того, сейчас мы целенаправленно создаем датасет артефактов нейросетевых алгоритмов апскейла.

Кому интересно посмотреть, какие забавные косяки бывают у новых алгоритмов, а также как выглядят наилучшие результаты, которые даже меня, занимающегося темой 14+ лет, удивляют — добро пожаловать под кат!

Много прекрасных картинок Super-Resolution
Total votes 118: ↑117 and ↓1 +116
Comments 84

Что читать техлиду: 7 увлекательных книг

Reading time 6 min
Views 25K
МойОфис corporate blog Professional literature *Development Management *Studying in IT

Какие качества отличают хорошего технического лида? Уверены, как минимум инициативность, стратегическое видение, интерес к новым практикам и инструментам, идущие рука об руку с желанием постоянно развиваться. Немалую роль в lifelong learning техлида могут сыграть правильно подобранные книги.

Немет, Луц, Лав, Танненбаум, Страуструп, Олифер, Лукас — вот лишь некоторые известные авторы, о которых мы сегодня не будем говорить. Надеемся, что раз вы стали лидером технической команды, то с фундаментальной литературой в своей области знаний знакомы не понаслышке.

Под катом рекомендуем 7 изданий о soft-skills, методологиях, управлении командами и проектами.

Читать далее
Total votes 64: ↑62 and ↓2 +60
Comments 16

Интернет-цензура и обход блокировок: не время расслабляться

Reading time 9 min
Views 86K
Information Security *Network technologies *Research and forecasts in IT *
Analytics

Disclaimer: практически всё описанное в статье, не является чем-то принципиально новым или инновационным - оно давно известно и придумано, используется в разных странах мира, реализовано в коде и описано в научных и технических публикациях, поэтому никакого ящика Пандоры я не открываю.

Нередко на Хабре в темах, посвященных блокировкам ресурсов встречаются забавные заявления, вида "Я настроил TLS-VPN, теперь будут смотреть что хочу и цензоры мой VPN не заблокируют", "Я использую SSH туннель, значит все ок, не забанят же они SSH целиком", и подобное. Что ж, давайте проанализируем опыт других стран и подумаем, как же оно может быть на самом деле.

Читать далее
Total votes 329: ↑324 and ↓5 +319
Comments 495

YAML из Ада

Reading time 9 min
Views 43K
Python *Programming *Kubernetes *
Review
Translation

Формат данных YAML чрезвычайно усложнён. Он задумывался как удобный для человека, но в стремлении к этой цели сложность настолько увеличилась, что, по моему мнению, его разработчики достигли противоположного результата. В YAML есть куча возможностей выстрелить себе в ногу, а его дружелюбие обманчиво. В этом посте я хочу продемонстрировать это на примере.

Данный пост является нытьём и он более субъективен, чем мои обычные статьи.
Читать дальше →
Total votes 221: ↑218 and ↓3 +215
Comments 183

Вы НЕ сошли с ума (о режиме сна в Windows)

Reading time 8 min
Views 98K
Computer hardware Laptops
Tutorial

Вы сталкивались с тем, что ноутбук случайно включается, хотя вы уверены, что отправляли его в сон?

Бывало, что батарея оказывалась пустой, хотя вы точно-точно помните, как убирали в сумку заряженный на 100% ноутбук?

Тогда вам сюда:

Мне сюда
Total votes 259: ↑249 and ↓10 +239
Comments 503

Meta* согласилась с требованием британского регулятора продать Giphy

Reading time 2 min
Views 514
Legislation in IT Social networks and communities IT-companies

Управление по защите конкуренции и рынкам Великобритании (Competition and Markets Authority или CMA) потребовало от американской корпорации Meta продать платформу анимированных изображений Giphy. Ранее суд поддержал обращение ведомства, которое заподозрило компанию в попытке нанести ущерб конкурентам. Meta сообщила, что готова выполнить распоряжение CMA о расторжении сделки 2020 года.

Читать далее
Total votes 1: ↑1 and ↓0 +1
Comments 0

Минцифры выпустило памятку для мобилизуемых специалистов IT- и телеком-компаний, имеющих право на отсрочку

Reading time 3 min
Views 42K
Personnel Management *IT career IT-companies


Минцифры выпустило памятку для мобилизуемых специалистов IT- и телеком-компаний, имеющих право на отсрочку. Ведомство, помимо приёма сообщений по теме мобилизации на электронную почту help@digital.gov.ru, открыло ящик для экстренных ситуаций sos@digital.gov.ru.
Читать дальше →
Total votes 36: ↑34 and ↓2 +32
Comments 70

О мобилизации для IT-специалистов

Reading time 6 min
Views 103K
Legislation in IT IT career

Если вы все еще не понимаете, по какому принципу военкоматы мобилизируют призывников, то предлагаем вам ознакомиться с нашей статьей о мобилизации для IT-специалистов. Вы будете удивлены, что военкоматы большей частью работают согласно закону, а вот многие устные заявления, по крайней мере пока, законами не подкреплены. Поэтому имеем то, что имеем - военкоматы просто делают свою работу в соответствии с нисходящими на них указами и законами о мобилизации. Эти указы и законы мы разберем в нашей статье и затронем тему того, как мобилизация касается IT-специалистов.

Мобилизируемся вместе с профсоюзом ИТ
Total votes 146: ↑135 and ↓11 +124
Comments 619

Information

Rating
Does not participate
Registered
Activity