Articles / Bookmarks / Profile of rPman / Habr

@rPman

User

ProfileArticles14Posts1NewsComments6.8K

Civil Sep 20 2023 at 15:00

25 Гбит/с дома, часть 1

Medium

16 min

50K

Configuring Linux*Computer hardwareNetwork hardwareDIY

Case

Translation

Я живу в маленьком сельском городке в Швейцарии и довольно давно являюсь клиентом init7 (местный провайдер). Этот провайдер хорошо известен тем, что в данный момент только они начали пару лет назад рекламировать доступное для частных лиц 25 Гбит/с подключение. Впрочем, им требуется время, чтобы обновить оборудование в точке присутствия, а, в моем случае, им нужно было открыть где-нибудь поблизости новую точку присутствия (до этого у них был договор с другим провайдером об аренде части оборудования и места в стойке, что по прежнему давало мне оптику в квартиру, она по прежнему была не GPON'ом, но скорость была ограничена гигабитом). Но в 2023 году они наконец анонсировали скорое открытие POPа и перевод всех пользователей на их основной продукт (fibre7). То что это новый POP для меня означает, что там сразу будет доступен 25 Гбит/с тариф.

+106

265

PatientZero Sep 16 2023 at 10:16

Почему мой любимый API — это файл zip на сайте Европейского центрального банка

Easy

7 min

31K

Data visualization*Open data*API*Interfaces*

Review

Translation

Когда был максимальный курс доллара к евро?

Вот небольшая программа, вычисляющая это:

curl -s https://www.ecb.europa.eu/stats/eurofxref/eurofxref-hist.zip \ | gunzip \ | sqlite3 -csv ':memory:' '.import /dev/stdin stdin' \ "select Date from stdin order by USD asc limit 1;"

Результат: 2000-10-26. (Можете попробовать запустить её самостоятельно.)

+75

mr-pickles Sep 12 2023 at 12:50

Реверс-инжиниринг промптов for fun and (no) profit

Easy

15 min

3.6K

Wunder Fund corporate blogArtificial IntelligenceLifehacks for geeksDebugging*

Translation

Этот материал посвящён взлому промптов Notion AI, семи методикам реверс‑инжиниринга промптов и рассказу о том, почему все ошибаются в своих мнениях о промпт‑инъекциях (prompt injection).

Вчера я получил доступ к публичной альфа‑версии Notion AI. У меня ушло 2 часа на то, чтобы, пользуясь промпт‑инъекциями, раздобыть полные тексты внутренних промптов, применяемых для реализации каждой из возможностей Notion AI.

Сегодня я публикую тексты этих промптов, но делаю это не потому, что я — человек безответственный; я отстаиваю точку зрения, в соответствии с которой в этом нет ничего страшного. И я воздаю должное команде Notion, которая так хорошо интегрировала возможности искусственного интеллекта в свой продукт.

Мне, кроме того, пришлось разработать и использовать кое‑какие новые техники приблизительного определения исходных текстов промптов. Я подумал, что было бы интересно представить их вам — моим замечательным читателям.

+19

Sivchenko_translate Aug 2 2023 at 14:53

Как сделать контекстное окно на 100K в большой языковой модели: обо всех фокусах в одном посте

17 min

11K

Natural Language Processing*CPUArtificial IntelligenceMachine learning*GPGPU*

Translation

От переводчика: выражаю огромную искреннюю благодарность Дмитрию Малову @malovdmitrijза консультации по ходу этого перевода, помощь в подборе формулировок, пояснение рисунков и незаменимую человеческую поддержку.

tldr; в статье рассмотрены приёмы, позволяющие ускорить обучение больших языковых моделей (LLM) и нарастить в них логический вывод. Для этого нужно использовать большое контекстное окно, в котором умещается до 100K входных токенов. Вот эти приёмы: ALiBi с подмешиванием в вектор позиции слова в последовательности (positional embedding), разреженное внимание (Sparse Attention), мгновенное внимание (Flash Attention), многозапросное внимание, условные вычисления и GPU A100 на 80 ГБ.

+21

Shannon Aug 1 2023 at 04:06

Linux для игр, Windows для работы. С чего начать, как установить и настроить

Easy

12 min

106K

Configuring Linux*Games and game consoles

Tutorial

Пора попробовать новый взгляд, когда Windows для работы, а Linux для отдыха. Ведь Linux очень удобен как раз для игр или экспериментов с софтом, чтобы ничего не отвлекало, не было соблазна ещё немного поработать, что возможно только в Windows.

И если вы не знаете с чего начать, но хотели или задумывались о том, чтобы попробовать линукс, но абсолютно не понимаете как его установить, настроить. Или просто хотите посмотреть как запускать игры, то эта статья поможет найти ответы на эти вопросы.

+75

197

Dmytro_Kikot Jul 28 2023 at 07:07

ROSE: крепкая, но нежная хватка

11 min

2.8K

ua-hosting.company corporate blogPopular sciencePhysicsThe future is hereRobotics

Роботы уже довольно давно перестали быть исключительно плодом воображения писателей-фантастов. В наши дни те или иные виды роботов используются на заводах, фермах, складах и даже в барах, и ресторанах. Но это не совсем те роботы, которых мы себе представляем. Их тело лишено ног, торса или головы. По сути, их тело это только рука, необходимая для захвата и переноски объектов. Более точное название таких устройств — роботизированные манипуляторы. Дабы эффективно выполнять свою работу, они должны обладать достаточно крепкой хваткой, чтобы не уронить переносимый объект. Однако должна быть и некая степень осторожности, если этот объект хрупкий. Инженеры-робототехники по разному подходят к решению этой задачи, создавая, к примеру, мягкие манипуляторы с датчиками давления. Но все они так или иначе напоминают либо кисть человека, либо клешню краба. А что если вдохновением для внешнего вида такого робота будет нечто, лишенное конечностей как таковых? Ученые из Японского института передовых наук и технологий разработали новый тип роботизированного манипулятора, чей внешний вид и соответствующий функционал напоминают распускающийся цветок розы. Из чего сделан робот, как именно он работает, и насколько он лучше классических манипуляторов? Ответы на эти вопросы мы найдем в докладе ученых.

Читать дальше →

+17

t3chnowolf Jul 3 2023 at 09:49

Плагины ChatGPT, которые помогут в работе — и не только программистам

4 min

14K

МТС corporate blogArtificial IntelligenceCloud services*

О нейросетях не писал только ленивый, причём тон статей меняется от откровенно пренебрежительного до восхищения возможностями нейронок. Мы же решили сделать практичный пост и показать инструменты, которые помогут в работе, как и говорилось в заголовке, не только программистам. Речь идёт о плагинах ChatGPT, которые могут пригодиться многим. Подробности — под катом.

+12

ipatiev Jun 8 2023 at 20:19

Использование ICU Message Format в PHP

Easy

6 min

3.7K

PHP*Symfony*Yii*

Tutorial

From sandbox

Недавно я узнал про довольно интересный инструмент, встроенный в РНР. Оказывается, в языке нативно поддерживается универсальный формат шаблонов для сообщений, ICU Message Format. В частности, он используется в Symfony Translation Component и в системе интернационализации фреймворка Yii 2. Однако этот функционал доступен и сам по себе, в чистом РНР. И может использоваться не только для создания многоязычных сайтов, но и в качестве простенького шаблонизатора, например для email-рассылок.

Я решил разобраться с ним поподробнее

+16

TyVik Jun 2 2023 at 07:15

Что делает ChatGPT… и почему это работает?

Medium

75 min

168K

Algorithms*Machine learning*Artificial IntelligenceNatural Language Processing*

Translation

То, что ChatGPT может автоматически генерировать что-то, что хотя бы на первый взгляд похоже на написанный человеком текст, удивительно и неожиданно. Но как он это делает? И почему это работает? Цель этой статьи - дать приблизительное описание того, что происходит внутри ChatGPT, а затем исследовать, почему он может так хорошо справляться с созданием более-менее осмысленного текста. С самого начала я должен сказать, что собираюсь сосредоточиться на общей картине происходящего, и хотя я упомяну некоторые инженерные детали, но не буду глубоко в них вникать. (Примеры в статье применимы как к другим современным "большим языковым моделям" (LLM), так и к ChatGPT).

+248

124

olegbunin May 30 2023 at 09:01

Построение HPC/GPU кластеров для машинного обучения

12 min

8.8K

Конференции Олега Бунина (Онтико) corporate blogMachine learning*Distributed systems*Artificial Intelligence

За последние несколько лет машинное обучение сильно изменилось. В обиход вошли так называемые Fundation model. Вы обучаете одну огромную общую модель, которая умеет делать почти всё одинаково. Это как вырастить огромное дерево. Однако для небольшой такой модели из 3 млрд параметров вам потребуется 400 GPU и обучение в течение 5 дней. Поэтому необходимо переходить на Machine Learning-кластера.

Дальнейшее повествование пойдет от имени Дмитрия Монахова, он занимался разработкой ядра Linux в Яндексе. Мне посчастливилось стать участником революции в Machine Learning, которая произошла за последние несколько лет. А именно модели выросли до такого размера, что они уже не влезают ни в один сервер, ни в несколько серверов, ни даже в одну стойку. Стали строить что-то огромное, но вдруг вспомнили, что был какой-то чудак, который имел опыт работы с распределёнными файловыми системами, а машинное обучение — это и есть использование распределённых алгоритмов.

+13

einhorn May 27 2023 at 16:40

Сравнение нейросетей для перевода

Medium

13 min

60K

Python*Machine learning*Artificial IntelligenceLearning languagesNatural Language Processing*

Review

С помощью GPT-4 можно решать самые разнообразные задачи по преобразованию текста, включая перевод на разные языки.

Мне стало интересно, кто переводит лучше: GPT-4 или специализированные нейронки для перевода, такие как Google Translate и DeepL?

Сегодня мы сравним качество перевода от различных нейросетей на 24 языковых парах.

+69

averkij Apr 24 2023 at 09:02

Это не чат, это GigaChat. Русскоязычная ChatGPT от Сбера

Medium

14 min

121K

Сбер corporate blogSberDevices corporate blogMachine learning*Artificial IntelligenceNatural Language Processing*

Хайп вокруг нейросетей, выровненных при помощи инструкций и человеческой оценки (известных в народе под единым брендом «ChatGPT»), трудно не заметить. Люди разных профессий и возрастов дивятся примерами нейросетевых генераций, используют ChatGPT для создания контента и рассуждают на темы сознания, а также повсеместного отнимания нейросетями рабочих мест. Отдадим должное качеству продукта от OpenAI — так и подмывает использовать эту технологию по любому поводу — «напиши статью», «исправь код», «дай совет по общению с девушками».

Но как достичь или хотя бы приблизиться к подобному качеству? Что играет ключевую роль при обучении — данные, архитектура, ёмкость модели или что-то ещё? Создатели ChatGPT, к сожалению, не раскрывают деталей своих экспериментов, поэтому многочисленные исследователи нащупывают свой путь и опираются на результаты друг друга.

Мы с радостью хотим поделиться с сообществом своим опытом по созданию подобной модели, включая технические детали, а также дать возможность попробовать её, в том числе через API. Итак, «Салют, GigaChat! Как приручить дракона?»

+221

233

fruitourist Apr 23 2023 at 13:09

FaceNet: Универсальный эмбеддинг для распознавания и кластеризации лиц

Medium

21 min

10K

Machine learning*Artificial Intelligence

Analytics

Translation

Несмотря на значительные достижения в области распознавания лиц, эффективная реализация проверки и распознавания лиц в масштабе представляет серьезные трудности для существующих подходов. В данной работе представляется система под названием FaceNet, которая непосредственно обучается отображению изображений лиц в компактное евклидово пространство, где расстояния напрямую соответствуют мере сходства лиц.

artyomsoft Mar 20 2023 at 09:00

Как создать аппаратный эмулятор CD-ROM без паяльника

Medium

19 min

18K

RUVDS.com corporate blogDIYDevelopment for Raspberry Pi*Development for Linux*System administration*

Несмотря на то, что постепенно оптические диски уходят в прошлое, использование ISO-образов этих дисков остаётся актуальным. Многие операционные системы поставляются в виде ISO-образов, а администраторам необходимо поддерживать разношёрстный парк старых персональных компьютеров.

Существует множество решений, как можно установить операционную систему с ISO-образа без записи его на оптический носитель. Я уже затрагивал тему ISO-образов в моих статьях: «Раскрываем секреты загрузочных ISO-образов» и «Что вам нужно знать о внешних загрузочных дисках».

В этой статье я хочу рассказать о ещё одном способе, который, как оказывается, вшит в ядро Linux. Если ваш одноплатный компьютер имеет USB OTG-разъём, и на него возможна установка Linux, то вы c большой долей вероятности можете сделать из одноплатника аппаратный эмулятор привода оптических дисков.

Меня этот способ заинтересовал. Я проверил его сам и, получив положительный результат у себя, решил поделиться с вами.

Я сам узнал много интересного, систематизировал свои знания, поэтому надеюсь, что чтение будет познавательно и интересно для вас.

Читать дальше →

+94

AlekDikarev Dec 6 2017 at 04:10

Сеанс передачи видео звуком через воду с разоблачением

11 min

33K

GadgetsVideo equipmentDIYSound

«Господь всемогущий! Кажется я только что убил мистера Мэя!… Но как бы то ни было, продолжим» (С) Дж. Кларксон

В этой статье я расскажу, как передать видео (ну, почти видео) при помощи звука через воду, используя обычный ноутбук, кусок провода, два джека 3.5 мм и две пьезо пищалки. А так же объясню почему и как это работает, расскажу забавную историю про то, как мы это придумали. А в качестве вишенки на торт, к статье прилагается проект на C# с исходниками, чтобы все, кому интересно, сами могли попробовать, ведь научное знание проверяемо, не так ли?

Читать дальше →

+62

121

franky_d_zoro Jan 30 2023 at 11:17

SEO Выводы из утечки кода поисковика Яндекс

6 min

105K

Search engine optimization*Increasing Conversion Rate*Web analytics*Search engines*

Opinion

Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

+179

130

Firemoon Jan 24 2023 at 13:10

SD – это Linux, а Midjourney – Mac: краткое полное руководство по Stable Diffusion

13 min

87K

Selectel corporate blogMachine learning*Artificial IntelligenceIT-companiesIT Infrastructure*

Tutorial

Вот таких тирекс-тянок выдает нейросеть

Текст про Midjourney привлек внимание, и в комментариях наметилась дискуссия про Stable Diffusion. Аргументы убедили меня попробовать SD самостоятельно, но вскоре я понял, что это не самая простая задача. Сообщество любителей Stable Diffusion произвело на свет множество удобных инструментов, которые своим количеством и сложностью могут отпугнуть новичков.

Всю неделю, что я экспериментировал с нейросетью, я боролся с желанием SD добавлять вторичные гендерные признаки по моим запросам и грустил, смотря на результаты генерации котиков. О своих страданиях частично писал в личном Telegram-канале — подписывайтесь! В этом же тексте — собрал основные советы по работе со Stable Diffusion и подвел итог, сравнив эту нейросеть с Midjourney.

Читать дальше →

+101

rebuilder Jan 21 2023 at 07:23

Задача коммивояжера (TSP) точное решение — метод целочисленного линейного программирования (Integer programming)

20 min

25K

High performance*Python*Perfect code*Algorithms*

Дочитав эту статью до конца, вы сможете решать точно задачу коммивояжёра на сотню элементов за считанные секунды!

Заинтригованы? Тогда, добро пожаловать под кат.

+124

Arnak Oct 18 2022 at 07:04

Ученые нашли упражнение, позволяющее худеть, сидя по 10 часов в день

6 min

361K

getmatch corporate blogHealthLifehacks for geeks

Недавно опять разгорелась дискуссия, как можно похудеть, работая в IT. Так вот, хороший (и научный) способ есть, и он на самом деле проще, чем можно было бы ожидать.

Конечно, если ничего не делать, то будешь только толстеть. Средний офисный сотрудник сегодня сидит больше 10 часов в день. Мы с вами, чувствую, ещё больше, особенно если на досуге играем, читаем Хабр или смотрим ютуб. Лично меня от компьютера вообще не оттащить. Хотя читал полно исследований, говорящих о больших проблемах со здоровьем, возникающих из-за малоподвижного образа жизни.

Например, было доказано, что независимо от уровня физической активности слишком много сидения увеличивает риск сердечных заболеваний, диабета, деменции и серьезных проблем со спиной. Более половины всех людей в мире сегодня уже страдают от этих проблем, и больше 80% людей в возрасте 60+.

Решение, конечно, простое — упражнения, в любой возможной форме. Но если вы такие как я, то тренироваться скучно и тяжело, правда? Большинство из нас ненавидят физкультуру. К тому же, на это нет лишнего времени. Бонусные часы каждый день магически не появятся.

Но похоже, есть способ ускорить обмен веществ в организме, даже сидя за ПК. И точно избежать проблем с метаболизмом и ожирением. Несколько недель назад вышла работа ученых под руководством Марка Гамильтона из Хьюстонского университета. Они разработали технику, позволяющую задействовать неожиданное свойство икроножных мышц, и делать для своего организма полноценную тренировку, не вставая со стула. Оказывается, похудеть, работая в IT, — это не так уж и сложно. Испытываю на себе, полёт нормальный. А какие у вас ноги будут прокачанные!

Читать дальше →

+150

297

qbertych Jul 14 2022 at 20:46

Как это устроено: атомные часы

22 min

76K

The future is hereQuantum technologiesPopular sciencePhysics

Technotext 2022

Привет Хабр! Сегодня у нас выходит статья в Nature Physics, в которой мы рассказываем про один интересный апгрейд для атомных часов. А нашу предыдущую работу по этой теме — в тот раз в самом Nature — даже упоминали пару раз на Хабре. Но то ли наш пресс-релиз оказался слишком сложным, то ли тема слишком специфичной, короче говоря, я из тех заметок вряд ли бы что-либо понял. Поэтому сегодня попробую простым языком рассказать про то, как устроены атомные часы и что интересного нас ждет в ближайшем будущем.

Оптические атомные часы в университете Токио. Credit: H. Katori

Читать дальше →

+260

1 2 3

5 6 ...

26 27