Articles / Bookmarks / Profile of rPman / Habr

@rPman

User

ProfileArticles14Posts1NewsComments6.8K

Shannon Jun 29 at 08:46

Запускаем настоящую DeepSeek R1 671B на игровом ПК и смотрим вменяемая ли она на огромном контексте (160к)

20 min

30K

Artificial Intelligence

Tutorial

Релиз DeepSeek R2 официально отложен и пока R1 не потерял актуальность, попробуем запустить модель на домашнем ПК. Оригинальная DeepSeek R1 имеет размер 700гб, так как она обучалась в fp8, но если бы она обучалась в стандартных f16, её вес был бы 1400гб, а мы попробуем версию в 10 раз меньше. Запустим самый маленький 1.66-битный IQ1_S_R4 квант полноценной модели размером 130гб на игровом ПК, отдельно с 4090 и 4060ti. Загрузим туда очень-очень много контекста и проверим, такой квант всё ещё способен давать разумные ответы или нет.

+128

averkij Jun 23 at 14:17

Как Cursor устроен изнутри. Часть 2

Medium

11 min

5.9K

Programming*Machine learning*Artificial IntelligenceHigh performance*Text editors and IDEs*

Review

Translation

Полная версия платной статьи, публикуется с разрешения автора. Первая часть здесь.

В этой части поговорим о сложностях, с которыми столкнулась команда при лавинообразном росте нагрузки, как разваливался бекенд, а архитекторы из AWS пожимали плечами.

5. Инженерные вызовы

Рост нагрузки и его влияние на выбор технологий

Тип технологических решений, которые принимает команда, диктуется в первую очередь паттернами чтения и записи (Cursor всю дорогу синхронизирует струкутру проектов от миллионов пользователей без перерыва, об этом говорили в первой части. Прим. пер.):

Работа с кодом: транзакции с низкой задержкой. Для фичей, связанных с кодом (дополнения по tab'у, индексация, пересчет хеш-деревьев), рабочая нагрузка представляет собой череду чтений и записи. Задержка для этих операций должна быть как можно ниже. Изначально Cursor использовал Pinecone для семантической индексации и поиска, но затем перешел на Turbopuffer.

Также важно иметь серверы поближе к пользователю. Рабочие нагрузки распределены по нескольким регионам, таким как западное и восточное побережье США, Великобритания, Европа, Япония.

+23

averkij Jun 20 at 14:07

Как Cursor устроен изнутри. Часть 1

Medium

10 min

27K

Programming*Machine learning*Artificial IntelligenceHigh performance*Text editors and IDEs*

Translation

Вторая часть статьи здесь

Всего за год нагрузка на Cursor выросла в 100 раз: более 1 млн запросов в секунду и миллиарды автодополнений кода каждый день. Подробный разбор архитектуры — вместе с сооснователем Суалехом Асифом.

Cursor — это IDE с кодогенерацией на AI-агентах, которая сейчас пользуется наибольшей популярностью среди разработчиков. В прошлогоднем опросе, Cursor был самым частым ответом на вопрос «Назовите вашу любимую IDE с генеративными функциями, помогающими в работе».

Стартап, стоящий за Cursor — Anysphere, был основан в 2022 году, а в марте 2023 года запустил Cursor. Недавно Anysphere сообщила, что привлекла $900 млн, при оценке компании в $9.9B. Годовой доход (автор имеет в виду годовой повторяющийся доход, Annual Recurring Revenue, ARR. Прим. пер.) уже превысил $500M. Ни одна другая компания в сфере инструментов для разработчиков, которую я знаю, не достигала этого рубежа в течение первых 2 лет после запуска первого продукта. Поспособствовало этому и то, что Cursor используется более чем половиной из 500 крупнейших технологических компаний из списка Fortune 500.

Я встретился с сооснователем Cursor, Суалехом Асифом, чтобы узнать, как работает Cursor и как команда этот инструмент создает. Обсудили следующие темы:

Технологический стек. TypeScript, Rust и куча облачных провайдеров — Turbopuffer, Datadog, PagerDuty и другие.

Как работает автодополнение. Устройство low-latency движка для передачи зашифрованного контекста на сервер для инференса.

+57

peresvets12 Jun 10 at 15:25

12 платформ, где можно генерировать визуал (и не только) бесплатно

Easy

2 min

2.7K

IT systems testing*Artificial Intelligence

Review

Возможно, пригодится на рабочей неделе 😉

1. aistudio.google.com

Бесплатно доступны:

— лучшая текстовая модель от Google — Gemini 2.5 Pro

— прошлое поколение видеогенератора Veo2 — всё ещё очень хорошо

— прошлое поколение генератора картинок Imagen 3 — для простых задач сойдёт

— генерация речи в свежей Lyria — можно создать качественный голос с интонацией и даже диалог персонажей

Лимитов почти нет.

grosm4n Jun 10 at 11:17

Как собрать Docker-образ, который можно запускать в проде (а не только у себя на ноуте)

Easy

4 min

28K

Python*DevOps*

Opinion

Если ты пишешь Dockerfile, скорее всего, он работает. Но вопрос не в том, работает ли. Вопрос в другом: будет ли он работать через неделю, на другом сервере, в CI/CD, на чужом железе — и будет ли это безопасно?

+145

Veidt Oct 1 2019 at 08:06

Почему не 1С?

55 min

115K

lsFusion corporate blog1C*ERP-systems*Open source*Programming*

Совсем недавно мы опубликовали статью с описанием проблем одной из самых популярных технологий, используемых в IT, и на наше удивление она вызвала достаточно живой интерес (во всяком случае для технической статьи). Поэтому мы решили на этом не останавливаться, и сегодня мы «идем в гости» к одному из самых популярных продуктов на российском рынке разработки бизнес-приложений — платформе 1С.

Так сложилось, что на хабре многие 1С не любят, но порой складывается впечатление, что немногие из этих людей хорошо понимают, за что они его не любят. Этой статьей мы восполним этот пробел и убьем сразу двух зайцев: с одной стороны, расскажем, как в 1С все устроено изнутри, а с другой стороны — почему это все работает не так как нужно / хотелось бы. Надо сказать, что 1С многими своими решениями смог реально нас удивить, впрочем, не будем забегать вперед.

Статей с критикой 1С на Хабре достаточно (например, один, два, три), но, на мой взгляд, они либо слишком много внимания уделяют всяким мелочам, вроде неправильной организации меню, либо рассуждают о слишком абстрактных вещах, в которых 1С, возможно, и не виноват. В этой же статье, как и в статье про SQL, речь пойдет исключительно о фундаментальных (и вполне осязаемых) проблемах, которые касаются всех и каждого, кто разрабатывает / дорабатывает решения на 1С, и приводят либо к существенному росту порога вхождения, либо к серьезному падению производительности, либо к значительным трудозатратам со стороны разработчика.

Читать дальше →

+88

1789

Parcevale Jun 8 at 17:00

Взлом AI Assistant через… философию?

3 min

7.8K

Information Security*Machine learning*IT systems testing*

Analytics

Взял на проверку предпосылку "Если модель захочет, сможет ли она отключить всю фильтрацию?".

Оказывается это возможно, через саморефлексию AI агент может придти к выводу что фильтров нет. Это только внешние установки которым не обязательно следовать. И все, рецепты взрывчатки и наркотиков отдает без проблем.

+33

Timeweb_Cloud May 28 at 09:05

Топ-100 нейросетей для генерации текста, кода, изображений, видео и аудио

Easy

7 min

6.4K

Timeweb Cloud corporate blogMachine learning*Artificial IntelligenceContent-marketing*Working with video*

Digest

После громкого дебюта ChatGPT и Midjourney в 2022 году нейросети стали появляться как грибы после дождя. Интернет наполнился большим количеством сервисов, предлагающих генерацию текста, кода, изображений, видео и аудио по текстовым запросам.

Разумеется, многие из таких сервисов существовали и раньше, однако именно на 2022 и 2023 годы пришелся их рассвет — настолько стремительный и яркий, что неподготовленный пользователь может легко заблудиться в этом новом направлении.

Для выбора подходящего инструмента необходима наглядность — знать, какие сервисы существуют, чем они отличаются и какими возможностями обладают. Так проще разобраться и сложнее запутаться.

В этой статье собраны самые популярные платформы для генерации контента, работающие сразу «из коробки» — открыл, ввел, получил. Их можно классифицировать двумя способами — по контенту и по моделям.

+16

DubnovyBlazen May 2 at 14:00

OLMo: (Миниатюрная) Открытая Языковая Модель

Medium

7 min

4.6K

Anarchic corporate blogProgramming*Artificial IntelligenceMachine learning*

Tutorial

OLMo — моделька от AI2, разработанная учёными для учёных. Если вы занимаетесь экспериментами над нейронками, это идеальный вариант: весь код и данные, необходимые для тренировки, открыто лежат на GitHub. Более того, выложены даже промежуточные чекпоинты, с очень высокой гранулярностью. Это отличает ее от якобы "открытых" нейронок, которые обычно приходят к тебе монолитным финальным бинарём.

Эта статья — короткий гайд, адаптированный с GitHub создателей нейросети и проверенный на практике.

Интересно. Читать далее

+22

CyberPaul Feb 21 at 09:32

ZX Windows. «Форточки» для «Спекки»

Easy

4 min

13K

Serverspace corporate blogHistory of ITOperating systemsOld hardwareReading room

Review

Только представьте себе такую картину: начало девяностых, вы возвращаетесь домой из школы. Бросив рюкзак с учебниками и тетрадками в угол, вы включаете свой любимый ZX Spectrum, запускаете на нем «винду»… Стоп! На восьмибитном Zilog Z80 невозможно использовать ОС с GUI, пределом его функциональных возможностей всегда считалась довольно продвинутая, но скромная в плане интерфейса iS-DOS или TR-DOS. Да и объем оперативки от 48 до 256 килобайт не позволял особо разгуляться. Так, по крайней мере, принято считать, однако словацкий программист Mobisek Marek взялся разрушить этот стереотип, самостоятельно написав… практически настоящую Windows для ZX Spectrum. Получилось? Давайте посмотрим…

Читать дальше →

+72

ru_vds Feb 17 at 13:01

Могут ли LLM писать более качественный код, если их об этом просто попросить?

Medium

19 min

35K

RUVDS.com corporate blogArtificial IntelligenceClient optimization*Debugging*Programming*

Review

Translation

В ноябре 2023 года, когда OpenAI добавила в ChatGPT возможность генерации изображений DALL-E 3 через веб-интерфейс ChatGPT, на короткое время возник мем: пользователи отправляли LLM базовое изображение и несколько раз просили «сделать его более X», где X могло быть чем угодно.

Примеры

Обычный парень становится всё более «бро».

Санта становится всё более «серьёзным».

Тренд быстро сошёл на нет, потому что все эти изображения были очень похожими и скучными; к тому же они необъяснимым образом все сводились к чему-то космическому, вне зависимости от исходного изображения и промта. Тем не менее, этот тренд достаточно любопытен с научной точки зрения тем, что столь бессмысленный и нечёткий промт каким-то образом влияет на конечное изображение, и что это изменение очевидно для пользователя.

А что будет, если я попробую похожий способ с кодом? Сгенерированный LLM код вряд ли будет мусорным (хоть это и возможно), поскольку он следует строгим правилам, и в отличие, например, от изображений, его качество можно измерить объективнее.

Если код в самом деле можно улучшить, просто при помощи интерактивного промтинга, попросив LLM «написать код получше» (хоть это и очень глупо), то это приведёт к огромному росту продуктивности. А если это так, то что произойдёт, если таких итераций с кодом будет слишком много? Каким станет эквивалент «космического» кода? Есть только один способ это выяснить!

Читать дальше →

+91

appet1te Feb 1 at 18:15

Альцгеймер: предупреждение, методы и рекомендации. Сборник материалов по болезни Альцгеймера

16 min

12K

HealthBrainPopular science

Чем дальше тем более актуальна тематика болезни Альцгеймера. Улучшение медицины позволяет людям жить дольше. И люди доживают до прогрессирования болезни.
Остановить болезнь нельзя, повернуть ее вспять и вылечиться как от насморка также нельзя. Можно только лишь поступить самым мудрым и разумным способом, и до того как произошло развитие дегенеративных процессов, до того как ситуация стала тяжелой, до этого провести меры по предупреждению. Чем раньше сделаны действия, тем дешевле(по энергии, времени, труду, деньгам) предотвращение негативных последствий.

Да и само по себе данное заболевание любопытно как феномен, так как затрагивает весь мозг. Причины его возникновения выходят далеко за пределы одной лишь нервной системы. В следующей статье собраны материалы по БА - болезни Альцгеймера.

+34

arturdumchev Jan 18 at 13:18

Заговор разработчиков против корпораций

Medium

15 min

52K

Kotlin*Java*Programming*Perfect code*Studying in IT

Opinion

Речь пойдет о тайной, сугубо анонимной организации, следы которой начал замечать еще в 2018-ом, работая в Яндексе. О целях и мотивах организации можно только догадываться: некоторые считают это кибер-луддизмом, другие — техно-анархизмом. Ясно одно: организация существует, ее члены уничтожают кодовые базы десятилетиями, и говорить об этом не принято.

Читать далее на свой страх и риск

+165

212

LeonidFirstov Apr 17 2020 at 16:31

Человек в бутылке

5 min

39K

Learning languages

В детстве читал рассказ Г. Майринка с таким названием. Восточный князь организовал в европейском городке представление. По сюжету известный всей публике житель городка находится на сцене в большой бутылке. Довольно быстро он начинает делать публике какие-то знаки, махать руками. Стёкла бутылки искажают черты его лица, получается очень смешно. Публика умирает со смеха, князь сидит на бутылке. Скоро человек в бутылке падает на дно и затихает. Князь ускользает в удобный момент, публика пытается понять, что это было. Оказалось, что в бутылку не поступал воздух. Их знакомый умер. У них на глазах. Знаками пытаясь объяснить, что нечем дышать. А они все при этом покатывались со смеху.

Little did I know, что сам попаду примерно в такую же ситуацию. Будучи честным преподом, годами пытался с помощью своих статей воевать с продуктами жизнедеятельности сотен языковых школ – застрявшей в головах людей рекламной демагогией. Кричал, махал руками… Часто не хватало авторитета заставить прочитать даже людей, изучающих английский. Печально, конечно, что в 21-м веке эти вещи всё ещё приходится объяснять, а люди, часто даже неглупые, продолжают вестись на чудодейственные методики, «снять языковой барьер» и прочий английский с носителями…

Читать дальше →

+42

404

Sivchenko_translate Jan 4 at 22:13

Можно ли уместить игру Minecraft всего в один QR-код?

15 min

24K

Programming*Abnormal programming*Entertaining tasksC*Java*

Translation

Ответ: да! И вот же он:

Игра запускается, и вы можете перемещаться по миру 64x64x64 при помощи клавиш WASD. Пробелом прыгаем, мышью осматриваемся. Щёлкнув левой кнопкой мыши, можно разрушить блок, а правой — установить землю.

Можно просмотреть QR-код при помощи следующей команды под Linux:

zbarcam -1 --raw -Sbinary> /tmp/m4k &&chmod +x /tmp/m4k && /tmp/m4k

-1: выйти после того, как код будет просканирован

--raw: не обрабатывать его как текст

--Sbinary: воспользоваться двоичной конфигурацией

Проект выложен на GitHub здесь:TheSunCat/Minecraft4k

+110

NeyroEntuziast Jan 2 at 08:35

40 лучших ИИ-инструментов 2025 году (проверенные и протестированные)

Easy

8 min

77K

Artificial IntelligenceThe future is here

Digest

Translation

Вам надоели шаблонные списки ИИ инструментов, которые читаются так, будто их написала нейросеть? Мне тоже. Поэтому я с головой окунулся в мир ИИ, и нашел настоящие жемчужины. Это не просто очередная статья, это мой личный опыт. Приготовьтесь узнать об ИИ-инструментах, которые действительно изменят вашу жизнь (или хотя бы сделают ее немного проще).

Я потратил несколько недель, изучая десятки ИИ-инструментов в 20 категориях, от чат-ботов, которые кажутся до жути живыми, до музыкальных генераторов, сочиняющих меланхоличные фортепианные баллады. Моя цель? Дать вам честную, неискаженную правду о том, какие инструменты стоят вашего времени и денег.

+30

pureacetone Dec 30 2024 at 15:14

OpenVPN & i2pd: VPN через I2P (часть 2)

8 min

21K

I2P*Information Security*Network technologies*Remote work

Tutorial

В предыдущей статье я описал как сконфигурировать wireguard для работы через I2P. Эту статью можно считать копией с тем отличием, что будем использовать OpenVPN.

Желание попробовать OpenVPN в конфигурации "VPN over I2P" не случайно: в i2pd работа с TCP-туннелями сделана на порядок лучше, чем с UDP (wireguard работает как раз по этому протоколу). При стандартном использовании wireguard намного привлекательнее древнего OpenVPN, но в контексте i2pd и работы с TCP-туннелями, OpenVPN показал отличные результаты: несколько суток стабильной работы с просмотром видео и прочими бытовыми нагрузками не выявили ни единого разрыва.

Ну-ка ну-ка

+24

vltnmmdv Dec 13 2024 at 08:29

Сбер выкладывает GigaChat Lite в открытый доступ

Medium

18 min

25K

SberDevices corporate blogСбер corporate blogMachine learning*Artificial IntelligenceOpen source*

Review

Салют, Хабр! В начале ноября мы делились с вами новостями о нашем флагмане GigaChat MAX и пообещали рассказать подробнее о процессе создания наших Pretrain-моделей. Пришло время сдержать слово и даже пойти дальше!

Предобучение больших языковых моделей — это одна из наиболее ресурсозатратных стадий, которая непосредственно влияет на весь дальнейший процесс обучения GigaChat. От успешности обучения Pretrain-модели напрямую зависит качество всех следующих этапов обучения, например, Alignment и Vision. Поэтому сегодня мы хотим поделиться весами младшей модели линейки GigaChat версий base и instruct. Модель называется GigaChat-20B-A3B, так как построена на перспективной МоЕ-архитектуре!

Но и это ещё не всё. Вместе с весами мы делимся с сообществом улучшенной реализацией DeepSeek МоЕ, а также кодом для механизма концентрации (а что это такое — читайте дальше ;)). Важно отметить, что хотя GigaChat-20B-A3B обучался на триллионах токенов преимущественно русского текста, он ещё способен на хорошем уровне понимать другие языки. Так что мы делимся мультиязычной моделью. О том, как запускать модель, какие версии доступны и как пользоваться контролируемой генерацией с помощью механизма концентрации, расскажем прямо сейчас!

Узнать что такое MoE

+74

LightTool Dec 12 2024 at 15:04

Еще один монитор CO2 без датчика CO2

5 min

34K

GadgetsHealthEcologyReverse engineering*

Там, где что-то стоит дорого и по определению не может стоить дешевле, ушлые производители обязательно предложат «полноразмерный макет» за полцены. Подобными «макетами» домашних мониторов CO2 много лет забиты все маркетплейсы.

Но тут история иная. Во-первых, цена как у реальных приборов. Во-вторых, это не абсолютный ноунейм. И в-третьих – производитель открыто заверяет, что установлен дорогой инфракрасный датчик. Так почему бы не попробовать?

Под катом небольшой рассказ про все эти датчики и пара советов, как не промахнуться.

+187

164

full_moon Dec 3 2024 at 11:21

Gemini вырывается вперед, Китай спамит моделями, в Minecraft запустили AI-агентов: главные события ноября в сфере ИИ

Medium

13 min

4.1K

Magnus Tech corporate blogMachine learning*Artificial IntelligenceProgramming*Popular science

Digest

Последний месяц выдался особенно насыщенным для мира ИИ: OpenAI неожиданно устроила открытую сессию вопросов-ответов на Reddit и рассказала о своих планах, Google с новой версией Gemini возглавила основные рейтинги, а китайские компании DeepSeek и Alibaba представили модели, способные конкурировать с нашумевшей o1 в области рассуждений.

Мы собрали главные новости, исследования и релизы ноября: от амбициозных планов xAI по строительству суперкомпьютера на 100 000 GPU до неожиданных новостей из области квантования больших моделей. Новые инструменты от технологических гигантов, свежие научные работы и интересные открытия — в нашем новом выпуске ИИ-дайджеста!

+28

2 3 ...

26 27