Articles / Bookmarks / Profile of ideological / Habr

@ideological

Интересуюсь природой вещей

ProfileArticlesPostsNewsComments340

AA_VA Dec 12 2024 at 11:52

Homo clickus. Как моделирование кликающих людей пригодится для сегментации изображений

Hard

13 min

1.1K

AIRI corporate blogImage processing*Machine learning*Artificial IntelligenceAlgorithms*

Case

Приветствую всех читающих!

Меня зовут Антон Антонов, я инженер по искусственному интеллекту, работаю в Институте искусственного интеллекта AIRI в команде, которая занимается Embodied AI — областью, связывающей робототехнику, компьютерное зрение и большие языковые модели.

Недавно наша группа получила приятное известие: нашу статью с описанием модели того, как люди кликают и тапают на картинки, приняли на грядущий NeurIPS! Она будет полезна, чтобы тестировать модели интерактивной сегментации, которые помогают автоматизировать и ускорить процесс разметки изображений человеком.

Ниже я хотел бы подробнее рассказать о нашей разработке.

Кликнуть

Erwinmal Dec 14 2024 at 09:01

От рамэна к «дошираку»: как китаец проапгрейдил национальное блюдо и создал главное японское изобретение ХХ века?

Easy

12 min

21K

RUVDS.com corporate blogHistory of ITReading room

Retrospective

Кто из нас ни разу не ел лапшу быстрого приготовления? Пожалуй, таких людей в наши дни практически не существует. Конечно, реноме у неё несколько неоднозначное, да и возможное влияние на здоровье вызывает сомнения — но бывает, что в завале и аврале без неё никак. Ну, и ныне почти в любом магазине можно увидеть широкий ассортимент вкусов и вариантов, в том числе давно не относящихся к категории «бич-пакетов» ни по качеству, ни по цене. Лапша быстрого приготовления, созданная в Японии в 1958 году на основе отнюдь не японского блюда, к началу XXI века окончательно покорила мир — и теперь японцы считают её главным национальным изобретением ХХ столетия, более важным, чем компьютерные дискеты, аудиоплееры, аниме и караоке. А виновен в этом человек необычной и непростой судьбы: Андо Момофуку. Он же — Го Пекхок.

Читать дальше →

+114

DiTsi Dec 9 2024 at 21:12

IMPulse — наш взгляд на менеджмент инцидентов

Medium

7 min

2.7K

DevOps*IT Infrastructure*Open source*Python*System administration*

Case

Если ваша компания всё ещё не использует средства для менеджмента инцидентов, а утопает в обычных алертах из Alertmanager'а, эта статья для вас. Если ваша компания из-за санкций или соображений безопасности не может отправлять алерты в зарубежные системы менеджмента инцидентов, эта статья для вас. Если вы DevOps и уже изрядно намучились с поиском подобного решения (как я) - статья и для вас тоже.

В статье мы презентуем наше open source решение для работы с алертами.

Приглашаю всех заинтересованных под кат.

Bright_Translate Dec 8 2024 at 09:13

Элегантная математика фильтров Блума

Medium

7 min

15K

RUVDS.com corporate blogMathematics*Algorithms*Big Data*

Review

Translation

Вероятностные функции способны моделировать множество алгоритмов и процедур. Они помогают нам оптимизировать процессы для получения наилучших результатов. Опытные программные инженеры знают, что рано или поздно практически любое ПО достигает определённой степени недетерминированности, когда решение является не абсолютным, но при оптимальной конфигурации приближается к наилучшим результатам. В математическом смысле подобное решение обычно сводится к поиску минимума, максимума или пределов неких вероятностных функций.

В этой статье речь пойдёт об изяществе математики, лежащей в основе фильтров Блума. Мы разберём аспекты точности работы и компромиссов при конфигурировании этих фильтров, а также узнаем, почему в некоторых случаях они могут стать отличным выбором, особенно в сфере больших данных и системах OLAP, когда подразумевается обработка огромных и статичных датасетов.

Читать дальше →

+62

Ologos Dec 8 2024 at 17:49

Как я взломал одну из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи

Medium

33 min

22K

Information Security*Artificial IntelligenceMachine learning*Programming*Popular science

Case

Я — простой студент, который обучается по направлению «Информационная безопасность». Так вышло, что по программе мне нужно было написать научную статью по теме ИБ. Будучи авантюристом я выбрал тему, которая была мне ближе и интереснее... и так получилось, что в пылу энтузиазма я немного перевыполнил свой план. К сожалению, я был ограничен в объеме по написанию научной статьи, и много интересного материала пришлось вырезать или сократить. Поэтому, тут я хотел бы написать полную версию моей статьи, во всяком случаи, какой я бы хотел ее видеть.

Как итог - у меня получилось полностью снять защиту в современной и защищенной языковой модели, и написать программу которая это автоматизирует. Эта модель признана одной из лучших.

+62

andrey_bogomolov Dec 5 2024 at 14:10

Как мы сделали клиентскую поддержку интернет-магазина действительно умной: опыт внедрения RAG-бота

Medium

5 min

3.2K

Artificial IntelligenceMachine learning*CRM systems*Programming*

From sandbox

Привет! Я — Андрей Богомолов, сооснователь и технический директор GenAI Lab.

Сегодня я расскажу, как мы превратили поддержку клиентов одного интернет-магазина в «умного» помощника. Это не просто бот, а инструмент, который понимает запросы пользователей, отвечает естественно и, самое главное, всегда знает актуальную информацию. Начнём с проблем, с которыми столкнулся наш клиент.

dio_eraclea Nov 19 2024 at 08:05

Самодельные радиолампы: второй заход

Easy

15 min

14K

Timeweb Cloud corporate blogDIY

Review

✏️ Technotext 7

В предыдущей статье я рассказал про вакуумную установку, в этот раз будем делать сами лампы. Ведь для этого уже всё есть? Как бы не так.

Там много картинок

+113

aledovskiy Nov 19 2024 at 20:39

Как я учился писать промпты для RAG пайплайна. Разбор 3-го места на AI Journey 24 E-com AI assistant

Medium

7 min

6.3K

Natural Language Processing*Artificial IntelligenceMachine learning*

Я занимаюсь классическим ML, как это теперь принято называть. Делаю продвижение в поиске и рекомендациях Авито (и еще пишу в канал Big Ledovsky). Работа, признаюсь, интересная, и очень мне нравится. Однако этот хайп вокруг LLM.. Да даже не хайп, а просто бытовой опыт использования LLM говорит: нужно разобраться в этой технологии, это серьезный прорыв в отрасли.

И вот в преддверии AI Journey выложили соревнование, где нужно было построить ассистента для рекомендации товаров Мегамаркета, а в качестве модели использовать Gigachat через API. Я решил, что время поделать что-то руками настало. В итоге получилось нарешать на 3-е место.

Как человек, который первый раз делал RAG пайплайн, я получил много инсайтов и интуиции, которыми хочу поделиться. Всем заинтересованным добро пожаловать под кат.

+11

despair Nov 13 2024 at 11:07

Словарь программистского жаргона без англицизмов

Easy

16 min

19K

Programming*

Review

Часто можно встретить словари «программистского жаргона», однако они как правило на 90% состоят из англицизмов. Это не так интересно, поскольку англицизмов можно создать бесконечное количество и они появляются новые каждый день пачками.

Мне интересно было составить «чисто русский словарь», состоящий в основном из омонимов, то есть слов, использующихся в ином значении.

Дополнения и правки приветствуются :-)

Огласить весь список

+37

bartov-e Dec 2 2023 at 13:23

Краткий обзор техник векторизации в NLP

Easy

21 min

30K

Natural Language Processing*Python*

Review

Translation

Как переводчик-редактор, я интересуюсь темой NLP и автоматизации рутины бюро переводов. Изучая вопрос того, как смысл слов превращается в векторы, наткнулся на эту обзорную статью. Статья мне показалась изложенной доступно, поэтому я перевел ее для удобства других коллег. Работоспособность большей части кода проверял, вроде работает (см. Jupiter Notebook). Надеюсь, будет полезно.

===

Технологии NLP — Natural Language Processing, обработки естественного языка — позволяют компьютерам обрабатывать человеческий язык, понимать его значение и контекст, а также связанные с ним эмоциональную окраску и намерения, и далее, использовать эти данные для создания чего-то нового.

Как сделать слова понятными для компьютеров? Используется векторизация. Рассмотрим несколько техник такой векторизации.

+15

s231644 Nov 8 2024 at 13:50

Понимают ли большие языковые модели данные из таблиц?

Medium

7 min

7.8K

SberDevices corporate blogNatural Language Processing*Machine learning*

Case

Всем привет! С вами команда IDP. Сегодня расскажем о том, как мы оцениваем языковые модели для ответов на вопросы по таблицам.

Наша команда занимается интеллектуальной обработкой документов, и мы нередко сталкиваемся с документами, содержащими таблицы. Человек обычно анализирует их, опираясь на геометрию и визуал (границы ячеек, выделение заголовков, выравнивание текстов в ячейках). Таблицы — это двумерные объекты, языковые модели же работают с одномерными последовательностями токенов. Это наталкивает на вопрос: а насколько хорошо LLM справляются с анализом таблиц в документах?

Мы заинтересовались этой темой неслучайно — в одном из проектов мы работали над вопросно‑ответной системой для технической документации. Большинство вопросов относилось именно к таблицам, причем таблицы были достаточно сложными, с длинными названиями столбцов, формулами и многоуровневыми заголовками. В один момент мы уперлись в потолок по метрикам и тогда решили провести более тщательное исследование.

+26

MadFisherman Jan 12 2024 at 07:51

История одного изобретения и личный опыт патентования. Просто о сложном

Easy

29 min

3.4K

The future is hereChemistryNanotechnologiesPopular science

From sandbox

Немного научно-познавательная, немного практическая статья об одном из изобретений в сфере новых способов получения мононитей из полимерных материалов и моих попытках его реализации и патентования.

+19

TheScienceVictor200 Nov 2 2024 at 15:16

Учимся делать игры без pygame: Введение в графический интерфейс на Python

Easy

2 min

12K

Programming*Python*

Tutorial

Привет, Хабр! Сегодня мы научимся делать графический интерфейс на python, используя Tkinter. Эта статья очень короткая, так как мы только начинаем.

Tkinter — это стандартная библиотека для создания графических интерфейсов в Python. Она предоставляет простой и удобный способ создания оконных приложений с использованием виджетов, таких как кнопки, метки, поля ввода и многое другое. В этой статье мы рассмотрим основные концепции Tkinter и создадим простое приложение.

MadFisherman Nov 2 2024 at 12:18

Устройство для получения нити (филамента) без экструдера. Новости подпольной лаборатории

Medium

9 min

10K

3D printersDIYChemistry

Итак, приступим. Прежде всего, считаю необходимым заметить, что устройство выполняет функцию лабораторной установки.

+30

Vsevo10d Oct 21 2024 at 13:15

Идет расследование беспрецедентного по масштабам подлога в исследованиях нейродегенерации

Medium

19 min

32K

BiologyBrainHealthPopular science

Translation

Падение на дно профессиональной этики титана исследований шокировало научное сообщество. Невропатолог Элиезер Маслия, автор более чем 800 научных статей, специалист с мировым именем в изучении α -синуклеина (белка, играющего важную роль в патогенезе болезней Альцгеймера и Паркинсона), обвинен в фальсификации изображений в публикациях на протяжении 26 лет.

26 сентября 2024 Национальный институт старения (NIA) объявил о снятии Маслия с должности научного директора Отдела нейронаук после девятимесячного внутреннего расследования, заключившего: «в двух публикациях обнаружены фальсификация и/или фабрикация данных, выражающаяся в повторном использовании одних изображений для иллюстрации результатов различных экспериментов».

В тот же день журнал «Science» опубликовал расследование репортера Чарльза Пиллера и команды аналитиков изображений, которые подготовили 286-страничный отчет по 132 статьям с дублированными или подделанными изображениями. Все результаты авторы выложили для peer-review по ссылке.

+144

164

lelyakuznetsova Oct 9 2024 at 14:38

Обучение GigaChat с контекстом в сотни тысяч токенов

Medium

13 min

4.3K

JUG Ru Group corporate blogArtificial IntelligenceMachine learning*Conferences

Помните фразу «640 килобайт памяти хватит всем»? Запросы человечества вечно растут, а индустрии надо поспевать.

Вот и с языковыми моделями так. Ещё недавно мы все удивлялись тому, на что они стали способны. А теперь нам этого мало: «ну хорошо, а может модель в диалоге учитывать то, что я сказал сотни реплик назад?»

Весной на нашей конференции I'ML Евгений Косарев (SberDevices) рассказал о том, как к увеличению контекста подошли при работе над GigaChat. А сейчас мы публикуем текстовую расшифровку его доклада. Ссылки на его видеозапись тоже прилагаем: YouTube, VK Видео.

+18

badcasedaily1 Mar 11 2024 at 17:56

Кратко про протоколы взаимодействия в микроконтроллерах: SPI, IDC, UART, CAN

Easy

10 min

27K

OTUS corporate blogProgramming microcontrollers*

Review

Привет, Хабр!

Утренний будильник, кофеварка, микроволновка, телевизор, кондиционер – все они оборудованы микроконтроллерами. Микроконтроллеры управляют функциями устройства, обеспечивая пользовательский интерфейс и взаимодействие с другими устройствами. Микрокотроллеры также используются в автомобилях, к примеру для контроля работы двигателя или системы ABS. А в медицине практически все оборудование работает на микроконтроллерах.

Протоколы в микроконтроллерах позволяют устройствам «понимать» друг друга и работать вместе, создавая общую систему. Протоколы определяют, как устройства подключаются, обмениваются данными, синхронизируют действия, управляют форматированием, временем и последовательностью сообщений между микроконтроллерами и другими компонентами в системах.

В этой статье рассмотрим такие протоколы взаимодействия как SPI, IDC, UART, CAN

nneeoo Oct 9 2024 at 05:23

5 альтернатив TCP и UDP после блокировки Discord

4 min

41K

Development of communication systems*

Analytics

Дискорд отлетел вслед за ютубом. В этом материале я предлагаю вам 5 бесплатных альтернатив дискорду, на случай если заблокируют VPN, а затем террористический UDP и экстремистский TCP. Не ждем, а готовимся.

Я предлагаю вам 5 асинхронных способов общения. Синхронные способы общения как «повеселиться с друзьями», «сходить в церковь» и «посидеть на лавочке» мы не рассматриваем.

+116

Ulita_curl Oct 10 2024 at 08:25

Как дедуля Сунь-Цзы помогает в переговорах

Easy

6 min

12K

Альфа-Банк corporate blogProject management*Reading room

Opinion

Мой папа всегда был увлечён Китаем и китайской культурой. Например, когда мне было 16 лет, он ненавязчиво заменял журналы «Cool Girl» (Журнал для настоящих девчонок!) и «Все звёзды» (12 постеров и 2 суперпостера внутри!) на классические произведения китайской литературы.

Одной из подложенных папой книг был древнекитайский трактат Сунь-Цзы под названием «Искусство войны». Это небольшое по объёму, но плотное по панчам произведение, в котором мысли и рекомендации автора изложены в афористичной манере. Как будто на обложке Esquire Сунь-Цзы в бежевом кашемировом свитере и твидовых брюках-чинос, а внутри — «25 правил жизни китайского полководца».

Когда мне было 18 лет, бормоча про себя цитату «Война — это путь обмана», мне удалось: уговорить маму отпустить ночевать на дачу к одногруппникам, убедить, что чёрный оверсайз балахон — это модно и нарядно, и доказать родителям, что ещё одна собака дома — это не псарня, а гармоничный комплект.

А теперь перейдём от моего папы и его псарни к рассказу о том, зачем мудрость Сунь-Цзы нужна именно вам.

+48