Все потоки
Поиск
Написать публикацию
Обновить
765.13

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Я делал концепции зданий 12 лет, а потом пришла нейросеть

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров22K

Эту историю для моего блога рассказал архитектор-концептуалист Александр Гаст

Я работаю удаленно над архитектурными проектами от Приморья до Петербурга.  Проектирую и частные дома, и комплексные планы развития городских районов. За последний год нейросети стали частью моего рабочего процесса. Расскажу, где ИИ помогает, а где создает проблемы.

Читать далее

Как студент MIT ускорил реставрацию картин с помощью ИИ и полимерных масок

Время на прочтение5 мин
Количество просмотров1.5K

Реставрация старых картин — процесс, требующий и художественного чутья, и усидчивости. На восстановление одного полотна уходят месяцы и даже годы. Алекс Качкин, аспирант Массачусетского технологического института (MIT), предложил метод, который использует искусственный интеллект и полимерные маски для быстрого и обратимого восстановления поврежденных произведений искусства. Его разработка, описанная в журнале Nature, обещает вернуть к жизни тысячи картин, спрятанных в запасниках музеев.

Читать далее

Режим ночной съемки: три алгоритма улучшения мобильных фотографий

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров4.5K

Привет, Хабр! Меня зовут Полина Лукичева, я инженер команды AI ML Kit в YADRO. Наша задача — улучшить ночной режим камеры в планшете KVADRA_T. В статье я расскажу об основных ограничениях камеры мобильного устройства при съемке в условиях низкой освещенности, а также поделюсь алгоритмами, с помощью которых можно получить качественный снимок даже в темноте.

Читать далее

OpenAI взимает оплату поминутно, так что сделаем минуты короче

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.8K

Я имею в виду буквально. Перед транскрибацией увеличьте скорость аудио в два или в три раза в ffmpeg. Благодаря этому вы потратите меньше токенов и вам придётся меньше ждать, а качество транскрипции почти не снизится.

Вот и всё!

Ниже показан скрипт, сочетающий все мои трюки для выполнения этой задачи. Для его работы необходимо установить yt-dlpffmpeg и llm.

Я сэкономил вам время, сразу перейдя к делу, но если вы хотите подробностей истории о том, как я случайно обнаружил этот способ, пытаясь создать краткое изложение сорокаминутного доклада Андрея Карпаты, то продолжайте чтение.

Вам стоит продолжить чтение, если вы недоумеваете, почему я просто не воспользовался встроенной автотранскрибацией YouTube. Краткий ответ будет таким: я недотёпа, считавший (ошибочно), что она недоступна. Поэтому мне пришлось идти по более сложному пути.

Читать далее

Прокачаться в data science: блоги и каналы

Время на прочтение7 мин
Количество просмотров6.3K

Делимся блогами, посвященными машинному обучению и data science. Материалы от практикующих дата-сайентистов, программистов, физиков и биоинформатиков будут интересны как начинающим, так и «прожженным» специалистам.

Читать далее

Вселенная OpenAI: полный путеводитель по семейству моделей GPT в 2025 году

Время на прочтение12 мин
Количество просмотров5K

(версия статьи актуальна на 26 июня 2025 года)

OpenAI за несколько лет превратила ChatGPT из экспериментального проекта в полноценного цифрового помощника, который умеет не только писать тексты, но и думать, видеть, слышать и даже спорить. Это стало настоящим поворотным моментом в истории ИИ и индустрия вошла в новый цикл развития. Появились тысячи приложений на базе LLM, десятки компаний сменили стратегию, а работа с языковыми моделями стала повседневной реальностью.

Новые версии выходят регулярно, и если вы чувствуете себя потерянными в этом потоке, то вы не одиноки. Мы специально подготовили этот материал, чтобы рассказать обо всех ключевых GPT-моделях и сопутствующих инструментов OpenAI, чем они отличаются и какую из них выбрать для своих задач.

Читать далее

Как построить безопасный MLOps-pipeline: Tier-уровни зрелости, принципы и реальные инструменты

Уровень сложностиСредний
Время на прочтение20 мин
Количество просмотров1.3K

На практике продакшен-модели чаще всего «падают» из-за трёх вещей: несоответствие с инфраструктурой, дрейфа данных, и ошибочного отката/обновления версии.
Единый гайд по безопасной разработке ML-моделей — от хаотичного до полностью автоматизированного уровня зрелости.

Что внутри:

Как применять Infrastructure-as-Code для ML-кластеров и не оставлять открытые порты;

Зачем даже маленькой команде нужен Feature Store и как избежать training-serving skew;

Где прячутся CVE в ML-библиотеках и как их ловить до релиза;

Канареечный деплой с авто-откатом по метрикам и разумными порогами;

мониторинг дрейфа данных и качества модели в реальном времени;

Чек-лист DevSecOps: от тега в Model Registry до регулярных Model Review.

Материал поможет выстроить MLOps-процесс, устойчивый к атакам и сбоям, не превращая релизы моделей в ночной марафон.

Читать далее

Как нанимаем, грейдируем и решаем типовые задачи prompt-инженеров в Точке

Время на прочтение8 мин
Количество просмотров3.7K

Два года назад в Точке появилась новая роль — prompt-инженер. Первые полгода инженеры работали над разными кейсами: от классификации данных до разработки AI-ассистентов. Для этого пригодился опыт и маркетолога, и копирайтера, и инженера АСОИУ. Ещё prompt-инженеры участвовали в генерации синтетических данных для коллег из ML — для этого важно было понимать основы Data Science. 

Привет! Меня зовут Екатерина Шихиева, я лидер prompt-инженеров в Точке. Из-за обилия задач и проектов процесс найма промптеров почти не останавливается. Сейчас у нас отлажен подбор кандидатов, грейдирование и внутренний менторинг — но в этих процессах всё не так просто. Об этих подводных камнях и нюансах расскажу в статье.

Читать далее

Дело о похищенном рюкзаке: SQL, сложность и слепая вера в ИИ

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров1.5K

1. Тревожный звонок

Был хмурый лондонский вечер, когда в нашу скромную квартиру на Бейкер-стрит ворвался взволнованный инспектор Лестрейд.

— Холмс! Нам срочно нужна ваша помощь! — воскликнул он, сбрасывая с плеч дождевик. — В городе орудует хитрый вор. Он крадёт предметы, но уносит их только в одном рюкзаке ограниченной вместимости. Нам нужно вычислить, какие именно вещи он унесёт, чтобы максимизировать свою добычу!

Читать далее

Глубокое обучение для квантовой химии. Часть II. Предсказание электронной плотности

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров2.5K

Всем привет! На связи снова Константин Ушенин из AIRI, и мы продолжаем говорить о глубоком обучении в квантовой химии. В прошлом посте мы немного разобрались в том, что такое молекула, как её представлять в компьютере, и как работают графовые нейронные сети.

В этот же раз я расскажу о том, какие результаты в этой области получила наша команда. Речь пойдет о новой архитектуре для предсказания электронной плотности LAGNet, про которую у нас недавно вышла статья в Journal of Cheminformatics [1]. Мы применили несколько интересных усовершенствований к модели DeepDFT, что позволило в 8 раз снизить требование к объёму необходимых данных и в целом сделало выучивание плотности более эффективным.

Но обо всём по порядку.

Восстание машин 2025: я изучил реальные риски со стороны нейросетей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров4.3K

Сегодня я хочу рассказать о темной стороне ИИ, а именно — о ситуациях, когда нейросети вступают в конфронтацию с операторами, индексе риска ИИ, и в чем действительно заключается угроза со стороны условных «машин». 

Начну с двух интересных кейсов о том, как нейросети спорили со своими операторами.

Читать

Внимание! Механизм внимания в трансформерах оказывается не таким уже незаменимым

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров1.4K

Механизм внимания в трансформерах, который уже много лет “is all we need”, оказывается не таким уже незаменимым. 

Это, конечно, не очень правдивый заголовок, но зато привлекает внимание. На самом деле речь пойдет о различных попытках заменить или хотя бы облегчить механизм внимания в трансформерах. Он во многом обеспечил успех моделей последних лет, но он же остается одним из узких мест. Дело в квадратичной сложности вычислений, из-за которой приходится ограничивать размеры входной последовательности. Ну и вообще, несмотря на все преимущества внимания, хотелось бы, чтобы оно, как основной двигатель моделей, было более экономично. 

Читать далее

Компьютерное зрение в сельском хозяйстве

Время на прочтение7 мин
Количество просмотров2.3K

Интеллектуальные системы, основанные на компьютерном зрении, проникли практически во все сферы жизни современного человека. Эти системы объединяют компьютерное зрение, искусственный интеллект (ИИ) и технологии машинного обучения и позволяют машинам имитировать зрительные и когнитивные способности человека для принятия обоснованных решений по поставленной задаче. Технология компьютерного зрения используется для обработки и интерпретации визуальной информации из окружающей среды, а технологии искусственного интеллекта (ИИ) вместе с алгоритмами машинного обучения применяются для распознавания закономерностей и прогнозирования действий. Эти интеллектуальные системы улучшают производительность за счет обучения с течением времени.

В этой статье мы рассмотрим использование компьютерного зрения в земледелии. Мы рассмотрим различные этапы так называемого цифрового сельского хозяйства, включая получение изображений, объединение и анализ изображений, принятие решений с помощью машинного обучения.

Читать далее

Ближайшие события

Hello self driving world! (Carla Simulator) — часть 1

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.7K

Друзья, всем привет! С каждым днем на дорогах становится все больше беспилотных автомобилей. Waymo уже обошел Lyft по количеству поездок в Сан-Франциско и подбирается к Uber. В Нью-Йорке, Шанхае и Москве можно увидеть сотни машин с датчиками на крыше. Как они работают? Что за магия приводит их в движение? 

Давайте погрузимся в мир Self-driving, рассмотрим основные компоненты и модули беспилотного автомобиля. А чтобы путешествие было более интересным — напишем свой беспилотник на Python в симуляторе Carla (UE4). В начале он будет просто стоять на месте, а в конце сможет ехать по маршруту и останавливаться перед препятствиями. Пристегивайтесь, мы отправляемся в путь!

Читать далее

Почему сознание нельзя запрограммировать (критика механистических теорий сознания)

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров7.4K

Когда я общаюсь с разработчиками, работающими с современными LLM, часто слышу: "С GPT-4 происходит что-то странное. Это не просто автокомплит. Но и не человек. Что это?"

У многих есть интуитивное ощущение, что мы стоим на пороге чего-то большего, чем "статистические попугаи". Но в то же время что-то подсказывает: просто добавить еще параметров недостаточно.

Эта интуиция может оказаться верной. Но по причинам, которые глубже, чем кажется. Представьте: вы пытаетесь создать живую птицу, крутя ручку музыкальной шкатулки всё быстрее и быстрее. Проблема не в скорости вращения. Проблема в том, что вы пытаетесь получить одну категорию вещей из совершенно другой.

Сейчас я покажу вам четыре фундаментальных барьера, которые объясняют, почему ваши ощущения о современном ИИ могут быть правильными — и почему это открывает совершенно новые возможности.

Барьер первый: Рекурсивный парадокс (теорема Гёделя). В 1931 году математик Курт Гёдель доказал то, что должен знать каждый программист: любая система, достаточно сложная для работы с числами, неизбежно неполна. В ней всегда есть истинные утверждения, которые она не может доказать о себе.

Это не баг — это фича реальности.

Попробуйте написать программу, которая отвечает на вопрос: "Остановится ли эта программа?" Классическая проблема остановки. Если программа отвечает "да" — она остановилась, ответ верен. Если "нет" — тоже остановилась, ответ неверен. Если висит — не остановилась, подтверждая "нет".
Система не может полностью "отрефлексировать" саму себя без выхода на метауровень.

Читать далее

Speaker Recognition. Как искать человека по голосу

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Поговорим про задачу Speaker Recognition. О том, как работает такая система, из каких этапов состоит, как мы ее оцениваем.

Читать далее

Что такое NER, зачем он нужен и когда не поможет

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.2K

Про NER написано немало, но этот материал носит прикладной характер. Статья будет полезна тем, кто интересуется NLP и ищет разные подходы для решения узкопрофильных задач, требующих извлечения сущностей из текста.

Для джунов это возможность пройти весь путь — от разметки данных до обучения собственной кастомной NER-модели, попутно понять типичные сложности и ограничения.

Привет, меня зовут Александр Агеев, на протяжении года я занимался NER-моделями для определения сущностей на этикетках продуктов питания. Несмотря на мою любовь к NER, у этой технологии есть свои границы — кейсы, которые она не может решить хорошо, поэтому надо подключать другие инструменты. В статье я дам критерии применимости NER для решения практических задач.

Читать далее

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

Уровень сложностиСредний
Время на прочтение58 мин
Количество просмотров2K

Разрабатываем и растим «цифрового губера» - консультанта по вопросам государственного политического управления, демографии и миграции. Решаем задачу оптимизации экономики и миграционной политики для устойчивого демографического роста в 89 регионах с помощью   взаимодействующих друг с другом и обменивающихся опытом ИИ-агентов, на основе мутаций, скрещивания и эволюции.   Мультиагентное обучение,  Multi-Agent Deep Deterministic Policy Gradient и Darwin Gödel Machine.

Читать далее

Что же такое TPU

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров16K

В последнее время я много работал с TPU и мне было интересно наблюдать такие сильные различия в их философии дизайна по сравнению с GPU.

Главная сильная сторона TPU — это их масштабируемость. Она достигается благодаря и аппаратной (энергоэффективности и модульности), и программной стороне (компилятору XLA).

Общая информация

Если вкратце, то TPU — это ASIC компании Google, делающий упор на два фактора: огромную производительность перемножения матриц + энергоэффективность.

Их история началась в Google в 2006 году, когда компания впервые начала размышлять о том, что же ей стоит реализовывать: GPU, FPGA или специализированные ASIC. В те времена было лишь несколько областей применения, в которых требовалось специализированное оборудование, поэтому было решено, что потребности компании можно удовлетворить при помощи незадействованных вычислительных ресурсов (compute) CPU её крупных датацентров. Но в 2013 году ситуация изменилась: функция голосового поиска Google начала использовать нейросети, и по расчётам для её реализации потребовалось бы гораздо больше compute.

Перенесёмся в настоящее: сегодня TPU лежат в основе большинства ИИ-сервисов Google. Разумеется, сюда включены обучение и инференс Gemini и Veo, а также развёртывание моделей рекомендаций (DLRM).

Давайте начнём разбирать внутренности TPU с самого нижнего уровня.

Читать далее

Компьютерное зрение для начинающих

Время на прочтение7 мин
Количество просмотров8.4K

Тема компьютерного зрения наряду с искусственным интеллектом в последние годы стала очень популярной. Сегодня компьютерное зрение — это динамичная и быстро развивающаяся область, постоянно расширяющая границы того, что могут видеть и понимать машины.

Однако, зачастую многие публикации посвященные computer vision являются достаточно сложными для тех, кто только погружается в данную тему.

В этой статье мы поговорим о том, как все это работает и какие основные технологии и алгоритмы используются. Мы не будем глубоко погружаться в вопросы, связанные с реализацией методов компьютерного зрения, так как задача этой статьи объяснить основные принципы.

Читать далее

Вклад авторов