Как стать автором
Обновить
1400.16

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Related Works в научной статье и диссертации. Зачем и как искать материалы

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров3.4K

В этой статье моей целью было дать краткий обзор интернет-ресурсов, которые могут помочь вам в поиске научных публикаций и их анализе. Перед обзором самих методов я также кратко излагаю, зачем нужен раздел Related Works и в чем его особенность в научных публикациях и диссертациях.

Читать далее

Вжух и идеальный кандидат найден: как мы сделали ИИ-сервис для рекрутеров

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5K

Привет, Хабр! Меня зовут Алексей, я развиваю направление искусственного интеллекта и машинного обучения в ГК Юзтех. В этой статье я расскажу о полезном инструменте для рекрутеров, который реализовала наша ML-команда. Теперь наши HR-специалисты не тратят кучу времени на поиск по фильтрам, а доверяют сервису, который за секунды выполняет поиск по базе из 300 000 кандидатов.

Про исследования и проблемы найма

Конкуренция на рынке труда достигает небывалых масштабов, крупные компании получают сотни, а порой и тысячи резюме на каждую открытую вакансию. Нагрузка на HR-отдел экстремальная, специалисты вынуждены вручную просматривать каждое резюме, анализируя опыт, навыки и соответствие требованиям вакансии.

По данным Хантфлоу скрининг резюме опытным рекрутером составляет около 5–10 секунд. Рекрутеру с меньшей осведомленностью понадобится около минуты. Несложно подсчитать, что, если на вакансию получено около 100 резюме, время на первичный отбор занимает от 15 минут до 100 минут. Однако, если рассматривать нестандартные вакансии по разработке узкоспециализированных систем, HR тратит около 10 минут на изучение, а это почти 17 часов на 100 резюме.

Немного о задаче

У нашей компании есть база данных, где хранится несколько сотен тысяч резюме кандидатов, сориентироваться в этой базе HR-специалисту достаточно сложно. Мы решили освободить наших коллег от рутинных операций поиска и разработать систему интеллектуального поиска резюме. Основные критерии для сервиса - удобство, быстрота и симпатичный интерфейс. Инструмент для поиска кандидата на вакансию должен значительно экономить время специалистов и делать их работу проще.

Читать далее

Анализируем продажи вместе с ИИ

Время на прочтение4 мин
Количество просмотров1.1K

Решение задачи анализа продаж с помощью искусственного интеллекта как нельзя лучше демонстрирует основной принцип работы с ИИ: «сказал, что тебе надо, получил что тебе надо». В типовых ERP(УТ, КА) есть регистр накопления «ВыручкаИСебестоимостьПродаж», в котором содержится вся необходимая нам информация о продажах. От реализации вышеозвученного принципа наст отделяет пара нехитрых технических приемов.

Читать далее

BotHub, GPTunnel, Chad AI — считаем где ChatGPT дешевле в России

Время на прочтение5 мин
Количество просмотров5.8K

Сейчас на фоне стремительной популяризации нейросетей, в России появилось достаточно много сервисов и агрегаторов, обеспечивающих удобный доступ к популярным языковым моделям без использования VPN. Однако при выборе подходящего решения мы зачастую сталкиваемся с проблемой разношерстной тарификация: у одних внутренняя валюта, у других стоимость за слова, третьи считают символы или количество токенов в запросе.

Подобное разнообразие систем оплаты затрудняет объективное сравнение экономической эффективности различных платформ. И дабы решить эту проблему, мы провели свое небольшое исследование, унифицировав все расценки к единому показателю — стоимости в рублях за миллион токенов. Для обеспечения точности сравнения мы использовали официальный токенизатор OpenAI — tiktoken.

Приятного прочтения!

Читать далее

Гибридный Claude 3.7 Sonnet, ребрендинг OpenAI: главные события февраля в сфере ИИ

Время на прочтение22 мин
Количество просмотров3.8K

Марафон ИИ-гигантов постепенно превращается в настоящий спринт. Anthropic наконец-то проснулась от спячки и вернулась в строй, выпустив достойного конкурента для OpenAI и DeepSeek. Google также ворвался с целой пачкой свежих моделей Gemini 2.0. Ну и конечно же, релиз GPT-4.5 под конец месяца как вишенка на торте.

На фоне этой гонки вооружений особенно любопытно наблюдать за «побочными эффектами»: от сразу нескольких инструментов Deep Research до прорывных чипов из новых типов материалов. 

Рассказываем, какими событиями был наполнен самый короткий месяц года. Спойлер: будет много интересного!

Читать далее

Нужны ли малому бизнесу нейросети?

Время на прочтение6 мин
Количество просмотров2.6K

Первый раз про нейросети в CRM я услышал в 2017 году в кулуарах очень большой конференции. Тогда один из российских вендоров вполне здраво рассуждал, что скоринг сделок — это по сути и есть нейросеть: распределение, вероятность, Байес, все дела. Правда, налицо была проблема обучения моделей на реальных данных, потому что структура и организация продаж от компании к компании разные, вплоть до совсем уж экзотики типа агрессивных продаж. Да и данные даже довольно больших компаний слишком малы для обучения более или менее толковой нейросетки. 

Но хорошо помню, что уже тогда мне подумалось, сколько маркетинга будет вокруг нейронок и ИИ в бизнес-приложениях. И вот прошло 8 лет, про ИИ мы слышим из каждого утюга, много где он стал маркетингом и способом привлечения внимания к продукту, но вот CRM (как и другие бизнес-приложения) с нейронкой особо не светятся. Да, на сайтах вендоров можно найти разные фичи с отсылками к искусственному интеллекту, кто-то прямо заявляет, что теперь банановый с нейросетью, но в целом — на редкость честное поведение. Даже с low code оно значительно хуже ;-)

Почему честное? Да потому что с нейросетями у малого и среднего бизнеса всё не особо складывается. Давайте погружаться.

Читать далее

От каскадных моделей до картинок в 4к: как эволюционировали диффузионки

Время на прочтение19 мин
Количество просмотров6.6K

На дворе 2025 год. Генерацией картинок и видео в интернете больше никого не удивишь. Генеративный контент повсюду, а его качество настолько высоко, что бывает трудно отличить синтетическую картинку от реальной.

Прогресс не стоит на месте, но какой ценой? Мир сильно усложнился со времён выхода первых моделей Stable Diffusion, подробные рассказы о которых описывали главную и до недавнего времени единственную доступную широкому кругу пользователей качественную открытую модель.

В прошлом году мы с коллегами рассказывали про то, как мы открывали и улучшали технологию YandexART. В этом посте мы хотели бы рассказать о том, что нового произошло в мире диффузионных моделей за последние два года. Ниже мы обсудим борьбу каскадной и латентной парадигм, дилемму между свёрточными моделями и трансформерами, новые формулировки диффузии и дистилляцию как метод решения основной проблемы диффузионных моделей — низкой скорости генерации.

Читать далее

Проблема Deep Research

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров5K

Deep Research компании OpenAI создан для меня, но я не могу им пользоваться. Это ещё одно потрясающее демо, увы, поломанное. Но ломается оно очень интересным образом.

По большей мере я зарабатываю на жизнь исследованиями и анализом. Я думаю о данных, которые хочу увидеть, и ищу их; собираю и сопоставляю их, создаю графики, решаю, что они скучные, и пробую снова, нахожу новые способы и новые данные для понимания и объяснения проблемы, пишу текст и составляю графики, пытаясь выразить то, что я думаю. А потом я разговариваю об этом с людьми.

При этом часто требуется большой объём ручного труда: под каждым графиком скрывается айсберг. И похоже, Deep Research предназначен именно для меня. Подходит ли он под мои задачи?

Я могу протестировать его на новой задаче, но прежде чем тратить время и кредиты, к счастью, можно воспользоваться образцом отчёта со страницы OpenAI. Этот отчёт посвящён тому, что я достаточно хорошо изучил — смартфонам. Давайте исследуем его.

Читать далее

ИИ-генератор коротких вертикальных видео, сервис для угощений-сюрпризов – и еще 8 российских стартапов

Время на прочтение4 мин
Количество просмотров1.5K

10 новых российских продуктов для создания сравнительных таблиц, учета содержимого домашней аптечки, удаленного преподнесения подарков и многого другого. Битва за «Продукт недели» началась!

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

Читать далее

Внедряем AI Code Review на GIthub: сомнительно, но окэй…

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров4.8K

Код-ревью — важная часть жизненного цикла разработки продукта, но давайте честно: никто не любит просматривать чужой код. Часто, разработчики делают ревью спустя рукава, но даже если это не так -- человеческий фактор может сыграть злую шутку и уязвимость в коде может быть упущена. Пропущенные ошибки, уязвимости и нестабильный код могут привести к задержкам в релизе и росту технического долга. Более того, зачастую, компании имеют свои гайдлайны по оформлению code review, которые также необходимо проверять вручную.

Что если эту рутинную задачу можно ускорить с помощью ИИ?

Читать далее

Бегущий по лезвию ИИ — 2025: сезон футурологии на Хабре

Время на прочтение4 мин
Количество просмотров47K

В 2025 году школьники не летают на Марс, автомобили всё так же колесят по земле, а искусственный интеллект, к счастью, не стремится поработить человечество. Но он уже меняет мир вокруг нас, проникая в самые разные сферы жизни. Каким будет наше будущее? Какие технологии определят его облик? В новом сезоне — «Будущее здесь» — предлагаем вместе с нами поразмышлять над этими вопросами.

Думать широко, глубоко и даже дерзко — в духе Хабра, и тема сезона этому способствует. Ведь каждое смелое предсказание — это шаг в неизведанное. А самый смелый шаг заслуживает не только признания, но и крутого приза.

Узнать об условиях и призах

Квантизация

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров2.4K

Если вы кликнули на данную статью, то скорее всего вы знаете, что в последнее время появляется огромное количество нейронных сетей. Они находят применение везде: и в задачах компьютерного зрения (Computer Vision, CV), и в обработке естественного языка (Natural Language Processing, NLP), распознавания и генерации речи (Speech-To-Text, STT; Text-To-Speech, TTS). Но есть что-то, что объединяет их все: у любой нейронной сети есть веса. И нам их, очевидно, нужно хранить и применять. Так как мы это делаем?

Если вы хорошо слушали и не забыли школьную информатику, вы скажете: в битах! И будете абсолютно правы. А сколько бит надо на хранение? Если мы возьмем какую-то стандартную библиотеку для обучения нейронных сетей (например PyTorch) и будем обучать модель самым простым образом, мы будем использовать тип данных FP32, он же Single precision. На каждое число мы будем выделять 32 бита. Тем не менее, сейчас стремительно набрали популярность большие языковые модели (Large Language Model, LLM), и в них огромное количество параметров. Недавно вышедшая модель от DeepSeek содержит порядка 671 млрд параметров. Можно оценить количество памяти, которая нам понадобится, если хранить все эти числа в FP32:

Читать далее

To seek or not to seek

Время на прочтение7 мин
Количество просмотров2.3K

DeepSeek обрушила американский фондовый рынок, составила серьезную конкуренцию ChatGPT и вызвала огромное количество обсуждений. Мы решили не оставаться в стороне и хайпануть немножечко разобраться, как обстоят дела на самом деле!

В этой статье вы найдете мнение дата-сайнтиста «Инфосистемы Джет» Надежды Гавриковой о новой китайской модели, результаты тестирования и сравнения четырех LLM-моделей: ChatGPT, DeepSeek, GigaChat и YandexGPT.

Какая модель круче?

Ближайшие события

Оценка больших языковых моделей в 2025 году: пять методов

Время на прочтение12 мин
Количество просмотров3.2K

Большие языковые модели (LLM) в последнее время стремительно развиваются и несут в себе потенциал для кардинального преобразования ИИ. Точная оценка моделей LLM крайне важна, поскольку:

Компании должны выбирать генеративные AI-модели для внедрения в работу. Базовых моделей LLM сейчас множество, и для каждой есть различные их модификации.

После выбора модели будет проходить fine-tuning. И если производительность модели не измерена с достаточной точностью, пользователи не смогут оценить эффективность своих усилий.

Таким образом, необходимо определить:

Оптимальные методы оценки моделей

Подходящий тип данных для обучения и тестирования моделей

Поскольку оценка систем LLM является многомерной задачей, важно разработать комплексную методологию измерения их производительности. В этой статье рассматриваются основные проблемы существующих методов оценки и предлагаются решения для их устранения.

Читать далее

10 перспективных российских стартапов – февраль 2025 года

Время на прочтение6 мин
Количество просмотров5.5K

Собрали перспективные стартапы с Product Radar (российского Product Hunt), которые хорошо себя показали во время голосования на площадке в феврале 2025 года. 

Product Radar — здесь каждую неделю публикуются лучшие онлайн-сервисы и железки от русскоязычных команд.

Читать далее

Зачем мы разбрасывали мусор в офисах, или как мы сделали систему для управления гибкими пространствами

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.3K

Привет, Хабр! Меня зовут Вадим, я работаю техническим директором молодой ИТ-компании BPA.

Эта статья — о том, как мы с командой создавали систему автоматического распознавания мусора в офисах и коворкингах. В процессе реализации мы встретились с кучей технических трудностей, от отсутствия готовых датасетов до тонкой настройки нейронных сетей под наши задачи. Ну и, конечно, пришлось пару дней разбрасывать мусор в офисах. Но обо всем по порядку.

Читать далее

«Идти в программисты сегодня — большая ошибка»: откровения техноблогера Михаила Ларченко

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров92K

Что общего между космонавтом и программистом? Скоро эти профессии станут в равной степени бессмысленным выбором для карьеры. В интервью Youtube-каналу Ai4dev автор одного из самых интеллектуальных IT-каналов на YouTube, Fullstack-разработчик Михаил Ларченко рассказал, как искусственный интеллект уже переворачивает индустрию с ног на голову, почему европейские модели могут оказаться лучше американских, и что делать разработчику, чтобы не оказаться выброшенным на обочину технологического прогресса. 

Читать далее

api2app: Как из домашнего компьютера сделать сервер для публичного приложения

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров6.9K

Ранее я уже рассказывал, что при разработке api2app вдохновлялся идеей Python-библиотеки Gradio. У этой библиотеки есть очень полезный функционал: можно запустить приложение на локальном компьютере в режиме share (поделиться), тогда будет сгенерирована публичная ссылка, по которой это приложение будет доступно на любом другом компьютере, подключенном к Интернет.

В этой статье пошагово опишу свой способ. Есть свои плюсы и свои минусы, но в любом случае, думаю, альтернатива не будет лишней. Для примера создам онлайн-приложение для создания транскрипций аудио с помощью проекта whisper.cpp. Делаю всё на Ubuntu, но, думаю, на Windows это повторить будет не сложно.

Читать далее

Почему AI-агентам нужна оркестрация

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1K

В настоящее время большинство организаций задаются вопросом, как эффективно интегрировать AI -агентов. Это боты, которые могут воспринимать запросы на естественном языке и выполнять действия.

Уверен, вы уже сталкивались с различными экспериментами по внедрению этих маленьких помощников в продукты. Результаты могут быть разными: от непонятных дополнений, которые скорее мешают, чем помогают, до гениальных, зачастую едва заметных улучшений, без которых потом трудно представить жизнь.

Удивительно наблюдать за современными инновациями, и, будучи тем, кто любит размышлять, я задумался о том, как мы можем построить систему, улучшающую реальные сквозные бизнес-процессы с помощью AI -агентов. Разумеется, для этого нужно достичь уровня, на котором мы сможем доверять агентам принимать важные решения за нас, а затем даже доверять им реализацию этих решений.

Так как же построить инфраструктуру, которая использует всё, что мы узнали о возможностях AI-агентов, не возлагая на них слишком много или слишком мало ответственности? И смогут ли конечные пользователи когда-либо доверять AI принятие критически важных решений?

Читать далее

AI как новый опиум для разработчиков: Зависимость, которая убивает индустрию

Время на прочтение3 мин
Количество просмотров9.5K

Искусственный интеллект стремительно меняет IT-индустрию, обещая удобство и скорость. Но за этим фасадом скрываются серьёзные риски: деградация навыков, создание поколения разработчиков неспособных мыслить критически. Пора задуматься: Не превращаемся ли мы в заложников технологии, которая обещала нам свободу?

Читать далее

Вклад авторов