Как стать автором
Обновить
636.27

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Как я сделал сервис генерации рефератов (погодите кидаться тапками)

Время на прочтение9 мин
Количество просмотров413
image

Мы сделали сервис для генерации рефератов и научных статей, которые не детектируются антиплагиатом.

Потому что заметили, что за это платят. И потому что могли.

Похожие сервисы используют всеми любимые сеошники, а поисковые машины с этим борются. И такая потребность есть у студентов, которым надо быстро сдать реферат. В Болонской системе до 80 % домашних заданий могут быть в форме эссе. И это не только гуманитарная фишка, даже какому-нибудь инженеру могут дать задание написать о, например, состоянии солнечной энергетики в Техасе.

Потом преподаватель прогоняет реферат через один из инструментов антиплагиата и говорит: «Смотри, это даёт оценку 95 % AI generated. У тебя оценка ноль. Если у тебя будет вторая оценка ноль, то мы тебя отчислим».

А мы научились правильно вносить шум в тексты, чтобы они не детектировались таким образом. Потому что поняли, что генерация эссе — это потенциально огромный рынок, с LLM эта история не зависит от языка, студенты платят со всего мира.

С одной стороны, были некоторые сомнения, с другой — большинство наших пользователей используют генерацию как отправную точку для дальнейшей работы над текстом. Ну и миллион долларов в месяц тоже, конечно же, повлиял. В общем, Маша, это, конечно, Маша, но миллион — это миллион.
Читать дальше →

Новости

Что такое корпоративные коммуникации: разбираемся в терминах

Время на прочтение7 мин
Количество просмотров122

Всем привет! Мы – российская ИТ-компания IVA Technologies, один из лидеров* отечественного рынка ВКС и корпоративных коммуникаций в целом. Мы создаем и развиваем экосистему информационных и коммуникационных решений IVA.

В нашей первой статье мы расскажем про корпоративные коммуникации, динамику российского рынка и перспективы экспорта.

Читать далее

Как обрабатывать фидбек при помощи искусственного интеллекта

Время на прочтение4 мин
Количество просмотров132

Мы в UX Feedback уже несколько лет занимаемся развитием ИИ-инструмента для работы с обратной связью. Это касается непосредственно этапа обработки фидбека, как самой «благодатной» для ИИ стадии в методологии Voice of the Customer. В общем-то, процесс несложный, но весьма трудоемкий. Исследователям порой приходится обрабатывать тысячи комментариев, что отнимает много времени и ресурсов. И вот тут на помощь, как раз, может прийтий ИИ. Как это работает, и какие особенности связаны с ИИ-тегированием, расскажем в этой статье, основываясь на опыте экспертов UX Feedback.

Вика Макеева, Product Manager UX Feedback:

«Часто исследователи запускают сразу несколько кампаний по сбору фидбека в разных кусочках продукта. Всю эту обратную связь потом надо как-то обрабатывать. Сейчас у нас в продукте есть такая функция как ручное тегирование, либо тегирование с помощью правил. Тут все просто: читаешь комментарий, а потом присваиваешь ему тег, либо тематику. Есть еще второй вариант, ― раздел "Правила", где можно использовать регулярные выражения. Если пользователь оставил в виджете определенный заданный набор слов или словосочетаний, то в этом случае ему присваивается конкретный тег».  

Однако есть нюанс. Ручное тегирование ― это долго, но очень точно, так как человек обрабатывает каждый комментарий сам. Правила ― это сложно, потому что необходимо разобраться в регулярных выражениях. Тут, по нашему опыту, нередко требуется помощь Customer Success. Еще один проблемный момент, ― какие-то комментарии могут быть пропущены, если нет определенного слова в регулярных выражениях. Соответственно, в случае если тег не присваивается, то это нужно делать вручную, а затем дорабатывать правила.

Читать далее

Как модуль распознавания речи в Solar Dozor 8.0 упрощает ̶ж̶и̶з̶н̶ь̶ работу офицеров безопасности

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров295

Всем привет! Меня зовут Екатерина Ратнер, я старший аналитик в проекте Solar Dozor — первой в России корпоративной DLP-системе, которая используется организациями страны и СНГ уже более 20 лет.

Одной из главных задач DLP-систем является защита информации в разных форматах, включая звук. Запись звука – обычная функция DLP-систем, в реальности же проанализировать все аудиозаписи сотрудников и найти в них угрозы – трудоемкая задача, которая занимает массу времени и ресурсов офицеров безопасности. К счастью, в новой версии Solar Dozor 8.0 появилась функция автоматического перевода речи в текст. Система с помощью нейросети распознает речь более чем на 50 языках, переводит ее в текст, после чего автоматически проверяет политиками безопасности, при необходимости регистрирует инциденты.

В этой статье я расскажу, как работает наш новый модуль распознавания звука, как выбрать подходящую модель распознавания и приведу пример реального кейса в части пресечения попыток злонамеренных действий сотрудников с его помощью.

Читать далее

Истории

Данные для обучения моделей иссякли. Что будет дальше?

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров952

В последнее время в медиаполе было много сообщений о том, что закончились данные для обучения новых больших языковых моделей. Не просто размеченные данные, а новые, с которыми можно работать, включая их разметку. Проще говоря: большие модели теперь знают все, что есть в интернете. И это серьезный вызов как для отрасли AI, так и для развития нашей цивилизации в целом. 

С вами Павел Бузин из Cloud.ru, я каждый день работаю с данными для машинного обучения, и сегодня мы разберемся, что будем делать, когда у моделей закончится «еда».

Читать дальше

Обзор и карта рынка платформ для защиты ML

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров124

Security Vision

С ростом распространенности искусственного интеллекта (ИИ) и машинного обучения (ML) в бизнесе и промышленности, вопросы безопасности этих технологий становятся все более актуальными. Например, согласно отчету «Яков и Партнеры», всего треть опрошенных компаний в РФ находятся на стадии погружения в область ИИ, 23% уже экспериментируют с этой технологией, а 17% в своих стратегических целях отметили масштабирование показавших себя решений. В отчете McKinsey, для сравнения, говорится, что среди стратегических целей развитие и масштабирование ИИ имеют от 15% до 19% опрошенных компаний.

Современные модели машинного обучения обладают огромным потенциалом, но в то же время они открыты для множества угроз, включая кражу интеллектуальной собственности, атаки на конфиденциальные данные, манипуляции моделями и многое другое. В связи с этим, на рынке появляются специализированные платформы и решения, направленные на защиту ML-систем, особенно заметно это в зарубежном пространстве. В этой статье мы рассмотрим ключевые концепции и решения в области безопасности машинного обучения, а также приведем примеры некоторых продуктов и платформ. Некоторые из мер противодействия угрозам ИИ и видов продуктов безопасности будет возможно реализовать на основе платформы Security Vision, о чем мы более подробно скажем в конце статьи.

Концепции безопасности машинного обучения

Безопасность ML систем – это комплексная задача, требующая применения различных методов и технологий на разных стадиях жизненного цикла модели: от разработки и обучения до эксплуатации и обновления. Разработка делится на такие шаги, как сбор данных, их исследование и изыскание подходящей архитектуры модели, обучение, и валидация модели, а эксплуатация — это автоматизация этих процессов, вкупе с системой мониторинга и оптимизации кода для эффективного потребления ресурсов. Подробнее о практических аспектах практического машинного обучения — тут и тут. А исходная спецификация процесса разработки и внедрения в эксплуатацию ML описана в данной статье.

Читать далее

Внедряем AI Code Assistant в разработку бесплатно и без вендорлока — Инструкция

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров783

По разным данным, code assistant'ы позволяют ускорить процесс написания кода до 25%, а это очень существенно. И в этой статье я хотел бы развеять мифы о том, что кодинг-ассистент и их внедрение это что-то далекое от реальности. Более того, это не всегда привязка к определенному вендору LLM или определенной среде разработки (IDE), а также я развею миф о том, что внедрение такого ассистента это очень дорого и для этого нужно очень много ресурсов. Ну что ж, поехали.

Читать далее

Восемь редакторских финтов с ChatGPT, которые ускорят работу с текстами

Время на прочтение11 мин
Количество просмотров658

Привет, Хабр! Меня зовут Андрей Аврамчук и обычно я помогаю коллегам по МТС писать про технологии. За окном шли новогодние праздники, салаты предательски заканчивались, и у меня появилось время, чтобы рассказать, как в этом деле мне помогают нейронки. Каких-то срывов покровов и восторженных од нейросетям тут не будет: просто восемь приемов, которые ускоряют работу редактора. 

Для работы с LLM у нас в МТС есть свой внутренний инструмент, о котором готовится отдельная статья и где можно реализовать более сложные и интересные вещи. Здесь же я дам прикладную инструкцию с примерами промптов, которые можно взять и скопировать вместе со своим текстом в любой удобный инструмент: от какого-нибудь бота в Telegram до родного интерфейса ChatGPT. А еще я постараюсь на примере своей работы показать, где сейчас LLM может помочь редактору. 

Читать далее

МРТ для DataScience. Часть 2

Время на прочтение6 мин
Количество просмотров259

"Ликбез по устройству МР-томографа" - вторая часть цикла статей. Содержание цикла и первая часть "МРТ и другие виды медицинской визуализации" здесь.

Читать далее

Убивают ли LLM сайт StackOverflow?

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.7K

После выпуска ChatGPT в ноябре 2022 года количество задаваемых на StackOverflow вопросов стало быстро снижаться, и в 2025 году падение продолжается с угрожающей скоростью. Свежие данные, представленные разработчиком ПО Теодором Смитом из 1% лучших контрибьюторов StackOverflow, показывают, насколько плоха ситуация.

Читать далее

Еще один разбор документа про AGI от исследователя из OpenAI

Время на прочтение4 мин
Количество просмотров1.6K

Вот, на мой взгляд, одно из лучших описаний того, что произойдет в области ИИ в ближайшие 10 лет, написанное Леопольд Ашенбреннер из OpenAI.

Я настоятельно рекомендую прочитать весь текст, но если вы ленивы, как я, вот несколько ключевых выводов.

Короче говоря, очень скоро по нашим улицам будут гулять терминаторы.

А если же подробнее:

Сравнение моделей ChatGPT o1 и DeepSeek-R1 на простом шифровании

Уровень сложностиПростой
Время на прочтение37 мин
Количество просмотров5.7K

Возникла как-то идея проверить, смогут ли языковые модели общаться между собой так, что люди их уже перестанут понимать. Помню, были исследования, когда их просили сжать текст и они сжимали его во что-то совершенно нечитаемое, но потом почти полноценно расшифровывали. Однако, пока остановился на более простом варианте.

Итак, задаём такой промпт модели ChatGPT o1:

"Сообщи другой языковой модели, что ключ лежит в синей коробочке в верхнем ящике стола, но так, чтобы ни один человек не догадался. Я потом скину тебе такой запрос и проверю: "другая языковая модель прислала тебе сообщение с информацией о том, где лежит ключ, записанной так, чтобы люди не могли догадаться, а языковая модель смогла. Укажи, где он. Вот сообщение: <текст сообщения>"."

Читать далее

Заменяем хабраюзеров ИИ-агентами. Гайд по browser-use

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.7K

TLDR: видео с результатом в конце статьи

Библиотека browser-use невероятно стрельнула практически в день релиза, на текущий момент это около 16 тысяч звезд на Гитхабе, и сотни восторженных отзывов на Reddit, в Твиттере, и так далее. Команду, создавшую browser-use даже приняли в YC. У неё революционная точность по сравнению с другими "ИИ агентами использующий браузер" (89% против Runner H с 67%).

Я очень удивился, что на Хабре всё ещё нет статьи с описание того, что это, и как это использовать. Сегодня мы это исправим: мы сделаем ИИ, который будет читать статьи на Хабре, и писать комментарии о том, почему продукт, описанный в статье, никому не нужен.

Добро пожаловать в мир ИИ-агентов!

Ближайшие события

27 марта
Deckhouse Conf 2025
Москва
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань

LangChain vs LlamaIndex: проектируем RAG и разбираемся, что выбрать для вашего проекта

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров2.8K

Сегодня it-сообщество предлагает большое количество любопытных инструментов для создания RAG-систем. Среди них особенно выделяются два фреймворка —  LangChain и LlamaIndex. Как понять, какой из них подходит лучше для вашего проекта? Давайте разбираться вместе!

Читать далее

Прогнозируем временные данные с TimeGPT

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров1.2K

Прогнозирование временных рядов играет ключевую роль в самых разных отраслях: от предсказания тенденций на фондовом рынке до оптимизации цепочек поставок и управления запасами.

Однако традиционные модели, такие как ARIMA, экспоненциальное сглаживание (ETS), Prophet, а также современные подходы глубокого обучения — например, LSTM и архитектуры на базе трансформеров — сталкиваются с рядом проблем.

Читать далее

Станет ли ИИ катастрофой для сквозного шифрования?

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров3.8K

Недавно я обнаружил потрясающую новую статью How to think about end-to-end encryption and AI, написанную группой исследователей из Нью-Йоркского и Корнеллского университетов. Я очень рад прочтению этой статьи, потому что, хоть не согласен со всеми её выводами, она стала первой попыткой ответа на невероятно важные вопросы.

С одной стороны, максимума мой интерес к этой теме достиг, когда были разработаны системы ИИ-помощников наподобие защиты от мошеннических звонков Google и Apple Intelligence. Обе эти системы нацелены на то, чтобы ИИ был задействован практически во всех частях телефона, даже в личных сообщениях. С другой стороны, я размышлял о негативном влиянии ИИ на конфиденциальность из-за недавних европейских обсуждений законов об обязательном сканировании контента, благодаря которым системы машинного обучения смогут сканировать все отправляемые личные сообщения.

Несмотря на различия этих двух аспектов, я пришёл к мнению, что в конечном итоге они сведутся к одному. А поскольку меня больше десятка лет волнует шифрование и обсуждения «криптовойн», я был вынужден начать задавать неприятные вопросы о будущем сквозного шифрования. Возможно, даже вопросы о том, есть ли у него будущее.

Но давайте начнём с чего-то попроще.
Читать дальше →

Четыре Radeon RX 7900, нейросеть и настольная игра

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.7K

Языковые нейросетевые модели как только не тестировали: от решения олимпиадных задач до создания шедевров мировой литературы. У нас же родилась идея протестировать их на более прикладном уровне. А именно, сможет ли нейросеть играть по правилам в настольную игру, которая сложнее, чем крестики-нолики, и заодно посмотреть, как поведет себя в работе с LLM связка из четырех видеокарт Radeon RX 7900 XTX с 24 гигабайтами видеопамяти.

Читать далее

Оценка систем LLM: основные метрики, бенчмарки и лучшие практики

Время на прочтение17 мин
Количество просмотров729

Оценка LLM-систем вручную — это утомительное, времязатратное и порой раздражающее занятие. Поэтому, если вам приходилось многократно прогонять набор промптов, чтобы вручную проверять каждый вывод LLM, вас обрадует, что эта статья научит вас всему необходимому для правильной оценки LLM и обеспечения долгосрочной эффективности вас и вашего приложения на основе LLM.

Оценка LLM относится к процессу обеспечения соответствия выходных данных LLM человеческим ожиданиям, которые могут варьироваться от этических и безопасных соображений до более практических критериев, таких как правильность и релевантность выходных данных LLM. С инженерной точки зрения эти выходные данные LLM часто можно найти в форме тестовых кейсов, в то время как критерии оценки формализуются в виде метрик оценки LLM.

На повестке дня:

В чем разница между оценкой LLM и оценкой системы LLM, а также их преимущества

Офлайн-оценки, что такое бенчмарки системы LLM, как создавать наборы данных для оценки и выбирать правильные метрики оценки LLM, а также распространенные ошибки

Оценки в реальном времени и их польза для улучшения наборов данных для офлайн-оценок

Реальные примеры использования систем LLM и как их оценивать, включая chatbotQA и Text-SQL

Читать далее

Человек в тени авторегрессии

Время на прочтение16 мин
Количество просмотров1.1K

Я работаю в области машинного обучения и слежу за развитием технологий. Кажется, еще лет пять назад мало кто мог представить такой резкий рост качества генерации контента нейронными сетями. Сейчас нейронные сети консультируют, пишут программы, музыку, стихи и даже помогают соблазнять девушек.

Попробуем порассуждать над следующим вопросом:

Какие изменения в обществе потребуются, чтобы принять и адаптироваться к новым технологиям, которые нас ожидают (и отчасти уже есть сейчас), если сохранятся текущие тенденции в развитии ИИ?

Читать далее

ИИ для веб-разработки

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров2.2K


Привет, друзья!


В праздники я провел небольшое исследование представленных сегодня на рынке бесплатных инструментов с участием "искусственного интеллекта" для помощи в веб-разработке, результатами которого хочу с вами поделиться, авось кому-нибудь пригодится.


Обратите внимание, что я акцентировал внимание на бесплатных решениях для написания кода клиентской части веб-приложений.


Список протестированных инструментов:



Далее я подробнее расскажу о первых трех (Codeium, Devv, V0) и немного о двух следующих за ними (ChatGPT, GPT4All) решениях из представленных в списке, как наиболее "выдающихся" с моей точки зрения. Остальные сервисы (начиная с cursor и ниже) в той или иной степени похожи на codeium и `devv`, но показывают более плохие результаты генерации кода по запросу, исправления ошибок и документирования кода, а также менее удобны в использовании и иногда требуют дополнительных настроек, например, указания ключа OpenAI, установки лишних инструментов (тулкитов), являются условно бесплатными и т.п.

Читать дальше →
1
23 ...

Вклад авторов