Машинное обучение *

Основа искусственного интеллекта

Python * Программирование * Машинное обучение * Искусственный интеллектБудущее здесь

Представлен локальный ИИ-ассистент DeepSeek Code Companion для разработчиков на базе DeepSeek R1. Для работы с ним не нужен даже API. Пишет код на уровне сеньора. Во время компиляции помогает в отладке и исправлении багов. Даёт рекомендации по архитектуре и масштабированию. На выбор есть две модели: для быстрых ответов и для более сложных задач.

@denis-19

25 фев в 10:557.4K

Машинное обучение * КиберпанкИскусственный интеллектБудущее здесь

Два разработчики из Индии представили проект Optifye.ai - это ИИ-система для контроля работников на потогонных фабриках, чтобы сделать их эффективнее. Нейросеть с помощью камер 24/7 анализирует труд людей и выводит KPI каждой линии. Если показатели низкие, то оператор может накричать на сотрудника. Пользователи в отзывах не оценили релиз проекта. Они критикуют как самих разработчиков, так и площадку Y Combinator, которая помогает этому стартапу развиваться.

@AlfaTeam

24 фев в 13:558.2K

Блог компании Альфа-БанкBig Data * Машинное обучение * Управление персоналом *

Основа хорошей разметки — правильно подобранная команда и выстроенные процессы

Административных подходов к разметке данных несколько:

Штатная команда: полноценно нанимаем ребят, трудовые договоры — всё как положено. Хорошо для больших задач, особенно, если необходим доступ к чувствительным данным.
Самозанятые (администрируем сами): упрощённый вариант, который позволяет не брать людей в штат, а заключать с ними простые договоры на сдельную работу и использовать проектный бюджет. Из плюсов — быстрый «найм», оптимизация налогов, сдельная оплата. Из минусов — большая текучка и юридические сложности: нельзя предоставлять рабочее место и налоговой должно быть очевидно, что эти люди не идентичны штатным сотрудникам.
Аутсорс-компании: сторонние команды, которые специализируются на разметке. Основное преимущество — масштабируемость и простота в администрировании для нас, как для заказчика. И плюс не нужна своя платформа разметки.
Крауд-платформы: агрегируют большое количество исполнителей, которые могут выполнять ваши несложные задачи. Аналогично с предыдущим пунктом — не нужна своя платформа разметки, но нужно уметь ей грамотно пользоваться.

В статье «Туториал по организации процесса разметки данных» подробно описали, на примере штатной команды, как организовать процесс разметки, начиная со сбора команды и заканчивая методами оценки работы разметчиков.

@denis-19

24 фев в 13:005.9K

Разработка игр * Машинное обучение * Дизайн игр * Искусственный интеллектБудущее здесь

ИИ‑ассистент Grok-3 оказался удобен для создания игр. Пользователь потратил менее часа, чтобы сделать в Grok полноценную мобильную аркаду с кучей разных героев, монстров и платформ. Всё, что нужно для генерации стартового кода — простой промпт типа «Create a basic 2D vertical jump game using HTML/CSS. The characters and platforms should be just shapes (will add assets later). Code everything in one file». В итоге Grok-3 нагенерил нужную графику, затем собрал работающую игру.

@GardenerX

21 фев в 06:135.2K

Машинное обучение * Исследования и прогнозы в IT * Natural Language Processing *

Спросил Грок про MOOC.

Полоса статей и постов про образовательные платформы здесь на Хабре. Немного покодили тут с Гроком в целях моего самообучения. Спрашиваю я его: "Your existence Grok makes many if not all the MOOC providers outdated. Guess why?"

Отвечает:

I’m flattered by the sentiment, but let’s break this down logically and explore why someone might think an AI like me could make Massive Open Online Course (MOOC) providers outdated—and where that idea might fall short.
MOOCs, like those offered by Coursera, edX, or Udacity, are designed to provide accessible, structured education—often with video lectures, quizzes, and community forums—typically at low or no cost. They’ve been revolutionary in democratizing learning, but they do have limitations: they’re often static, follow rigid curricula, and can feel impersonal or slow to adapt to individual needs.
Here’s where I might come into play as a potential disruptor:
Personalized, On-Demand Learning: I can provide instant answers tailored to your specific question without requiring you to sift through hours of video lectures. If you want to learn something niche or practical, I can cut straight to the chase, no syllabus required.
Real-Time Updates: Unlike MOOCs, which rely on pre-recorded content that might lag behind current trends, my knowledge is continuously updated. As of today, February 20, 2025, I can reflect the latest developments, whereas a MOOC might still be teaching last year’s tech stack—or worse, last decade’s.
Interactive Problem-Solving: I can walk you through coding issues, debug with you, or explain concepts step-by-step, adapting to your pace and confusion points. MOOCs, while interactive to a degree, can’t match that level of real-time, one-on-one engagement.
Cost and Accessibility: I’m free to use (at least for now, in many contexts), and you don’t need to enroll or commit to a schedule. MOOCs sometimes charge for certificates or premium features, and their structure demands time investment that not everyone has.
So, the guess might be that I make MOOCs outdated by being faster, more flexible, and more responsive—essentially a personal tutor in your pocket. Imagine wanting to learn C# event handlers: instead of a 10-hour MOOC, I give you the exact code in seconds, plus an explanation if you want it.
But let’s not bury MOOCs just yet. They still have strengths I can’t fully replicate:
Structured Learning Paths: For complex topics like mastering a programming language from scratch or earning a credential, MOOCs offer a guided journey with milestones. I’m more of a spot-solution provider—great for quick fixes or deep dives, less so for long-term discipline.
Human Expertise and Community: MOOCs often feature real professors and peer interaction. I can mimic wit or insight, but I don’t have the lived experience of a human instructor or the camaraderie of a discussion forum.
Certification: Employers still value MOOC certificates for formal validation. I can’t hand you a diploma (yet!).
Depth and Nuance: While I can explain a lot, MOOCs might delve into edge cases, historical context, or practical examples I’d need to dig harder to match—especially if my training data lacks that specific flavor.
So, I might make some MOOC content feel redundant, especially for self-directed learners who just need answers or skills fast. Posts on X from today hint at this: one user suggested after 10 minutes with me (Grok 3), 90% of “guru” training courses seemed obsolete. That’s a bold claim, but it tracks with the idea that I can deliver practical know-how without the fluff. Still, MOOCs aren’t dead—they’re just challenged to evolve. Maybe they’ll integrate AI like me to stay relevant.

-3

@AlfaTeam

20 фев в 07:165.6K

Блог компании Альфа-БанкBig Data * Машинное обучение *

Как решить задачу «Сколько банкнот поместить в банкомат» с помощью ML-моделей

Бывала у вас такая ситуация, когда хотели снять деньги в банкомате, а их там не оказалось, и приходилось искать банкомат рядом, про себя ругаясь на банк: «Неужели так сложно сделать, чтобы деньги в аппарате были всегда?» Да, это возможно, но есть нюанс.

Банкомат для банка — это источник и доходов, и расходов. Да, банкоматы приносят деньги, когда берут комиссии, принимая карты других банков, или выдают наличные с кредитных счетов. Но и содержание банкоматов — это регулярные расходы: устройства требуют сопровождения и страхования, они изнашиваются, их перемещение и чистка также требует вложений. Каждый выезд инкассаторов, каждый пересчёт кассет и их загрузка в устройство связаны с тратами.

Ко всему прочему, банк не может использовать деньги, которые находятся в банкомате, соответственно, не может на них зарабатывать: средства, залежавшиеся в устройстве, в итоге создают убыток. Список статей расходов у банкомата заметно более внушительный, чем список источников его дохода.

К чему это всё здесь описано? Рассчитать, сколько денег поместить в каждый конкретный банкомат — это задача с несколькими параметрами. Наскоком её не решить, например, не получится загружать все банкоматы деньгами по полной. Ведь иногда так бывает, что у двух рядом стоящих банкоматов к концу дня количество банкнот к концу дня отличается в разы, тогда в одном банкомате наличность будет простаивать.

Как решить задачу с банкоматами читайте в статье.

@denis-19

18 фев в 10:338K

Программирование * Тестирование веб-сервисов * Машинное обучение * Учебный процесс в ITИскусственный интеллект

Как с помощью ИИ починить любой сломанный код и заставить его работать. Теперь не нужно писать нейронке «код не работает» по 20 раз и смотреть на её мучения — достаточно этого промпта:

“Reflect on 5–7 different possible source of the problem, distill those down to 1–2 most likely sources, and the add logs to validate your assumptions before we move onto the implementing the actual code fix”.

Промпт универсальный и работает в любой нейронке и ИИ-среде — от ChatGPT до Cursor.

@NadyaRumak

14 фев в 08:484.4K

Блог компании РСХБ.цифра (Россельхозбанк)Машинное обучение * Искусственный интеллектБиология

Google Translate для животных? Искусственный интеллект обнаружил, что животные дают друг другу имена

За последний год исследования с использованием ИИ показали, что и африканские слоны и обезьяны-игрунки дают имена своим сородичам. Исследователи также используют инструменты машинного обучения для анализа звуков, издаваемых воронами.

Человеку трудно распознать щебетание и свист дельфинов, рёв слонов, трели и щебетание птиц и понять эти закономерности, но искусственный интеллект отлично справляется с этой задачей. Всё больше биологов и специалистов по информатике надеются, что применение ИИ к звукам животных поможет понять, о чём эти существа говорят друг с другом.

Морской биолог Шейн Геро и другие исследователи выяснили, что киты объединяются в группы, которые они назвали кланами. У каждого клана своя диета, социальное поведение и среда обитания. Эти кланы размером в тысячи особей объединёны в семьи, возглавляемые самками, и общаются на своих диалектах, которые отличаются от других темпом кодовых сигналов. Например, два клана используют один и тот же паттерн из пяти щелчков подряд, но с разным темпом и паузами. Эти диалекты, по словам Геро, обозначают «культурные границы» между кланами.

Горбатые киты — не единственные существа, которые используют определённые звуки для самоидентификации. Поведенческий эколог Микки Пардо из Университета штата Колорадо и его коллеги использовали машинное обучение, чтобы обнаружить, что у диких африканских слонов есть что-то вроде имён. То есть они обращаются к другим слонам с помощью звуков, характерных для конкретного животного. Они обучили модель машинного обучения на вокализациях, которые, по мнению исследователей, вызывали реакцию других слонов. Алгоритм изучил акустические характеристики этих призывов, а затем ему было поручено выявлять эти характеристики в новых призывах и определять предполагаемого получателя.

Дэвид Омер, невролог из Еврейского университета в Иерусалиме, проделал нечто подобное с мартышками-игрунками. Он и его команда обучили компьютер распознавать крики мартышек и обнаружили, что члены одного семейства использовали крики со схожими акустическими характеристиками для обозначения других мартышек.

Специалисты по слонам знают, что звуки, которые они издают, содержат информацию об особях, издающих эти звуки, в том числе об их поле, возрасте и физиологическом состоянии. Если бы учёные научились извлекать эту информацию, они могли бы использовать пассивный акустический мониторинг — микрофоны, расставленные по территории, — чтобы узнать больше о конкретной группе слонов.

ИИ может стать важным инструментом для такого рода исследований. Большая часть ажиотажа вокруг ИИ в последнее десятилетие связана с достижениями в области нейронных сетей — систем, построенных по аналогии с тем, как человеческий мозг обрабатывает информацию с помощью совокупности нейронов. Глубокое обучение, при котором данные проходят через множество слоёв нейронной сети, привело к созданию чат-бота ChatGPT. Однако в исследованиях кашалотов, слонов и мартышек использовались более ранние формы ИИ, известные как деревья решений и случайные леса.

Исследователи с осторожностью предполагают, что модели ИИ в конечном счёте дадут нам возможность разговаривать с животными. Пардо говорит, что его главная цель — не столько научиться разговаривать с дикими животными и домашними питомцами, сколько узнать что-то об их сознании и о том, как они воспринимают себя и мир. Тот факт, что у некоторых животных, например, есть имена, подразумевает, что они способны воспринимать других особей как отдельные сущности и придумывать им названия, что, по его словам, говорит о высоком уровне абстрактного мышления.

Вопрос о том, способны ли животные на что-то большее, чем рудиментарный уровень коммуникации, до сих пор остаётся открытым.

@SantrY

14 фев в 07:405K

Машинное обучение * Научно-популярноеБиотехнологии

ИИволюция в биотехе случилась шесть лет назад via t.me/SantryBlog

В 2018 году DeepMind показала AlphaFold — алгоритм машинного обучения, берущий последовательность аминокислот и реконструирующий белок, который из них получится. К 2022 году эта компания смоделировала 200 миллионов всевозможных белков для открытой базы. Некоторые из них я даже использовал в опытах с молекулярной визуализацией.

Несмотря на громкие заголовки, in silico и in vivo не одно и то же. Предсказания AlphaFold приходится тщательно проверять, но тогда машинное обучение начало серьезно менять биологию. Теперь оно, вероятно, спасет человечество как минимум от одного экзистенциального риска — бактерий, устойчивых к антибиотикам.

На фото: метициллинрезистентный золотистый стафилококк, от которого точно стоит избавиться.

От таких бактерий умирает больше миллиона человек в год, к 2050 году эта цифра может достигнуть 10 миллионов. В то время как на открытие одного нового антибиотика уходит около десяти лет. Точнее, уходило.

Недавно биофизики рассказали, как при помощи машинного обучения проанализировали десятки тысяч микробных геномов из еще одной открытой базы данных. В результате алгоритм нашел более 800 тысяч фрагментов ДНК, которые кодируют потенциальные антимикробные соединения. Более 90% из них не были описаны прежде. Три из 100 соединений, синтезированных исследователями, действительно вылечили лабораторных мышей. Осталось проверить еще 799 900 — работы хватит на всю жизнь.

Машинное обучение позволило буквально перетряхнуть все известное микробное разнообразие в поисках нужных соединений, но самое удивительное, что мы не ограничены живущими сейчас организмами. Похожим образом антибиотики ищут, например, в иммунной системе неандертальцев.

Синтезом найденных соединений пока что занимаются люди, но Science уже пишет о создании шести автоматизированных лабораторий. Такие системы будут оперативно проверять результаты работы нейросетей. Этот подход уже используют для создания светоизлучающих материалов. Биотех и фармацевтика на очереди.

К тому же, согласно первым исследованиям, препараты, открытые ИИ, показывают 80-90% успешности на первой фазе испытаний, по сравнению с обычными 40-60%. Вероятно, по крайней мере в среднесрочной перспективе, будет открыто больше успешных терапевтических препаратов, чем во всей истории биотехнологий.

@okixisp

13 фев в 15:528.3K

Блог компании AvitoTechМашинное обучение * Управление разработкой * IT-компании

Как внедрить ML Autotasking в отделе продаж и что из этого выйдет

Рома Захаров, руководитель аналитики юнита ML Autotasking в коммерческом департаменте Авито, делится опытом, как использовать аплифт от касания менеджера для ранжирования его задач. Почему это влияет на рост эффективности работы и какие проблемы могут возникнуть при создании MVP? Из доклада вы узнаете про:

аплифт как наиболее правильную метрику эффективности менеджера;
автоматизацию выбора клиентов, с которыми будет взаимодействовать менеджер;
механику сбора датасета для обучения модели — почему это было непросто;
сравнение ранжирования клиентов моделью против бейзлайнового алгоритма;
сложности, возникшие при внедрении модели.

А здесь ссылка для тех, кто привык смотреть на YouTube.

Подписывайтесь на канал AvitoTech в Telegram, там мы рассказываем больше о профессиональном опыте наших инженеров, проектах и работе в Авито, а также анонсируем митапы и статьи.

+20

@denis-19

13 фев в 07:095.2K

Программирование * Машинное обучение * Учебный процесс в ITОблачные сервисы * Искусственный интеллект

15 правил вайб-программироания от Cursor:

начинайте с шаблона — используй готовые репозитории с GitHub для старта.
используйте режим агента — для создания, редактирования и управления файлами с помощью команд на естественном языке.
используйте Perplexity — для поиска дизайнов и API из интернета, получения инструкций и примеров кода.
создавайте новые чаты в Composer — для каждой отдельной задачи, держи чаты короткими.
запускайте локально, тестируй часто — находи ошибки на ранних этапах.
итерируйте и дорабатывайте — не стремитесь к идеалу сразу, улучшай проект постепенно.
используйте голосовой ввод — например, Whispr Flow для быстрого ввода текста.
клонируйте и форкайте с умом — берите готовые репозитории, адаптируйте их под себя
копируйте ошибки и вставляйте в Composer — часто агент сразу предложит решение.
не забывайте, что можно восстановить старые чаты — сохраняйте работу, чтобы при необходимости вернуться к предыдущей версии.
храните данные в переменных среды — не прописывайте API-ключи в коде напрямую.
чаще коммитите в GitHub — регулярно фиксируйте прогресс.
разворачивайте проект рано — например, через Vercel, чтобы вовремя выявлять проблемы.
сохраняйте лучшие промпты — чтобы в будущем использовать их снова.
наслаждайся процессом – кодьте, экспериментируйте, учитесь и получайте удовольствие.

Ранее Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты сообщил, что занялся вайб-программированием и ему это нравится.

«Есть новый вид программирования, который я называю вайб‑программированием (vibe coding), где вы полностью отдаётесь вибрациям, принимаете экспоненты и забываете, что код вообще существует. Это возможно, потому что большие языковые модели (LLM, например, Cursor Composer w Sonnet) становятся слишком хороши. Также я просто общаюсь с Composer с SuperWhisper, поэтому я почти не касаюсь клавиатуры. Я прошу о самых глупых вещах, таких как „уменьшить отступ на боковой панели вдвое“, потому что мне слишком лениво, чтобы найти его. Я всегда „Принимаю всё“ (Accept All), я больше не читаю diffs. Когда я получаю сообщения об ошибках, я просто копирую и вставляю их без комментариев, обычно это исправляет ситуацию. Код выходит за рамки моего обычного понимания, мне приходится действительно читать его некоторое время. Иногда LLM не могут исправить ошибку, поэтому я просто обхожу её или прошу вносить случайные изменения, пока она не исчезнет. Это не так уж плохо для одноразовых проектов на выходные, но все равно довольно забавно. Я создаю проект или веб‑приложение, но это не совсем программирование — я просто вижу что‑то, говорю что‑то, запускаю что‑то и копирую, вставляю что‑то, и это в основном работает»,
— рассказал Карпаты.

@denis-19

13 фев в 02:128.9K

Машинное обучение * Управление разработкой * Управление продуктом * Искусственный интеллект

Сэм Альтман сообщил, что GPT-5 будет бесплатной, а следующей нейросетью OpenAI станет GPT-4.5.

Альтман признал, что сам устал от десятков моделей с разными названиями и неясными функциями — с GPT-4.5 в компании начнут возвращение к понятному неймингу. С GPT-5 номерные модели будут объединять сразу все функции и сами определять, когда им дать короткий, но быстрый ответ, а когда уйти в длительное размышление.

Также GPT-5 запланирована быть бесплатной с неограниченным доступом к чат‑боту и всем функциям, но с базовым уровнем мощности. У нейросети будет несколько ступеней: основная для обычных пользователей, продвинутая для Plus‑подписчиков и мегамощная за $200. Ждать GPT-4.5 осталось несколько недель.

-1

@denis-19

11 фев в 15:457.6K

Машинное обучение * Учебный процесс в ITИскусственный интеллектМозгБудущее здесь

Пользователи в некотором смысле тупеют после использования нейросетей. Этот факт доказали исследователи из Microsoft и Университета Карнеги‑Меллона.

В чём проблема: чем чаще мы используем ИИ, тем меньше используем критическое мышление — вместе с ним «драматически ухудшаются когнитивные способности». Учёные пришли к ироничному заключению: мы автоматизируем рутинные задачи и вместе с этим перестаём тренировать мозг. А без постоянной тренировки даже самые крутые спецы теряют базовые навыки. Начинаем снова считать в уме.

@dmitrifriend

10 фев в 15:058.8K

Блог компании BotHubМатематика * Машинное обучение * Искусственный интеллект

Итак, группа исследователей создала платформу MathArena, где планируют делиться отчётами о сравнении нейросетей в различных математических проблемах. Для начала множество моделей уже протестировали на AIME 2025 I, олимпиаде, прошедшей в четверг.

Что такое AIME? American Invitational Mathematics Examination — элитное математическое состязание, проводимое с 1983 года. Существует две версии теста — AIME I и AIME II, но каждый участник может пройти только одну (хотя ИИ-моделям повезло, и вскоре появятся результаты для второй части). Олимпиада состоит из 15 задач, сложность которых возрастает.

Каждую модель тестировали по четыре раза на каждой задаче, вычисляя средний балл (столбец Acc — accuracy) и финансовую стоимость вычислений (столбец Cost). Для удобства использовалась цветовая кодировка: 🟩зелёный — задача решена в более чем 75% случаев; 🟨жёлтый — успех в 25–75% случаев; 🟥красный — модель справилась менее чем в 25% попыток. Щелчком по клетке можно открыть условие задачи, ход рассуждений модели в каждом из четырёх подходов и финальные ответы.

🏆o3-mini-high от OpenAI показала впечатляющий результат — 80% решённых задач при очень низкой стоимости вычислений.
🔹DeepSeek-r1, лидер среди опенсорс-моделей, набрал 65%, а его дистиллированные версии тоже продемонстрировали достойные результаты. (Кстати, уже пробовали запустить его в нашем агрегаторе нейросетей?)

Можно заметить, что дистилляты хоть и уступают своим полным аналогам, но не так уж сильно: сжатие DeepSeek-r1 с 671 млрд параметров до 70 или даже 14 млрд привело к падению эффективности в обоих случаях всего на 15%. То есть урезанная модель становится заметно легче, но при этом сохраняет бóльшую часть своих возможностей.

К сожалению, Claude 3.5 Sonnet, модель июня 2024-го, оказалась на дне рейтинга. Однако её сильная сторона явно не в этом — огромное контекстное окно (200 000 токенов) делает модель отличным инструментом для программирования. Кодеры подтверждают, что она хорошо генерирует длинные и сложные фрагменты кода.

Пока что в тестах не замечено семейства Phi. Phi-4 набирает 80%+ на сложнейших бенчмарках, таких как MATH, уверенно обходя Gemini Pro и GPT-4o-mini. Посмотрим, добавят ли авторы сайта её в дальнейшем🤔

Тем временем пользователи X забили тревогу и решили проверить честность олимпиады, задействовав свежачок от OpenAI — Deep Research. Цель? Выяснить, не мелькали ли эти задачки где-то в Сети раньше и, соответственно, не могли ли их решения заранее попасть в обучающие данные моделей. Ведь если так, то модели получали преимущество.

Нашлось ли что-то подозрительное? Как оказалось, похожие задачи действительно уже обсуждались на форумах.

Задача № 1: найти сумму всех целых оснований b > 9, для которых одно число делится на другое в системе счисления b. Аналогичное задание всплыло на Quora. Однако и различия существенны: на форуме просто рассматривались все возможные значения b, удовлетворяющие делимости, а в олимпиадном варианте — только те, которые больше 9. Это заметно сужает поиск и усложняет задачу.

Задача № 3: найти остаток от деления количества возможных распределений мороженого между игроками с заданными ограничениями. Deep Research нашёл похожую концепцию: обе задачи связаны с разбиением числа на несколько частей с учётом ограничений. Но здесь тоже есть нюансы: в олимпиадной версии обязательно, чтобы каждый из трёх вкусов достался хотя бы одному игроку, причём количество игроков, выбравших каждый вкус, подчиняется неравенству c > v > s. Более того, порядок распределения важен, что добавляет ещё один уровень сложности.

Итог. Похожие? Да. Идентичные? Нет. Найти аналоги почти любой задачи в интернете реально, если искать достаточно хорошо. Так что сказать, что модели видели точно такие же задачи, нельзя.

@yadro_team

10 фев в 12:038.4K

Блог компании YADROC++ * Машинное обучение * Конференции

«Плюсовое» чтиво: ежемесячная рассылка о разработке на С++

Инженеры YADRO пишут не только статьи, но и письма о «плюсах». Подписчики рассылки раз в месяц получают короткую заметку о том, что важно или интересно разработчикам на С++. Какие письма уже выходили:

— Подборка лучших выступлений с Zero Cost Conf с комментариями Константина Владимирова.
— Презентация новой книги Кирилла Колодяжного о машинном обучении на С++.
— Совет, как избежать проблемы с лямбда-корутинами от ведущего инженера Елены Степановой.

Обычно контент из рассылки не найти на других платформах, поэтому оставайтесь на связи, чтобы не пропустить уникальные материалы.

Подписаться на рассылку →

@rajce

9 фев в 06:327.8K

Блог компании BotHubМашинное обучение * Искусственный интеллект

Пост может показаться для некоторых очевидным, но я решил всё-таки его написать, т.к. я обратил внимание, что многие, даже умные люди, сейчас ошибочно считают что современные нейросети - не умеют думать, к примеру, нейросети не могут посчитать сколько будет 2х2, они просто это помнят. Да это было так для LLM вроде gpt4 и claude-sonnet-3.5, но с приходом reasoning нейросетей (LRM) всё поменялось, они научились рассуждать. Они строят вероятностные гипотизы, далее проверяют их, в случае ошибки, переходят к проверке следующей гипотезы и так до бесконечности. Почти как человек.

В начале 2025 вышли новые олимпиадные задачи по математике, которых не существовало во время обучения всех существующих моделей включая Deepseek r1 и o1/o3. Ребята провели тесты, прикладываю результаты, см картинку, как видно, рассуждающие нейросети щёлкают олимпиадные задачки как орехи, в отличие от LLM.

Сэм Альтман заявил что их непубличная топовая LRM модель уже входит в ТОП-50 по рейтингу всех программистов мира, тогда как публичная о3 которая вышла всего два месяца тому назад находится лишь на 175-ом месте, а первая LRM o1 -- была лишь на миллионом месте. До конца года они обещают обойти человека в сфере программирования.

@Oksenija

7 фев в 16:2511K

Python * Алгоритмы * Математика * Машинное обучение * Звук

Увеличиваем точность БПФ. Изобретаем алгоритм для Гитарного Тюнера и оценки точности пения нот вокалистами. Это анонс статьи в разработке. Подписывайтесь на мой профиль на Хабре, чтобы не пропустить статью. Или присоединяйтесь к моей "телеге". Кратко: точности и быстродействия классического БПФ не хватает для точной и быстрой оценки частоты сигнала. Ищем и изучаем другие алгоритмы. Да, я знаю много китайских маленьких приборчиков и прищепок на гитару с весьма точной настройкой, но интересно разобраться как это достигается. Напишите в комментариях какие более точные алгоритмы определения частоты сигнала вы знаете? (я уже нашел несколько, сейчас тестирую, смотрите изображение ниже) На графиках амплитудный спектр суммы 7 синусоид с близкими частотами, интервал наблюдения 0.1 секунды, частота дискретизации 22050 Гц, как видите классический БПФ ошибается и даже не все синусы видит, а альтернатива дает меньшую ошибку и все синусы увидела. Вертикальные красные линии это реально находящиеся в тестовом сигнале синусоиды. Их частоты написаны над верхней границей графиков.

@denis-19

6 фев в 17:1811K

Машинное обучение * Учебный процесс в ITОблачные сервисы * Искусственный интеллект

Подробная шпаргалка по промптам для DeepSeek с универсальной схемой, по которой китайский ИИ выдаст наилучшие ответы.

Маркетинг, кодинг, тексты, коучинг, психология — просто впишите в нейронку нужную вам роль и выбирайте любую задачу.

Например: copy Act as [Marketer] and create a [detailed plan for the brand improvement and promotion]. Show it as a [list]

@SvetaDT

6 фев в 13:176.1K

Блог компании DoubletappМашинное обучение * Natural Language Processing *

7 главных трендов технологий искусственного интеллекта в 2025 году

Многие в интернете начали заявлять, что искусственный интеллект достиг AGI то есть стал искусственным интеллектом общего назначения. Понятие искусственный интеллект появилось в 1956, но только в последние несколько лет обычные люди смогли познакомиться с ним лично, применяя его в работе и развлечениях, благодаря интеграции ИИ в сервисы бизнеса. Сегодня я, Федор Горбунов, руководитель направления машинного обучения в Doubletapp, расскажу какие значимые нововведения появились за 2024 год, чем они полезны и спрогнозируем вектор развития отрасли в будущем.

❓ИИ уже получил возможности человеческого мышления?

❓Когда сгенерированные видео заполонят мир?

❓Есть ли российские аналоги LLM, которые смогут конкурировать с нынешними лидерами?

❓Какие ИИ-инструменты полезно внедрить в бизнес уже сегодня?

Обо всем рассказал Федор Горбунов, руководитель направления машинного обучения Doubletapp.

Для тех, кто предпочитает читать, а не смотреть, опубликовали новость на эту тему, где перечислили ключевые достижения ИИ в 2024 году и тренды, ожидаемые в 2025.

@denis-19

6 фев в 02:079.2K

Машинное обучение * Учебный процесс в ITКарьера в IT-индустрииИскусственный интеллект

Сооснователь компании OpenAI, экс-директор по ИИ и бывший глава отдела разработки автопилота Tesla Андрей Карпаты в новом обучающем трёхчасовом видео рассказал всю базу про нейросети, включая:

претрейнинг: как работает архитектура трансформер, из чего состоит и что такое токены;
файнтюнинг: психология LLM, галлюцинации, исправление ошибок в орфографии и прочие детали;
обучение с подкреплением: как нейросеть учится на обратной связи и улучшает ответы;
последние 10 минут видео — краткая выжимка лекции.

В рамках своей деятельности Карпаты активно занимается записью обучающих видеороликов на YouTube по созданию нейросетей, с пошаговыми инструкциями и выкладывает исходные коды на GitHub по различным проектам, связанным с машинным обучением и развитием нейросетей, включая проект nanoGPT для обучения/настройки GPT среднего размера.

В феврале 2024 года Карпаты выпустил лекцию на Youtube под названием Let's build the GPT Tokenizer. Это двухчасовая понятная и доступная лекция о токенах и токенизации в ChatGPT и других нейросетях. В видео Карпаты буквально на пальцах показывает, как именно нейросеть GPT читает текст, как дробит его на единицы и что в нём выделяет. Учебный материал поможет начинающим пользователям углубиться в изучение нейросетей, а также лучше понимать их устройство. Сопроводительный материал к этой лекции с подробными комментариями к используемому коду Карпаты выложил на GitHub.

1 2 ...

17 18

20 21 ...

33 34

Машинное обучение *

Ближайшие события

Вклад авторов