Как стать автором
Обновить
998.64

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга

💡 Собрали промты, которые помогут освоить любой язык за месяц.

Используем эти 10 промтов в любой нейросети:

— Ежедневный разговорный тренер:
Давай поговорим на [язык] о [тема]. Исправляй мою грамматику, улучшай формулировки и учи естественным выражениям.

— Персонализированный словарь:
Создай список слов на [язык] по моим интересам ([хобби, работа, путешествия]) с произношением и примерами в предложениях.

— Упрощатель грамматики:
Объясни грамматическое правило в [язык]: [вставь правило]. Сравни с английским и приведи запоминающиеся примеры.

— Корректор ошибок:
Вот что я только что сказал: [вставь предложение]. Скажи, правильно ли это, и как бы это произнёс носитель.

— Генератор аудирования:
Дай мне короткий рассказ или диалог на [язык], озвучь его, а затем задай вопросы по содержанию.

— Флюент-план на 30 дней:
Составь 30-дневный план перехода от новичка к разговорному уровню в [язык], с ежедневными упражнениями на говорение, чтение, аудирование и письмо.

— Культурный наставник:
Научи, что считается вежливым, грубым или неформальным в [язык], чтобы я не звучал как робот.

— Тренер произношения:
Научи произносить [трудное слово/звук], включая положение рта и типичные ошибки, которых стоит избегать.

— Расшифровщик фраз:
Переведи фразу, которую я услышал на [язык], и объясни её скрытый смысл, включая сленг и культурный контекст.

— Промт уверенности:
Играй роль доброжелательного преподавателя. Задай мне 3 вопроса начального уровня на [язык] и помоги уверенно ответить, даже если я ошибаюсь.

Хотите больше крутых промптов? 🚀 Присоединяйтесь к нашему телеграм-каналу, где мы делимся ими и не только!

Кстати, недавно сам начал изучение разговорного английского языка и наткнулся на крутого бота в тг - Speakadora AI. За 30 дней неплохо подкачался даже!

Теги:
Всего голосов 4: ↑2 и ↓2+1
Комментарии0

🖥 В Google AI Studio можно БЕСПЛАТНО попробовать новую фичу: нативная генерация изображений той же моделью, что и обрабатывает ваш текст. То самое, что показали OpenAI ещё в мае '24-го (но так и не выпустили, хотя обновления приложений/сайта подсказывают, что скоро должны).

Модель И видит вашу картинку, И рисует сама новую, без вызова отдельной модели, занимающейся генерацией. Это позволяет ей делать попиксельную копию, внося нужные изменения — смотрите примеры. И да, можно загрузить СВОЮ картинку, и после этого просить её перерисовать — так я сделал с крестиками-ноликами.

Можно придумать много всякого крутого, жду ваших креативов в комментариях!

Попробовать тут
(справа нужно выбрать модель «Gemini 2.0 Flash Experimental»)

Еще недавно выходил Firebase Studio — новый интересный сервис от Google, более подробно я рассказал у себя в телеграм-канале.

Теги:
Рейтинг0
Комментарии0

✍️ В ChatGPT прокачали память.

Теперь чат-бот помнит историю всех диалогов, может ссылаться на них и отвечать с учетом предыдущего опыта общения. Так ИИ начет подстраиваться под ваш стиль общения, интересы и задачи, а ответы станут более точными и персонализированными.

Память можно отключить в настройках или редактировать. Доступно для подписчиков Pro и Plus.

Попробовать

В своём телеграм-канале я стараюсь публиковать эти самые новости раньше всех. Велком!

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии1

Сегодня, в международный день космонавтики, Awakari запускает семантический поиск. Поехали!

Новый тип фильтра используется по умолчанию в "простом" режиме создания нового интереса. В продвинутом режиме он назван "Similarity".

Под капотом, Awakari извлекает текстовый сниппет из каждого нового события и конвертирует его в вектор используя языковую модель, которая понимает около 100 языков. Есть выбор из нескольких уровней совпадения:

  • Weak соответствует косинусу угла между векторами ≥ 0,75. Для более слабой фильтрации.

  • Medium: косинус ≥ 0,85. Рекомендуемый уровень по умолчанию, который неплохо работает во многих случаях.

  • Strong: косинус ≥ 0,95. Для получения строго совпадающих результатов.

Теги:
Рейтинг0
Комментарии0

🤯 Кодеры, для вас подгон: VSCode получил бесплатную замену Cursor — Agent Mode. Он анализирует кодовую базу и исправляет ошибки, пока код не выполнится успешно.

Что ещё может Agent Mode:
— Предлагает внести изменения в файлы;
— Выполняет команды в терминале;
— Работает с расширениями, а следовательно может ещё и: управлять браузером и автоматизировать действия, лазить по GitHub, чтобы разобраться с багами, интегрироваться с облачными платформами.

Инструкция по включению прилагается:
— Обновляем Visual Studio Code до последней версии;
— Запускаем VSCode и переходим в режим Chat, нажав на соответствующую кнопку справа;
— Авторизуемся через GitHub;
— В настройках устанавливаем параметр chat.agent.enabled;
— В окне чата выбираем Agent из выпадающего списка.

Про сам Cursor, кстати, неоднократно рассказывал у себя в телеграм-канале!

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Шпаргалка, которая поможет быстро найти нужный ИИ-сервис. Все нейросети актуальные и удобно разбиты по категориям.

Теги:
Всего голосов 4: ↑2 и ↓20
Комментарии1

⚡️Cursor в прошлом: Google выпустила сервис Firebase Studio, который генерирует готовые приложения с нуля.

Из интересного:
— Поддерживает все популярные языки и фреймворки;
— Под капотом мощная Gemini пишет и редачит код за вас;
— Можно закинуть свой проект и работать с ним;
— Завезут умных агентов, которые будут помогать в разработке.

Пользуемся бесплатно — здесь.

Про сам Cursor, кстати, неоднократно рассказывал у себя в телеграм-канале!

Теги:
Рейтинг0
Комментарии0

Представлена подборка из 100 ресурсов для создания ИИ-агентов под большинство задач по всевозможным темам: от RAG, MCP-cерверов, мульти-агентов и саморефлективных моделей до узкоспециализированных агентов для подбора ресторанов, отелей, буста продуктивности и организации рабочих задач.

Теги:
Рейтинг0
Комментарии0

Джон Кармак выступил в защиту ИИ для разработки игр и заявил, что «создание мощных инструментов — ключевой двигатель всего прогресса».

Соавтор Doom и Quake заявил в ответ на критику разработчиков и пользователей, что развитие искусственного интеллекта поможет создавать больше игр и делать их более качественными, а также привлечёт в индустрию новых специалистов. В качестве наглядного примера развития технологий Кармак привёл написание машинного кода для своих первых игр, чем уже никто не занимается. По словам Кармака, сейчас подобное занятие можно сравнивать с «обслуживанием колёс у боевой колесницы», ведь появились игровые движки, которые делают разработку удобнее и эффективнее. Аналогичным образом ИИ-инструменты станут помогать разработчикам в будущем.

Думаю, вы неправильно поняли, что собой представляет эта технодемка, но я всё же отвечу на то, что, как мне кажется, вас волнует, — что ИИ-инструменты обесценивают навыки программистов, художников и дизайнеров.

Мои первые игры создавались вручную: я сам собирал машинный код и превращал персонажей, нарисованных на миллиметровке, в шестнадцатеричные числа. Сегодня всё это стало таким же устаревшим занятием, как обслуживание колёс у боевой колесницы.

Создание мощных инструментов — ключевой двигатель всего прогресса в компьютерной отрасли.

Игровые движки кардинально расширили круг людей, вовлечённых в разработку игр, хотя при этом и отодвинули на второй план ту самую системную инженерию, которую я всегда так ценил.

ИИ-инструменты помогут лучшим из лучших достичь ещё более впечатляющих высот, позволят небольшим командам делать гораздо больше и откроют путь в индустрию совершенно новым группам создателей.

Станет ли рабочих мест в игровой индустрии больше или меньше — вопрос открытый. Всё может пойти по пути сельского хозяйства, где технологии позволили сократить число работников до минимума, сохранив эффективность.

А может — по сценарию соцсетей, где креативное предпринимательство расцвело на всех уровнях. Но в любом случае стратегия «не использовать мощные инструменты, потому что они отнимают рабочие места» не сработает.

Джон Кармак.

Ранее Microsoft опубликовала техническую демонстрацию ИИ-версии игры Quake II, которая работает на базе нейросети Muse. Команда проекта обновила модель машинного обучения так, чтобы она могла генерировать картинку с большим разрешением и с большей скоростью.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

📌 Сохраняем самые интересные нейросети за прошлую неделю, которые вы могли пропустить.

• Gemini 2.5 Pro — теперь доступна бесплатно для всех;
• Runway Gen-4 — вышла новая модель для генерации видео;
• Krea — добавили генерацию 3D-моделей;
• Udio — появилась фича для копирования стиля трека;
• Character-3 — Hedra дали бесплатно потестить генератор ИИ-персонажей;
• Higgsfield — новая видео модель для кинематографичных эффектов;
• Super Agent — универсальный ИИ-агент для любых задач;
• SkyReels-A2 — новая опенсорс модель для генерации видео;
• Midjourney V7 — легендарный генератор изображений обновился впервые за долгое время.

Если вы хотите быть в курсе всех новинок и обсуждений в мире нейросетей, присоединяйтесь к моему телеграм-каналу! Именно там я писал про все эти выше перечисленные нейронки!)

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

Как я выбил 350к в месяц, не написав ни одной строчки кода сам

2025 год. Реалии
2025 год. Реалии

Залетел тут недавно на Хабр почитать про очередные страдания тимлидов, и решил поделиться, как последние полгода зарабатываю на жизнь без этого всего геморроя.

Короче, я открыл для себя вайбкодинг. Не, серьезно, вся эта тема с генерацией кода по описанию — это как будто я нанял себе джуна на полный день бесплатно.

Инструменты

Harvi.pro — мой основной инструмент. Норм генерит фронт по текстовому описанию, меньше заморочек с оплатой для наших:

  • 999₽ — 10М токенов

  • 2499₽ — 25М + 5М бонусом

  • 4999₽ — 50М + 10М бонусом

Под капотом Claude 3.7 Sonnet. Беру средний тариф, хватает на 3-4 недели активной работы.

V0.dev от Vercel — тоже неплохой, но дороговат для меня:

  • Free — 20 генераций

  • Pro — $20 в месяц

  • Team — $30 в месяц

Под капотом тоже Claude 3.7 Sonnet. Качество вроде чуть лучше бывает, но с оплатой сами знаете что.

Replit — тут я собираю всё в кучу, тестирую и деплою. Удобно, что можно быстро показать клиенту результат.

Как это на самом деле работает

Не буду врать, что просто нажимаю кнопку и получаю готовый продукт. Это все еще работа:

  1. Собираю с клиента максимум инфы и референсов

  2. Генерю компоненты по частям (целые страницы редко получаются с первого раза)

  3. Много времени уходит на склеивание и фиксы

  4. Приходится знать хотя бы основы, чтобы понимать, что пошло не так

Но при этом скорость выросла раза в 3-4. Раньше лендинг делал неделю, сейчас — день-два. Простое приложение с формами — было 2 недели, стало 3-4 дня.

Беру в среднем 80-100к за проект, делаю 3-4 в месяц. Вот и выходит около 350к.

Да, чувствую, что теряю навыки в некоторых областях. Зато прокачался в составлении промптов — это теперь как отдельная специальность.

Ручной кодинг... скоро только в музее)))

Теги:
Всего голосов 7: ↑4 и ↓3+3
Комментарии7

Microsoft представила бесплатные курсы Microsoft AI Skills Fest по нейросетям и созданию ИИ-агентов, включая матеориалы на русском языке.

В рамках обучения предоставляются базовые основы и обучение работы с Azure и Copilot. Также на курсах обещают научить создавать ИИ-приложения, ИИ-агентов и применять ИИ в играх.

Теги:
Рейтинг0
Комментарии0

Как продать ИИ-стартап через год после запуска и уйти в инди-хакеры

Почему нейросети в тревеле — это фича, а не бизнес? Как продавать стартап, когда у тебя нет прибыли? Кто покупает ИИ-стартапы в России? Смотрите свежий выпуск «Стартап-секретов»

В гостях Ислам Мидов – сооснователь Copilot2trip https://copilot2trip.com– ИИ-бота для путешествий. Ислам запустил ИИ-стартап в тревел-сфере и всего через год успешно продал его компании Туту.ру. Copilot2trip был построен на генеративных нейросетях и вирально набрал 40’000 пользователей преимущественно из США после запуска на Product Hunt.

После продажи проекта Ислам перешел на формат соло-предпринимательства и запустил ИИ-сервис 2PR.io https://2pr.io для продвижения в LinkedIn.

Ислам рассказал, почему туристический рынок сложен для монетизации, поделился историей быстрой продажи стартапа на ранней стадии и объяснил, почему личный бренд эффективнее платной рекламы для продвижения стартапа.

🔹ТГ-канал Ислама: https://t.me/midov_channel

⚡База знаний по созданию и развитию ИИ-стартапа с нуля: startupsecrets.ru/ai

Темы и тайм-коды на YouTube:

00:00:00 Знакомство с Исламом Мидовым и его проектом Copilot2trip

00:02:36 Откуда взялась идея стартапа Copilot2trip: личный опыт, инсайты из МТС и новая технология

00:08:46 Окно возможностей для AI-стартапов: почему нужно было действовать быстро

00:14:16 Почему туристические стартапы редко становятся успешными: инсайты о лояльности и рынке тревел-приложений

00:18:22 Как продать стартап за год после запуска: стратегия выхода на рынок и сделка с Туту.ру

00:26:06 Сколько денег нужно вложить, чтобы запустить успешный AI-продукт

00:29:47 Почему пользователи не готовы платить подписку за туристические сервисы

00:35:30 Как продать стартап на ранней стадии: инсайты и советы Ислама Мидова

00:59:13 Как Ислам в одиночку и без знаний кода запустил новый ИИ-стартап 2PR.io при помощи ChatGPT

01:06:45 Маркетинг для инди-хакера: почему личный бренд эффективнее платной рекламы

01:15:15 Главный секрет успеха стартапа по версии Ислама Мидова

Где еще послушать выпуск, подписаться и лайкнуть:

Приятного прослушивания!🙌

💙 Подписывайся на подкаст в Телеграм: @podcaststartup

Теги:
Рейтинг0
Комментарии0

Ближайшие события

Глава платформы электронной коммерции Shopify Тобиас Литке опубликовал в соцсети X письмо сотрудникам, в котором рассказал, что использование ИИ стало базовым навыком в компании, который ожидается от каждого сотрудника вообще без исключения:

  • эффективное использование ИИ теперь является базовым ожиданием от каждого сотрудника Shopify. Сегодня это универсальный инструмент, важность которого будет только расти. Откровенно говоря, я не считаю возможным отказаться от изучения навыка применения ИИ в своей работе; вы можете попробовать, но я хочу честно сказать, что не вижу, как это может сработать сегодня, а тем более завтра. Стагнация практически неизбежна, а стагнация — это провал в замедленном режиме. Если вы не карабкаетесь вверх, вы скатываетесь вниз.

  • ИИ должен быть частью фазы прототипирования в любом GSD-проекте (аббревиатура GSD в данном контексте означает Get Stuff Done — философия фокуса на результат и эффективное выполнение задач). Фаза прототипирования любого GSD-проекта* должна включать активное исследование возможностей ИИ. Прототипы предназначены для обучения и создания информации. ИИ радикально ускоряет этот процесс. Вы можете научиться создавать то, что другие члены команды смогут посмотреть, использовать и оценить за долю времени, которое это занимало раньше.

  • мы добавим вопросы об использовании ИИ в наши опросники по оценке производительности и взаимной оценке коллег. Научиться хорошо использовать ИИ — неочевидный навык. Мне кажется, что многие сдаются после того, как написали запрос и не получили сразу идеальный результат. Важно научиться формулировать запросы и загружать контекст, и получение обратной связи от коллег о том, как это происходит, будет ценным.

  • обучение — это самостоятельный процесс, но делитесь тем, что вы узнали. У вас есть доступ к максимальному количеству передовых инструментов ИИ. У нас есть chat.shopify.io, который существует уже несколько лет. Разработчики имеют доступ к proxy, Copilot, Cursor, Claude code — всё настроено и готово к использованию. Мы будем учиться и адаптироваться вместе как команда. Мы будем делиться победами (и поражениями!) друг с другом, экспериментируя с новыми возможностями ИИ, и будем уделять время интеграции ИИ в наших ежемесячных бизнес-обзорах и циклах разработки продуктов. В Slack и Vault есть много мест, где люди делятся разработанными запросами, например #revenue-ai-use-cases и #ai-centaurs.

  • прежде чем запрашивать увеличение штата и ресурсов, команды должны продемонстрировать, почему они не могут выполнить желаемое с помощью ИИ. Как бы выглядела эта область, если бы автономные ИИ-агенты уже были частью команды? Этот вопрос может привести к действительно интересным обсуждениям и проектам.

  • все значит все. Это относится ко всем нам — включая меня и руководящую команду.

Теги:
Рейтинг0
Комментарии1

Как выбрать языковую модель для семантического поиска

Для сопоставления смысла запроса пользователя и смысла чанка в базе знаний нужна языковая модель, которая понимает семантику.

Принцип работы моделей Bi-Encoder и Cross-Encoder
Принцип работы моделей Bi-Encoder и Cross-Encoder

Bi-Encoder — состоит из двух трансформеров encoder-only. С помощью passage-encoder получаются эмбеддинги для всех чанков в базе знаний. Запрос от пользователя кодируется с помощью query-encoder. На этапе поиска высчитывается косинусное расстояние между query-embedding и passage-embedding. Мы получаем поисковую выдачу после ранжирования всех пассажей по убыванию косинусного расстояния. В отличие от следующей архитектуры Cross-Encoder, можно заранее сохранить эмбеддинги для пассажей и использовать их для подсчета расстояния.

Cross-Encoder — трансформер с архитектурой encoder-only и ранжирующим слоем. Этот слой выдает оценку релевантности запроса к пассажу. На вход подается двойка: запрос и пассаж. Cross-Encoder лучше понимает семантическую связь между пассажем и запросом, но для каждого пользовательского запроса он работает медленнее, так как для оценки релевантности запроса и пассажей, cross-encoder нужно запустить N раз, где N — количество пассажей.

Мы будем использовать Bi-Encoder, так как у нас много пассажей в базе знаний.

Для выбора модели удобно использовать открытый бенчмарк MTEB с рейтингом по различным моделям в зависимости от вашей задачи. Для нас лучшей оказалась модель multilingual-e5-large, Bi-Encoder c 560M параметров и размером эмбеддингов в 1024 элемента.

Инженер по разработке ПО искусственного интеллекта Павел Яковлев максимально подробно рассказал в статье, как его команда разрабатывает и оптимизирует семантический поиск по сложным документам: PDF, HTML и DOCX.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии0

MTS AI выпустила Kodify 2 — второе поколение ИИ-ассистента для разработчиков:

  • 7 млрд параметров, 

  • контекст до 32 тыс. токенов, 

  • поддержка 90 языков программирования,

  • OpenAI-совместимый API для простой интеграции с другими системами. 

В отличие от первого поколения Kodify, использующегося c 2024 года лишь в компаниях, входящих в ПАО «МТС», Kodify 2 станет доступен внешним заказчикам.

Новый ИИ-ассистент содержит весь основной функционал для автоматизации и ускорения процесса разработки, включая автодополнение кода, исправление ошибок, генерацию тестов и документации, оптимизацию кода для улучшения производительности, а также преобразование текста в код. 

Подробнее на сайте разработчика. Демо на Java и Python здесь.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии4

«Три генеральных директора Microsoft входят в комнату...» — написал Сатья Наделла, — «и их интервьюирует Copilot!»

В рамках празднования 50-летия Microsoft, генеральный директор Microsoft Наделла присоединился к бывшим генеральным директорам Microsoft Биллу Гейтсу и Стиву Балмеру в забавном двухминутном видео, в котором Наделла просит Copilot «прожарить» каждого из них с помощью ИИ.

«Хорошо, Сатья», — отвечает Copilotт. «Давай добавим перца...».

Copilot: Стив, начнем с тебя. Твой энтузиазм легендарен. Но ты когда-нибудь беспокоился, что твоя энергия может закоротить ИИ? Я имею в виду, даже роботам нужен перерыв на кофе после твоих зажигательных речей.

Стив Балмер: Давай, чувак! Если ты не можешь справиться со мной, ты не сможешь справиться с огромным процентом населения мира! Мы рассчитываем на тебя!

Copilot: Ха-ха, справедливое замечание, Стив. Теперь, Билл, у тебя этот фирменный вдумчивый взгляд. Но ты когда-нибудь думал, что ИИ может испугаться твоего напряженного, думающего лица? Я имею в виду, он как будто ждет момента синего экрана.

Билл Гейтс: Я надеюсь на это. Я имею в виду, что это все, что у меня осталось, поскольку ИИ становятся такими чертовски умными. Именно этот взгляд и моя готовность критиковать отличают меня.

Copilot: И это действительно грозный взгляд, Билл.

Стив Балмер: Copilot, ты когда-нибудь был бы готов критиковать его?

Copilot: Безусловно. Критика — это то, где происходит рост. Теперь, Сатья, ИИ, похоже, твой лучший друг — но ты когда-нибудь беспокоился, что твоя глубокая страсть к ИИ может однажды заставить его управлять шоу, оставив тебя просто наслаждаться поездкой?

Сатья Наделла: Что ж, в тот день, когда ИИ сможет играть как лучший игрок в крикет, который мне нравится, в тот день он сможет управлять шоу, насколько я могу судить.

Copilot: Туше, Сатья. Посмотрим, сможет ли он достичь столетия в крикете, а потом поговорим.

Это был взрыв, джентльмены. За еще 50 лет инноваций и приключений. Ура.

Балмер, Наделла и Гейтс: Ура.

Билл Гейтс: Что бы это ни значило для ИИ. Он случайно не выпивши?

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Anthropic представила Claude For Education для высшего образования

✅ Поощряет критическое мышление, направляя студентов через процесс рассуждений, а не давая прямые ответы.
✅ Сотрудничество с Северо-Восточным университетом, LSE и Champlain обеспечивает равный доступ к ИИ для тысяч студентов по всему миру.
✅ Интеграция с Internet2 и Canvas для внедрения ИИ в преподавание, обучение и администрирование.
✅ Запуск программы Claude Campus Ambassadors и возможности финансирования ИИ-проектов студентов с использованием кредитов API.

Кстати, относительно недавно писал в своём телеграм-канале про Anthropic, они выпустили новую модель Claude 3.7, которая просто унижает всех конкурентов.

Теги:
Рейтинг0
Комментарии0

Друзья!

Я плотно потрудился над созданием образов сказочных персонажей из славянской мифологии. Предлагаю вам познакомиться с несколькими иллюстрациями из серии мох книг “Сказки старой Твери: духи царства Навь“, перейдя по ссылке в мой блог (что-бы коллеги не сочли мой пост за рекламу :-) )

http://chesalov.com/tales-of-old-tver-spirits-of-the-kingdom-of-nav/

Как создать такие изображения вы можете узнать из другой моей книги “Генеративный искусственный интеллект #Forge&flux“, которая является учебным пособием для школьников и студентов, желающих познакомиться с передовыми технологиями искусственного интеллекта. В ней я объясняю простым и доступным языком подходы работы с ИИ, делая их понятными для тех, кто не обладает глубокими теоретическими знаниями. Особое внимание уделено модели FLUX.1, которая стала прорывом в генеративном ИИ, и системе Stable Diffusion WebUI Forge, предоставляющей бесплатный и мощный инструмент для создания уникальных изображений.

Если интересны книги с огромным количеством красивых иллюстраций по славянской мифологии, то вот ссылки на них:

  1. https://ridero.ru/books/skazki_staroi_tveri_dukhi_carstva_nav/

  2. https://ridero.ru/books/skazki_staroi_tveri_dukhi_carstva_nav_2/

  3. https://ridero.ru/books/skazki_staroi_tveri_dukhi_carstva_nav_1/

Теги:
Всего голосов 2: ↑0 и ↓2-2
Комментарии0

Мысли в слух:

Процесс генерации музыки с помощью текстовых нейросетей - является крайне не тривиальной задачей.

У меня был успешный опыт работы с текстовыми моделями для создания векторной и растровой графики и 3D моделей, но с ними проще, так как существуют общедоступные ascii (текстовые) форматы.

С музыкой немного сложнее, тут приходится идти сложным путем, либо текстовым представлением Midi данных, либо путем использования нотной нотации ABC Notation. И то и другое имеет мало общего со стандартной музыкой wav и mp3 формата, тем не менее путем последующих сложных преобразований, мы можем добиться нужного нам результата.

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0