• Мы Опубликовали Качественный, Простой, Доступный и Быстрый Синтез Речи
    0

    За всеми зайцами погонишься — ни одного не поймаешь. Для английского качество отличное. А вот с русским беда, для отдельных слов интонации нормальные, но цельные предложения звучат неестественно.
    Я так понимаю, фичи натренированы воспроизводить именно слова, контекст предложения совсем не учитывается. И фичи по n-граммам не работают — иногда при опечатках начинает сильно глючить и выдавать странные звуки.
    Старые системы для аудиокниг, на основе склеек, работают гораздо качественней и производительней.


    Недавно тоже захотелось разработать TTS модель, архитектура получилась похожая на FastSpeech, пока пытаюсь организовать эффективный расход памяти, потом надо будет навесить кучу эвристической предобработки.
    Цель у меня вполне конкретная — добиться "живого" голоса для одного языка, чтобы не стыдно было видео озвучивать или книги. Не знаю закончу ли когда-нибудь, но думаю, что-нибудь качественней голых клонов такотрона в опенсорс еще не скоро выйдет.

  • Ещё один поиск Вк по фото
    +1

    Потратить время и ресурсы, но не получить профита это печально.
    Тогда ведь уже был faiss и всякие навороты для СУБД, позволяющие делать моментальный поиск векторов разными метриками, всяко шустрей самописных велосипедов.


    У меня тоже были мечтания о таком сервисе, но масштабами побольше — захватить твиттер и фейсбук, можно даже собирать имена, номера телефонов, социальные связи.
    Самое сложное это воркеры, как ни странно, но общедоступная информация не доступна, поэтому паукам надо имитировать пользователей, долго и нудно вытаскивать информацию. Даже если учесть, что новые пользователи появляются медленней чем происходит индексация, мощности нужны впечатляющие, арендовать ботнет эффективней и дешевле, чем законно арендовать мощности датацентров.


    145% у некоторых государств есть такие сервисы для спецслужб, социальные сети это просто потрясающий кладезь информации, которую пользователи сами несут.

  • Постановка задач для универсального интеллекта: у нас нет общего языка
    0

    Вопрос не только в размытости понятий, но и в пределе развития.


    Есть некое устройство, которое решает определенные задачи, можно ли это назвать интеллектом?
    Допустим, оно не может решать какие-то задачи (и не сможет), которые решает человек, следовательно по нашей условной оценке это не может быть общим ИИ. Тогда возьмем человека вместо этого устройства и вдруг окажется, что он тоже какие-то задачи решить не может, и тут вопрос, как создать функцию оценки, которую мы не в состоянии понять.
    Мы ведь можем создать не ИИ, а тупого болванчика, который будет нас ловко дурить, как того журналиста, а мы это не сможем понять. Или узнаем об этом, когда он будет управлять всем миром.


    Можно взять совокупный интеллект человечества, эта сущность на порядки превосходит интеллект одного индивидуума и задачи может решать соответствующие. Возможно, совокупному интеллекту по силам составить программу обучения ИИ, а создать сам ИИ уже не составит труда. Но у нас протоколы взаимодействия за 1000 лет не особо развились, так что скорее ИИ появится случайно, чем в результате теоретически обоснованной разработки.


    Поверьте мне, как только кто-то будет иметь идею, план воплощения и конкретную реализацию ИИ — ни у него, ни у других вопросов ИИ это или нет не возникнет!

    У меня есть идея, план воплощения, несколько не очень конкретных реализаций. И у меня вопрос. Мышление != разум. Я наблюдаю процесс мышления, это в любой динамической системе можно обнаружить. Но я не могу формально доказать, что оно имеет разум.
    Как его обучать? В ML/DL пока нет функции ОбучитьСильныйИИ(). Могу создать симуляцию, набор тестов, но я ограничен.
    Если пущу его в реальный мир, буду обучать как животное/человека, а на это требуется уйма времени, тогда при ошибке в архитектуре придется все начинать заново, поэтому хотелось бы это автоматизировать.

  • Постановка задач для универсального интеллекта: у нас нет общего языка
    0

    Диалог и постановка задачи это не самое главное.


    Допустим, мы создали ИИ, как доказать, что это действительно ИИ?
    Если оно говорит: "Я мыслю, следовательно, существую", это ничего не доказывает.
    Тест Тьюринга с современными мощностями уже не аргумент.
    Решает IQ тесты? Примитивная экспертная система или дерево решений их могут щелкать лучше человека.
    Даже если решает большинство подаваемых задач, то не факт, что оно сможет развиться лучше обезьяны. Архитектурные ограничения в черном ящике никто не предскажет.

  • Железячники умирают. Опыт работы в сфере ремонта цифровой техники
    +1

    Всякую дичь ремонтировать это себя не уважать. Если все будут ремонтировать только качественные вещи, то люди будут голосовать рублем и производители со временем возьмутся за ум.


    Мелкий подвальный ремонт телевизоров и телефонов ощутимой прибыли никогда не приносил и вряд-ли когда-нибудь она будет. КИПовцем или монтажником видеонаблюдения можно заработать немного больше, там и работа проще.
    А чтобы развиваться, надо повышать квалификацию это можно сказать про любую отрасль.

  • История 4го места на Russian AI Cup 2020
    0

    Я был уверен, что в финале победят рашеры, 50% лучников и 20% мечников просто раздавят противника, пока он набирает строителей.
    У меня лучники при больших потерях переходили в оборону, и выстраивались стенами вокруг базы. В обычном режиме делились на команды застрельщиков, рашеров и диверсантов. Работало все криво, со стандартным поиском пути, выдохся и не сделал нормального микроконтроля.


    Самые большие минусы соревнования:


    • никакой баланс
    • победа всяких рандомов на первых этапах (иногда совсем тупые болванчики неделю стояли вровень с умным микроконтролем)
    • запрет работать с диском (У нас вроде соревнование ИИ? Больше похоже на соревнование любителей бахнуть побольше IF-ELSE и велосипедных эвристик)
  • Нейросети в большом городе. Разбираемся, как они помогают идентифицировать людей, и запускаем собственную нейросеть
    0

    Можно придумать много разных способов, выбор зависит от бюджета.


    Камера считывает лица, извлекает вектора и отправляет в центр. (тут надо довольно дорогую камеру, которая потянет нейронку в реальном времени)


    Камеры подключены к хабу, хаб к устройству, которое со своих камер обрабатывает видео и шлет вектора в центр. (сложное обслуживание)


    Камеры подключены к хабу, хаб передает видео в центр. В центре видео скармливаются серверам с нейронками. (удобно, дешево, но критичны перебои связи)


    Общий принцип работы:
    Камера > видео > предварительная обработка > нейросеть > вектор > база данных > список возможных личностей.
    Нейросеть выдает компактный набор чисел, которые позволяют довольно точно идентифицировать человека или найти очень похожих.

  • Выделяем ДНК банана в домашних условиях
    +1

    Соленая, но это может просто соль плохо вымывается. Свободные нуклеиновые кислоты пресно-маслянистые.

  • Сколько нужно примитивов для реализации форт системы?
    0

    В целях безопасности и переносимости. Языки в разных версиях могут быть разные, а форт всегда один.

  • Сколько нужно примитивов для реализации форт системы?
    0

    Очевидно, что форт это надстройка над ассемблером. Но у меня ровно противоположная ситуация. Есть встраиваемый скриптовой язык, если я на нем сделаю форт-систему, работать она будет очень странно. Если я на нем напишу эмулятор процессора, а для этого процессора форт-систему, это будет ужасающе бессмысленная трата ресурсов.


    Можно сделать внешний интерпретатор и интерфейс, который будет взаимодействовать с пользователем через оболочку скриптового языка (только не понятно, как и зачем), тогда придется написать интерпретаторы под разные архитектуры (x86, x64, arm, risc), форт хоть и примитивен, его легко будет реализовать, но тащить бесполезные зависимости это сомнительная идея.

  • Сколько нужно примитивов для реализации форт системы?
    0

    Недавно захотелось написать форт-систему на языке высокого уровня, чтобы поддерживался хотя-бы стандарт 83.
    Но как-то не получилось. С интерпретируемым языком очень сложно придерживаться стандарта. Приходится делать кучу хаков, чтобы повысить производительность, либо строить одну виртуальную машину внутри другой. В общем, сложный выбор.
    Единственный рабочий компромисс — не выполнять шитый код, а все определения слов, дублировать на языке машины и исполнять только их.

  • Как кыргызский язык стал «русским» и почему это закономерно
    0

    Не приняли, так не приняли. Только названия населенных пунктов теперь латиницей написаны, в акиматах вовсю используют латиницу (со скрипом и болью, но используют).

  • Как кыргызский язык стал «русским» и почему это закономерно
    +3

    В Казахстане ситуация точно такая же. Особенно весело смотрится взбрыкивание с латиницей, приняли не самую удобную форму записи, но как и ожидалось — ничего не изменилось.

  • Сверхэффективная нейронная сеть или гиперсеть
    0

    В той статье описано решающее древо поверх HoG, вполне классический подход. Хотя, нейронки обскакали его уже очень давно, но и у них есть ограничения.

  • Представлен cмартфон PinePhone с KDE Plasma Mobile, который можно использовать как десктоп
    0

    Допустим i3wm кушает 200 Мб, с легким браузером или vim вместо мощной IDE будет где-то 1-1.2 гига. Для многих это хорошая альтернатива десктопу и без андроида, который при таком объеме памяти быстро превращается в тыкву.


    Размеры, правда у него не телефонные. Если покупать, то придется мастерить ему корпус с хабом и повербанкой. И клавиатуру надо где-то прикрутить, чтобы провод не болтался. Хотя, это уже портативный ноут получается.

  • О талантах, деньгах и алгоритмах сжатия данных
    +2

    IPFS еще и скорость "распаковки" обеспечивает хорошую для любых файлов.
    Интересно, сколько раз автору предлагали алгоритм сжатия на основе условного sha256+размер файла.

  • Клавиатура из пяти кнопок
    0

    Скролл с умным автоподбором символов, конфиги будет править не очень удобно. И трех кнопок там точно не хватит, а вот для смарт-часов отличная штука.

  • Дефицит цветов в современных фильмах
    +1

    Видимо, по мнению автора, норма это сериалы/ситкомы. Из фильмов зайдет "Бриллиантовая рука", но там все-таки цвета бледноваты.

  • Определяем пульс по вебкамере в 50 строчек кода
    +1

    Вообще-то имеет место быть вот этот эффект.
    Главную роль играет не цвет, а свет, поэтому можно видеть пульс даже у рубашки.
    И эффективней будет брать local binary pattern, нормировать и прогонять через FFT фильтр, который будет отсекать все частоты, кроме диапазона 40-90 герц.

  • В поисках способа освободить биткоины на сумму $300 000 из старого файла ZIP
    0

    Тонкий клиент. При формировании транзакции он найдет блок, в котором была последняя операция, не скачивая весь блокчейн.

  • «Когнитивное радио» на нейросетях установило связь с МКС
    0

    Ну вообще оно так и работает, ФАРы везде управляются примитивными конечными автоматами — от радара погоды, до боевых беспилотников.
    Тут просто поставили цель — повысить качество связи, а не анализировать состояние атмосферы. Поэтому хоть нейросеть, хоть чёрт в ступе.

  • Мяу-атака удалила уже 4300 баз данных
    +1

    Если я живу в криминальном районе и выставил все вещи на улицу, то как-то глупо будет возмущаться тем, что кто-то их похитил или испортил.

  • Код аудита: поиск дублей, face detection и аномальные изображения
    0

    Прекрасно, когда за дело берутся дилетанты, ни цель поставить, ни матчасть подучить. В итоге получаем непонятно что, непонятно зачем.
    Только переделывая этот колхоз, у кого-то будет сильно пригорать.

  • Пересказ грамматики Ложбана или что мне удалось усвоить
    +1
    Все это хорошо, но корпуса текстов нормальнго нет, язык совсем не живой.
    Большинство изучающих сходятся в том, что фонетика у него довольно кривая. Слишком много шипящих, мелодичность не очень, на слух как гибрид арабского с польским. Если бы заново создать фонетику, с учетом ошибок, которые сделали авторы языка, то может и выстрелить.

    Недавно хотел сделать переводчик [английский — ложбан], но ничего не вышло. Самый большой объем текста на ложбане это логи чата, а параллельный корпус — пара килобайт простых предложений.

    Можно, наверно подключить сообщество для составления парраллельных текстов, чтобы обучать переводчик, но народу там не густо.
  • Пересказ грамматики Ложбана или что мне удалось усвоить
    +1
    Если разобраться, то там все прекрасно.
    Можно никогда их не опускать — всем все будет понятно. Но для быстрой речи, всякие условные скобки и знаки препинания не нужны, человек их легко восстанавливает из контекста.
  • В Facebook показали прототип VR-гарнитуры, похожей на обычные очки
    0
    «Snow Crash» — Neal Stephenson.
    VR это пока еще продукт для фриков. Лучше уж фриковый дизайн, но гармоничный, чем обмылки.
  • Студия Лебедева год использовала нейросеть, выдавая ее за реального дизайнера
    +21
    Как и весь остальной дизайн студии. Такое подозрение, что дизайнерам там годиков по шесть.
  • Почему меня разочаровали результаты Kaggle ARC Challenge
    0
    Цитата из ODS:
    IQ тесты и до машин добрались, жаль только, что их составляют люди. Сначала обрадовался, что наконец-то появился способ измерить сильный интеллект и я могу применить свои идеи. Но глянул внимательней и понял одну важную вещь. Многие задачи слишком абстрактны и ни одна модель, без стороннего опыта их не зарешает. Т. е. мало того, что Франсуа хочет, чтобы ему предоставили думающую машину, так ее надо было родить еще вчера, дать уроки геометрии, а может еще музыки и риторики. Даже чтобы генетикой создать какие-нибудь клеточные автоматы, надо больше данных. А если нет генератора таких задачек, то придется и его делать, чтобы были данные для обучения.


    За $5k предоставить сильный ИИ, такое себе… Лучше от голода околеть, чем отдать неограниченный потенциал за копейки.

    Захардкодить тысячу эвристик, вот как решаются задачи в наше время.
  • Сравнение мозга с нейронной сетью
    0
    Тоже ковыряю в свободное время всякие экзотические вычислители. Могу подтвердить, что мозг в общей идее очень прост, но в деталях там просто кошмар.

    Я разработал архитектуру искусственного «разума, по аналогии с биологическим мозгом. Он может размышлять, усваивать опыт, переучиваться, в зависимости от обстоятельств. Все благодаря паре правил и ограничений, похожих на те, что влияют на реальную нервную систему.

    Но есть несколько проблем. Первая это ограничение по сложности — пока не придумал как оптимизировать это для графических ускорителей, т. к. вычисления происходят не квадратно-гнездовым способом, в отличии от классических нейросетей.

    Вторая — это глобальная архитектура. Мозг живых существ можно условно разделить на „ядро“ и „периферию“, от органов чувств идут сигналы через всякие фильтры и „драйвера“, объединяются в когнитивном ядре. Но физически никакого разделения нет, есть куча модулей, которые плавно друг в друга перетекают, поэтому границы ядра определить невозможно.

    Зрение протекает через всю черепную коробку, моторные функции распределены замысловатыми узлами, мозжечок торчит с огромным деревом спинного мозга. И аккуратно отсекая любую часть, никакой вред разуму не наносится.
    Только если убрать глаз или руку довольно просто, то глубже уже не подобраться с современными технологиями — слишком все плотно упаковано.

    Если разделить эти модули, то поиск архитектуры для искусственного разума, сильно бы ускорился, например, зрительную систему сделать не абсолютным продолжением мозга, а одним модулем в виде камеры с нейроморфным драйвером, управление другими рецепторами и актуаторами тоже вынести в отдельные модули с ограниченным интерфейсом.
  • Снижаем размер ML модели без регистрации и смс
    0
    Для TF и PyTorch уже очень давно есть монте-карло дистилляторы, которые применяются почти в каждом проекте.
    А такое топорное отсечение начали делать еще во времена AlexNet (может еще раньше).
  • Снижаем размер ML модели без регистрации и смс
    +1
    Скорее всего, имелся ввиду аппендикс медиума. towardsdatascience
  • Извините, но онлайн-курсы не сделают вас Data Scientist
    +1
    Ой и правда, чего это я. Надо им это как-то компенсировать.
    В макдональсе мне кофе подает физик-ядерщик, а на работе, админ по хайлоаду и переводчик, не имеют вообще никакого образования.
    Надо будет срочно получить две вышки, а то у нас — обезьян, без соответствующих бумажек, в голове хлебушек. А без бакалавров и магистров так бы лаптями щи и хлебали.
  • Извините, но онлайн-курсы не сделают вас Data Scientist
    +3
    Куча датасетов лежит без дела. Взять тот же kaggle, потыкать то, что дают новичкам, начиная от титаника с ирисами. Потом поискать датасет с интересующей темой и пилить на нем свой проект, попутно разбираясь с документацией к библиотекам и математическими основами.

    Самый здравый способ научиться чему-то практически — практиковаться, а не слушать. Это известно еще со времен Сократа. Но люди все-равно ведутся на ярлыки типа: «Пройди этот урок всего за 999.99 и ты станешь УЧЕНЫМ!!1»
  • НАСА представило новые правила совместного освоения Луны. России предложили подписать соглашение
    +1
    На межгосударственном уровне работает право силы.
    «Объявляется принудительный набор добровольцев для участия в Первой Лунной Войне. Кто не записался добровольно — дезертир, коммунистическая/империалистическая свинья и будет отправлен в принудительном порядке. Наше дело правое, ибо с нами боги и демоны.»
  • Обновление KB4556799 для Windows 10 вызывает проблемы со звуком и создает новый временный профиль пользователя
    0
    На ноутах это известная проблема, чаще всего решается сносом всяких звуковых утилит производителя и установкой официального драйвера, а не того, который сует винда.

    Перейти на другую систему не сложно, надо только понять основные механизмы и немного привыкнуть. После винды или мака, системы на линуксе это просто глоток свежего воздуха, можно легко поменять все, что не нравится, вообще все.
    Раньше убунты были просто омерзительны, все работало криво, а теперь это одна из самых дружелюбных к пользователю систем. Если хочется перейти без боли, стоит выбрать самые популярные — Ubuntu или Manjaro, почти все работает из коробки, а что не работает — легко чинится, ибо благодаря популярности, в интернете есть ответы на все вопросы.

    Стоит заметить, что на ноутах, линукс тоже не очень хорошо себя чувствует, иногда даже приходится править ядро из-за какой-нибудь баго-фичи в железе. Еще стоит внимательно смотреть на минусы используемого ПО. Глючное лучше сразу заменить на альтернативу, чтобы не успеть привыкнуть. Я например, привык к окружению xfce, а оно до сих пор одно из самых глючных, хотя со временем перестал нуждаться во всяких украшательствах и с удовольствием перешел на i3.
  • В «Лаборатории Касперского» разработали биометрическое кольцо для замены реального отпечатка пальца
    –2
    Даже намного хуже. NFC можно легко украсть и легко скопировать, а этот синтетический отпечаток копируется легко, а перевыпускать очень не просто.

    Самый надежный способ идентификации — электронная подпись в чипе, вмонтированном в череп, с интерфейсом мозг-компьютер. Не украсть, не взломать, под пытками подписать не заставить. Только самого главного нет — интерфейса. Будем ждать.
  • SpaceX показала браузерный симулятор стыковки Crew Dragon с МКС. Его может опробовать любой желающий
    +4
    С двух раз разобрался в алгоритме.
    1. Все параметры выравнивать по отдельности, иначе корабль войдет в карданный замок и полностью компенсировать вращение не получится. А с включенной компенсацией подлететь не выйдет, без ПИД-регулятора можно голову сломать.
    2. Отцентровать корабль и погасить все вращения, подлететь на 75 метров, обнулить скорость, поправить уплывшие параметры, повторить на 50, 25 и 5 метрах. В конце, на минимальной скорости ползем к люку и ровняем плывущие параметры.

    Можно даже бота написать, который повторяет все шаги. Интересно, насколько он лучше или хуже будет по расходу топлива, чем высший пилотаж с подлетом на максимальной скорости на ПИДах.
  • Изготовление мини ПК на APU Ryzen или компьютер дальнобойщика
    +7
    Все хорошо, но за жесткий диск боязно, от вибраций он может внезапно помереть.
  • Видеозвонки с виртуальным фоном и опенсорсные инструменты
    –3
    Какой кошмар! Хорошо, что гуру обработки изображений хабр не читают, а то бы сразу утопили за забивание гвоздей микроскопом.
  • Машинный перевод. От Холодной войны до наших дней
    +1
    Вряд-ли можно доказать это математически, язык это такая аморфная структура, которую человек не может объяснить. У лингвистов есть несколько теорий, некоторые вполне себе рабочие, но все держится на каких-то костылях, есть пробелы в логике.
    Взять, например, идеи Ноама Хомского. Можно для многих ситуаций сделать универсальные парсеры и генераторы, вроде-бы даже перевод неплохой получится. Но проблема в том, что большая часть языковых конструкций определяется временем и культурой. Если что-то в языке строго описать и захардкодить, то через десяток лет оно развалится из-за того, что язык, контекст, культура и носители постоянно меняются.

    Тут только два пути — либо ждать, когда все языки сольются в один, либо создать сильный ИИ (второе как-то реалистичней).