All streams
Search
Write a publication
Pull to refresh
12
0

Data Scientist

Send message

Красота! Но ничего революционного и экономия на спичках это скучно.


Я давно думаю, как сделать современную фортоподобную систему, которая будет лучше легаси-Форта, в то же время проще и лаконичней. Еще бы переносимость на любую платформу к этому делу присобачить и было б замечательно.
Один умелец реализовал эту идею в виде простой виртуальной машины, но его Форт огромен и за 20 лет разработки там скопилось порядочно мусора.

Возьмем два коллективных разума — СССР и США, диалог у них был довольно странный, да и осознавали они себя довольно сумрачно. В будущем, коллективный разум человечества будет вспоминать этот период как биполярку с расщеплением личности.


У коллективного разума есть "чувства" и "мысли", которые мы никогда не сможем понять и осознать их существование, но это еще цветочки.
Есть теория, которая говорит, что может существовать такая форма разума (возможно созданная искусственным интеллектом), которая может осознавать реальность на еще более высоком уровне, чем коллективный интеллект и вот там полный мрак. Который никогда не развеять, ибо у нашей цивилизации нет категорий, чтобы измерить или даже пронаблюдать причину и следствие на таком уровне. А про то, что отдельный человек сможет осознать какую-то из идей такого порядка и речи не идет — просто не влезет, даже за всю жизнь.


По аналогии, можно предположить, что может существовать разум еще более мощный, но там уже проблемы со скоростью света или какой-нибудь другой физический/информационный предел, который при любых улучшениях не позволяет поднять мощность на следующую ступень и все просто обращается в сингулярность.

В начале нулевых появились наклейки на телефоны и брелоки, которые мигают при звонках и смс. Схема предельно проста — СВЧ-диод замкнутый светодиодом, никаких антенн не требуется при существующих мощностях радиообмена.

За всеми зайцами погонишься — ни одного не поймаешь. Для английского качество отличное. А вот с русским беда, для отдельных слов интонации нормальные, но цельные предложения звучат неестественно.
Я так понимаю, фичи натренированы воспроизводить именно слова, контекст предложения совсем не учитывается. И фичи по n-граммам не работают — иногда при опечатках начинает сильно глючить и выдавать странные звуки.
Старые системы для аудиокниг, на основе склеек, работают гораздо качественней и производительней.


Недавно тоже захотелось разработать TTS модель, архитектура получилась похожая на FastSpeech, пока пытаюсь организовать эффективный расход памяти, потом надо будет навесить кучу эвристической предобработки.
Цель у меня вполне конкретная — добиться "живого" голоса для одного языка, чтобы не стыдно было видео озвучивать или книги. Не знаю закончу ли когда-нибудь, но думаю, что-нибудь качественней голых клонов такотрона в опенсорс еще не скоро выйдет.

Потратить время и ресурсы, но не получить профита это печально.
Тогда ведь уже был faiss и всякие навороты для СУБД, позволяющие делать моментальный поиск векторов разными метриками, всяко шустрей самописных велосипедов.


У меня тоже были мечтания о таком сервисе, но масштабами побольше — захватить твиттер и фейсбук, можно даже собирать имена, номера телефонов, социальные связи.
Самое сложное это воркеры, как ни странно, но общедоступная информация не доступна, поэтому паукам надо имитировать пользователей, долго и нудно вытаскивать информацию. Даже если учесть, что новые пользователи появляются медленней чем происходит индексация, мощности нужны впечатляющие, арендовать ботнет эффективней и дешевле, чем законно арендовать мощности датацентров.


145% у некоторых государств есть такие сервисы для спецслужб, социальные сети это просто потрясающий кладезь информации, которую пользователи сами несут.

Вопрос не только в размытости понятий, но и в пределе развития.


Есть некое устройство, которое решает определенные задачи, можно ли это назвать интеллектом?
Допустим, оно не может решать какие-то задачи (и не сможет), которые решает человек, следовательно по нашей условной оценке это не может быть общим ИИ. Тогда возьмем человека вместо этого устройства и вдруг окажется, что он тоже какие-то задачи решить не может, и тут вопрос, как создать функцию оценки, которую мы не в состоянии понять.
Мы ведь можем создать не ИИ, а тупого болванчика, который будет нас ловко дурить, как того журналиста, а мы это не сможем понять. Или узнаем об этом, когда он будет управлять всем миром.


Можно взять совокупный интеллект человечества, эта сущность на порядки превосходит интеллект одного индивидуума и задачи может решать соответствующие. Возможно, совокупному интеллекту по силам составить программу обучения ИИ, а создать сам ИИ уже не составит труда. Но у нас протоколы взаимодействия за 1000 лет не особо развились, так что скорее ИИ появится случайно, чем в результате теоретически обоснованной разработки.


Поверьте мне, как только кто-то будет иметь идею, план воплощения и конкретную реализацию ИИ — ни у него, ни у других вопросов ИИ это или нет не возникнет!

У меня есть идея, план воплощения, несколько не очень конкретных реализаций. И у меня вопрос. Мышление != разум. Я наблюдаю процесс мышления, это в любой динамической системе можно обнаружить. Но я не могу формально доказать, что оно имеет разум.
Как его обучать? В ML/DL пока нет функции ОбучитьСильныйИИ(). Могу создать симуляцию, набор тестов, но я ограничен.
Если пущу его в реальный мир, буду обучать как животное/человека, а на это требуется уйма времени, тогда при ошибке в архитектуре придется все начинать заново, поэтому хотелось бы это автоматизировать.

Диалог и постановка задачи это не самое главное.


Допустим, мы создали ИИ, как доказать, что это действительно ИИ?
Если оно говорит: "Я мыслю, следовательно, существую", это ничего не доказывает.
Тест Тьюринга с современными мощностями уже не аргумент.
Решает IQ тесты? Примитивная экспертная система или дерево решений их могут щелкать лучше человека.
Даже если решает большинство подаваемых задач, то не факт, что оно сможет развиться лучше обезьяны. Архитектурные ограничения в черном ящике никто не предскажет.

Всякую дичь ремонтировать это себя не уважать. Если все будут ремонтировать только качественные вещи, то люди будут голосовать рублем и производители со временем возьмутся за ум.


Мелкий подвальный ремонт телевизоров и телефонов ощутимой прибыли никогда не приносил и вряд-ли когда-нибудь она будет. КИПовцем или монтажником видеонаблюдения можно заработать немного больше, там и работа проще.
А чтобы развиваться, надо повышать квалификацию это можно сказать про любую отрасль.

Я был уверен, что в финале победят рашеры, 50% лучников и 20% мечников просто раздавят противника, пока он набирает строителей.
У меня лучники при больших потерях переходили в оборону, и выстраивались стенами вокруг базы. В обычном режиме делились на команды застрельщиков, рашеров и диверсантов. Работало все криво, со стандартным поиском пути, выдохся и не сделал нормального микроконтроля.


Самые большие минусы соревнования:


  • никакой баланс
  • победа всяких рандомов на первых этапах (иногда совсем тупые болванчики неделю стояли вровень с умным микроконтролем)
  • запрет работать с диском (У нас вроде соревнование ИИ? Больше похоже на соревнование любителей бахнуть побольше IF-ELSE и велосипедных эвристик)

Можно придумать много разных способов, выбор зависит от бюджета.


Камера считывает лица, извлекает вектора и отправляет в центр. (тут надо довольно дорогую камеру, которая потянет нейронку в реальном времени)


Камеры подключены к хабу, хаб к устройству, которое со своих камер обрабатывает видео и шлет вектора в центр. (сложное обслуживание)


Камеры подключены к хабу, хаб передает видео в центр. В центре видео скармливаются серверам с нейронками. (удобно, дешево, но критичны перебои связи)


Общий принцип работы:
Камера > видео > предварительная обработка > нейросеть > вектор > база данных > список возможных личностей.
Нейросеть выдает компактный набор чисел, которые позволяют довольно точно идентифицировать человека или найти очень похожих.

Соленая, но это может просто соль плохо вымывается. Свободные нуклеиновые кислоты пресно-маслянистые.

В целях безопасности и переносимости. Языки в разных версиях могут быть разные, а форт всегда один.

Очевидно, что форт это надстройка над ассемблером. Но у меня ровно противоположная ситуация. Есть встраиваемый скриптовой язык, если я на нем сделаю форт-систему, работать она будет очень странно. Если я на нем напишу эмулятор процессора, а для этого процессора форт-систему, это будет ужасающе бессмысленная трата ресурсов.


Можно сделать внешний интерпретатор и интерфейс, который будет взаимодействовать с пользователем через оболочку скриптового языка (только не понятно, как и зачем), тогда придется написать интерпретаторы под разные архитектуры (x86, x64, arm, risc), форт хоть и примитивен, его легко будет реализовать, но тащить бесполезные зависимости это сомнительная идея.

Недавно захотелось написать форт-систему на языке высокого уровня, чтобы поддерживался хотя-бы стандарт 83.
Но как-то не получилось. С интерпретируемым языком очень сложно придерживаться стандарта. Приходится делать кучу хаков, чтобы повысить производительность, либо строить одну виртуальную машину внутри другой. В общем, сложный выбор.
Единственный рабочий компромисс — не выполнять шитый код, а все определения слов, дублировать на языке машины и исполнять только их.

Не приняли, так не приняли. Только названия населенных пунктов теперь латиницей написаны, в акиматах вовсю используют латиницу (со скрипом и болью, но используют).

В Казахстане ситуация точно такая же. Особенно весело смотрится взбрыкивание с латиницей, приняли не самую удобную форму записи, но как и ожидалось — ничего не изменилось.

В той статье описано решающее древо поверх HoG, вполне классический подход. Хотя, нейронки обскакали его уже очень давно, но и у них есть ограничения.

Допустим i3wm кушает 200 Мб, с легким браузером или vim вместо мощной IDE будет где-то 1-1.2 гига. Для многих это хорошая альтернатива десктопу и без андроида, который при таком объеме памяти быстро превращается в тыкву.


Размеры, правда у него не телефонные. Если покупать, то придется мастерить ему корпус с хабом и повербанкой. И клавиатуру надо где-то прикрутить, чтобы провод не болтался. Хотя, это уже портативный ноут получается.

IPFS еще и скорость "распаковки" обеспечивает хорошую для любых файлов.
Интересно, сколько раз автору предлагали алгоритм сжатия на основе условного sha256+размер файла.

Скролл с умным автоподбором символов, конфиги будет править не очень удобно. И трех кнопок там точно не хватит, а вот для смарт-часов отличная штука.

Information

Rating
Does not participate
Location
Алма-Атинская обл., Казахстан
Date of birth
Registered
Activity