Comments / Profile of Celsius / Habr

Data Scientist

ProfileArticles2PostsNewsComments106

Разместить FORTH в 512 байтах

Celsius Jun 17 2021 at 10:36

Красота! Но ничего революционного и экономия на спичках это скучно.

Я давно думаю, как сделать современную фортоподобную систему, которая будет лучше легаси-Форта, в то же время проще и лаконичней. Еще бы переносимость на любую платформу к этому делу присобачить и было б замечательно.
Один умелец реализовал эту идею в виде простой виртуальной машины, но его Форт огромен и за 20 лет разработки там скопилось порядочно мусора.

+1

Стаи рыб следуют алгоритмам композиционного обучения

Celsius Jun 12 2021 at 14:20

Возьмем два коллективных разума — СССР и США, диалог у них был довольно странный, да и осознавали они себя довольно сумрачно. В будущем, коллективный разум человечества будет вспоминать этот период как биполярку с расщеплением личности.

У коллективного разума есть "чувства" и "мысли", которые мы никогда не сможем понять и осознать их существование, но это еще цветочки.
Есть теория, которая говорит, что может существовать такая форма разума (возможно созданная искусственным интеллектом), которая может осознавать реальность на еще более высоком уровне, чем коллективный интеллект и вот там полный мрак. Который никогда не развеять, ибо у нашей цивилизации нет категорий, чтобы измерить или даже пронаблюдать причину и следствие на таком уровне. А про то, что отдельный человек сможет осознать какую-то из идей такого порядка и речи не идет — просто не влезет, даже за всю жизнь.

По аналогии, можно предположить, что может существовать разум еще более мощный, но там уже проблемы со скоростью света или какой-нибудь другой физический/информационный предел, который при любых улучшениях не позволяет поднять мощность на следующую ступень и все просто обращается в сингулярность.

+2

Батарейки больше не нужны. 5G сигналы как источник беспроводной энергии для IoT

Celsius Apr 25 2021 at 15:33

В начале нулевых появились наклейки на телефоны и брелоки, которые мигают при звонках и смс. Схема предельно проста — СВЧ-диод замкнутый светодиодом, никаких антенн не требуется при существующих мощностях радиообмена.

0

Мы Опубликовали Качественный, Простой, Доступный и Быстрый Синтез Речи

Celsius Mar 30 2021 at 15:32

За всеми зайцами погонишься — ни одного не поймаешь. Для английского качество отличное. А вот с русским беда, для отдельных слов интонации нормальные, но цельные предложения звучат неестественно.
Я так понимаю, фичи натренированы воспроизводить именно слова, контекст предложения совсем не учитывается. И фичи по n-граммам не работают — иногда при опечатках начинает сильно глючить и выдавать странные звуки.
Старые системы для аудиокниг, на основе склеек, работают гораздо качественней и производительней.

Недавно тоже захотелось разработать TTS модель, архитектура получилась похожая на FastSpeech, пока пытаюсь организовать эффективный расход памяти, потом надо будет навесить кучу эвристической предобработки.
Цель у меня вполне конкретная — добиться "живого" голоса для одного языка, чтобы не стыдно было видео озвучивать или книги. Не знаю закончу ли когда-нибудь, но думаю, что-нибудь качественней голых клонов такотрона в опенсорс еще не скоро выйдет.

0

Ещё один поиск Вк по фото

Celsius Mar 20 2021 at 13:26

Потратить время и ресурсы, но не получить профита это печально.
Тогда ведь уже был faiss и всякие навороты для СУБД, позволяющие делать моментальный поиск векторов разными метриками, всяко шустрей самописных велосипедов.

У меня тоже были мечтания о таком сервисе, но масштабами побольше — захватить твиттер и фейсбук, можно даже собирать имена, номера телефонов, социальные связи.
Самое сложное это воркеры, как ни странно, но общедоступная информация не доступна, поэтому паукам надо имитировать пользователей, долго и нудно вытаскивать информацию. Даже если учесть, что новые пользователи появляются медленней чем происходит индексация, мощности нужны впечатляющие, арендовать ботнет эффективней и дешевле, чем законно арендовать мощности датацентров.

145% у некоторых государств есть такие сервисы для спецслужб, социальные сети это просто потрясающий кладезь информации, которую пользователи сами несут.

+1

Постановка задач для универсального интеллекта: у нас нет общего языка

Celsius Jan 22 2021 at 07:31

Вопрос не только в размытости понятий, но и в пределе развития.

Есть некое устройство, которое решает определенные задачи, можно ли это назвать интеллектом?
Допустим, оно не может решать какие-то задачи (и не сможет), которые решает человек, следовательно по нашей условной оценке это не может быть общим ИИ. Тогда возьмем человека вместо этого устройства и вдруг окажется, что он тоже какие-то задачи решить не может, и тут вопрос, как создать функцию оценки, которую мы не в состоянии понять.
Мы ведь можем создать не ИИ, а тупого болванчика, который будет нас ловко дурить, как того журналиста, а мы это не сможем понять. Или узнаем об этом, когда он будет управлять всем миром.

Можно взять совокупный интеллект человечества, эта сущность на порядки превосходит интеллект одного индивидуума и задачи может решать соответствующие. Возможно, совокупному интеллекту по силам составить программу обучения ИИ, а создать сам ИИ уже не составит труда. Но у нас протоколы взаимодействия за 1000 лет не особо развились, так что скорее ИИ появится случайно, чем в результате теоретически обоснованной разработки.

Поверьте мне, как только кто-то будет иметь идею, план воплощения и конкретную реализацию ИИ — ни у него, ни у других вопросов ИИ это или нет не возникнет!

У меня есть идея, план воплощения, несколько не очень конкретных реализаций. И у меня вопрос. Мышление != разум. Я наблюдаю процесс мышления, это в любой динамической системе можно обнаружить. Но я не могу формально доказать, что оно имеет разум.
Как его обучать? В ML/DL пока нет функции ОбучитьСильныйИИ(). Могу создать симуляцию, набор тестов, но я ограничен.
Если пущу его в реальный мир, буду обучать как животное/человека, а на это требуется уйма времени, тогда при ошибке в архитектуре придется все начинать заново, поэтому хотелось бы это автоматизировать.

0

Постановка задач для универсального интеллекта: у нас нет общего языка

Celsius Jan 21 2021 at 16:44

Диалог и постановка задачи это не самое главное.

Допустим, мы создали ИИ, как доказать, что это действительно ИИ?
Если оно говорит: "Я мыслю, следовательно, существую", это ничего не доказывает.
Тест Тьюринга с современными мощностями уже не аргумент.
Решает IQ тесты? Примитивная экспертная система или дерево решений их могут щелкать лучше человека.
Даже если решает большинство подаваемых задач, то не факт, что оно сможет развиться лучше обезьяны. Архитектурные ограничения в черном ящике никто не предскажет.

0

Железячники умирают. Опыт работы в сфере ремонта цифровой техники

Celsius Jan 18 2021 at 15:37

Всякую дичь ремонтировать это себя не уважать. Если все будут ремонтировать только качественные вещи, то люди будут голосовать рублем и производители со временем возьмутся за ум.

Мелкий подвальный ремонт телевизоров и телефонов ощутимой прибыли никогда не приносил и вряд-ли когда-нибудь она будет. КИПовцем или монтажником видеонаблюдения можно заработать немного больше, там и работа проще.
А чтобы развиваться, надо повышать квалификацию это можно сказать про любую отрасль.

+1

История 4го места на Russian AI Cup 2020

Celsius Jan 18 2021 at 08:07

Я был уверен, что в финале победят рашеры, 50% лучников и 20% мечников просто раздавят противника, пока он набирает строителей.
У меня лучники при больших потерях переходили в оборону, и выстраивались стенами вокруг базы. В обычном режиме делились на команды застрельщиков, рашеров и диверсантов. Работало все криво, со стандартным поиском пути, выдохся и не сделал нормального микроконтроля.

Самые большие минусы соревнования:

никакой баланс
победа всяких рандомов на первых этапах (иногда совсем тупые болванчики неделю стояли вровень с умным микроконтролем)
запрет работать с диском (У нас вроде соревнование ИИ? Больше похоже на соревнование любителей бахнуть побольше IF-ELSE и велосипедных эвристик)

0

Нейросети в большом городе. Разбираемся, как они помогают идентифицировать людей, и запускаем собственную нейросеть

Celsius Jan 9 2021 at 11:34

Можно придумать много разных способов, выбор зависит от бюджета.

Камера считывает лица, извлекает вектора и отправляет в центр. (тут надо довольно дорогую камеру, которая потянет нейронку в реальном времени)

Камеры подключены к хабу, хаб к устройству, которое со своих камер обрабатывает видео и шлет вектора в центр. (сложное обслуживание)

Камеры подключены к хабу, хаб передает видео в центр. В центре видео скармливаются серверам с нейронками. (удобно, дешево, но критичны перебои связи)

Общий принцип работы:
Камера > видео > предварительная обработка > нейросеть > вектор > база данных > список возможных личностей.
Нейросеть выдает компактный набор чисел, которые позволяют довольно точно идентифицировать человека или найти очень похожих.

0

Выделяем ДНК банана в домашних условиях

Celsius Jan 3 2021 at 12:28

Соленая, но это может просто соль плохо вымывается. Свободные нуклеиновые кислоты пресно-маслянистые.

+1

Сколько нужно примитивов для реализации форт системы?

Celsius Dec 28 2020 at 06:54

В целях безопасности и переносимости. Языки в разных версиях могут быть разные, а форт всегда один.

0

Сколько нужно примитивов для реализации форт системы?

Celsius Dec 27 2020 at 07:39

Очевидно, что форт это надстройка над ассемблером. Но у меня ровно противоположная ситуация. Есть встраиваемый скриптовой язык, если я на нем сделаю форт-систему, работать она будет очень странно. Если я на нем напишу эмулятор процессора, а для этого процессора форт-систему, это будет ужасающе бессмысленная трата ресурсов.

Можно сделать внешний интерпретатор и интерфейс, который будет взаимодействовать с пользователем через оболочку скриптового языка (только не понятно, как и зачем), тогда придется написать интерпретаторы под разные архитектуры (x86, x64, arm, risc), форт хоть и примитивен, его легко будет реализовать, но тащить бесполезные зависимости это сомнительная идея.

0

Сколько нужно примитивов для реализации форт системы?

Celsius Dec 27 2020 at 06:09

Недавно захотелось написать форт-систему на языке высокого уровня, чтобы поддерживался хотя-бы стандарт 83.
Но как-то не получилось. С интерпретируемым языком очень сложно придерживаться стандарта. Приходится делать кучу хаков, чтобы повысить производительность, либо строить одну виртуальную машину внутри другой. В общем, сложный выбор.
Единственный рабочий компромисс — не выполнять шитый код, а все определения слов, дублировать на языке машины и исполнять только их.

0

Как кыргызский язык стал «русским» и почему это закономерно

Celsius Nov 22 2020 at 04:24

Не приняли, так не приняли. Только названия населенных пунктов теперь латиницей написаны, в акиматах вовсю используют латиницу (со скрипом и болью, но используют).

0

Как кыргызский язык стал «русским» и почему это закономерно

Celsius Nov 20 2020 at 14:54

В Казахстане ситуация точно такая же. Особенно весело смотрится взбрыкивание с латиницей, приняли не самую удобную форму записи, но как и ожидалось — ничего не изменилось.

+3

Сверхэффективная нейронная сеть или гиперсеть

Celsius Nov 17 2020 at 12:34

В той статье описано решающее древо поверх HoG, вполне классический подход. Хотя, нейронки обскакали его уже очень давно, но и у них есть ограничения.

0

Представлен cмартфон PinePhone с KDE Plasma Mobile, который можно использовать как десктоп

Celsius Nov 17 2020 at 10:25

Допустим i3wm кушает 200 Мб, с легким браузером или vim вместо мощной IDE будет где-то 1-1.2 гига. Для многих это хорошая альтернатива десктопу и без андроида, который при таком объеме памяти быстро превращается в тыкву.

Размеры, правда у него не телефонные. Если покупать, то придется мастерить ему корпус с хабом и повербанкой. И клавиатуру надо где-то прикрутить, чтобы провод не болтался. Хотя, это уже портативный ноут получается.

0

О талантах, деньгах и алгоритмах сжатия данных

Celsius Oct 31 2020 at 07:45

IPFS еще и скорость "распаковки" обеспечивает хорошую для любых файлов.
Интересно, сколько раз автору предлагали алгоритм сжатия на основе условного sha256+размер файла.

+2

Клавиатура из пяти кнопок

Celsius Oct 31 2020 at 05:41

Скролл с умным автоподбором символов, конфиги будет править не очень удобно. И трех кнопок там точно не хватит, а вот для смарт-часов отличная штука.

0

3