• Как перевести речевой аудио-файл в текст с помощью Google translate

    • Tutorial


    Обычно Google translate используют для перевода речи транслируемой микрофоном.


    Но в один момент, автору потребовалось перевести подкаст Медузы в текст.


    Идея лежала на поверхности и наверняка программы для этого должны были присутствовать. Так -же как сделано в Gogle translate.


    Но, гуглением, программы не нашлось, кроме двух сайтов. Которые использовали по уверениям их авторов всю мощь искусственного интеллекта Google.


    Первый нашелся русскоязычный сайт https://speechpad.ru/blog/windows-integration/



    Но, как бы не было обидно, магия не сработала…

    Читать дальше →
  • Разбираем возможности конвертирования HTML в PDF браузером Google Chrome


      Недавно в одном стартапе я решал задачу генерации билетов в формате PDF. На тот момент уже был готов сайт с устоявшимся стеком технологий, поэтому я искал подход, который бы не потребовал использования дополнительных инструментов. В итоге я предложил сперва создавать билеты в формате HTML, а затем конвертировать в PDF с помощью браузера Chrome. Как оказалось, данным способом можно генерировать не только билеты, богато декорированные CSS, но и самые разные отчеты с графиками на JavaScript. В этой статье я расскажу о том, как для этих целей запустить Chrome, дам несколько советов по настройке CSS, а так же обсужу недостатки данного решения.

      Читать дальше →
    • Удаленная работа в режиме full-time: с чего начать, если ты не senior

      На сегодняшний день множество IT-компаний сталкиваются с проблемой поиска сотрудников в своем регионе. Все больше предложений на рынке труда связаны с возможностью работы вне офиса – удаленно.

      Работа в режиме full-time remote предполагает, что работодатель и работник связаны четкими трудовыми обязательствами: контрактом или трудовым договором; чаще всего, определенным нормированным графиком работы, стабильной зарплатой, отпусками и прочими особенностями, которые зачастую присущи тем, кто проводит свой рабочий день в офисе.
      Преимущества постоянной удаленной работы для каждого, кто решил оставить офис, свои. Возможность работать на крупные зарубежные компании без переезда в другой географический регион, стабильность, в сравнении с freelance – это, наверное, основное, что может привлечь нашего соотечественника. Высокий уровень конкуренции – вот основная сложность, с которой сталкивается соискатель, выходя на поиски работы на международном рынке труда.
      Читать дальше →
    • Декодирование капчи на Python

      • Translation
      Это перевод и форма повествования от первого лица сохранена. Автор — Бен Бойтер, бакалавр информационных технологий в Университете Чарльза Стерта (CSU).


      Большинство людей не в курсе, но моей диссертацией была программа для чтения текста с изображения. Я думал, что, если смогу получить высокий уровень распознавания, то это можно будет использовать для улучшения результатов поиска. Мой отличный советник доктор Гао Джунбин предложил мне написать диссертацию на эту тему. Наконец-то я нашел время написать эту статью и здесь я постараюсь рассказать о всем том, что узнал. Если бы только было что-то подобное, когда я только начинал…

      Как я уже говорил, я пытался взять обычные изображения из интернета и извлекать из них текст для улучшения результатов поиска. Большинство моих идей было основано на методах взлома капчи. Как всем известно, капча — это те самые всех раздражающее штуки, вроде «Введите буквы, которые вы видите на изображении» на страницах регистрации или обратной связи.

      Капча устроена так, что человек может прочитать текст без труда, в то время, как машина — нет (привет, reCaptcha!). На практике это никогда не работало, т. к. почти каждую капчу, которую размещали на сайте взламывали в течение нескольких месяцев.

      У меня неплохо получалось — более 60% изображений было успешно разгадано из моей небольшой коллекции. Довольно неплохо, учитывая количество разнообразных изображений в интернете.

      Читать дальше →
    • Распознавание кириллической Яндекс капчи

        Эта статья продолжает цикл об особенностях, слабых сторонах и непосредственно о распознавании популярных капчей.
        В предыдущей публикации мы затронули готовое решение KCAPTCHA, которое несмотря на неплохую защищенность было распознано без сколько-нибудь серьезной предварительной обработки и сегментации, обычным многослойным персептроном.

        Теперь на очереди кириллическая Яндекс капча, с которой, уверен, многие из нас отлично знакомы.

        Итак, мы имеем такую капчу:

        imageimageimage
        Читать дальше →
      • Создаём простую нейросеть

        • Translation
        • Tutorial


        Перевод Making a Simple Neural Network

        Что мы будем делать? Мы попробуем создать простую и совсем маленькую нейронную сеть, которую мы объясним и научим что-нибудь различать. При этом не будем вдаваться в историю и математические дебри (такую информацию найти очень легко) — вместо этого постараемся объяснить задачу (не факт, что удастся) вам и самим себе рисунками и кодом.
        Начнем.
      • Реализация классификации текста свёрточной сетью на keras

          Речь, как ни странно, пойдёт о использующем свёрточную сеть классификаторе текстов (векторизация отдельных слов — это уже другой вопрос). Код, тестовые данные и примеры их применения — на bitbucket (уперся в ограничения размера от github и предложение применить Git Large File Storage (LFS), пока не осилил предлагаемое решение).

          Наборы данных


          Использованы конвертированные наборы: reuters — 22000 записей, watson-й — 530 записей, и ещё 1 watson-й — 50 записей. Кстати, не отказался бы от подкинутого в комменты/ЛС (но лучше таки в комменты) набора текстов на русском.

          Устройство сети


          За основу взята одна реализация описанной тут сети. Код использованной реализации на github.

          В моём случае — на входе сети находятся векторы слов (использована gensim-я реализация word2vec). Структура сети изображена ниже:


          Вкратце:

          • Текст представляется как матрица вида word_count x word_vector_size. Векторы отдельных слов — от word2vec, о котором можно почитать, например, в этом посте. Так как заранее мне неизвестно, какой текст подсунет пользователь — беру длину 2 * N, где N — число векторов в длиннейшем тексте обучающей выборки. Да, ткнул пальцев в небо.
          • Матрица обрабатывается свёрточными участками сети (на выходе получаем преобразованные признаки слова)
          • Выделенные признаки обрабатываются полносвязным участком сети

          Стоп слова отфильтровываю предварительно (на reuter-м dataset-е это не сказывалось, но в меньших по объему наборах — оказало влияние). Об этом ниже.
          Читать дальше →
        • Cython: более чем 30-кратное ускорение Python-кода

          • Translation
          Python — это язык, который любят многие программисты. Этим языком невероятно легко пользоваться. Всё дело в том, что код, написанный на Python, отличается интуитивной понятностью и хорошей читабельностью. Однако в разговорах о Python часто можно слышать одну и ту же жалобу на этот язык. Особенно тогда, когда о Python говорят знатоки языка C. Вот как она звучит: «Python — это медленно». И те, кто так говорят, не грешат против истины.

          В сравнении со многими другими языками программирования Python — это, и правда, медленно. Вот результаты испытаний, в ходе которых сопоставляется производительность разных языков программирования при решении различных задач.



          Есть несколько способов ускорения Python-программ. Например, можно применять библиотеки, рассчитанные на использование нескольких ядер процессора. Тем, кто работает с Numpy, Pandas или Scikit-Learn, можно посоветовать взглянуть на программный комплекс Rapids, позволяющий задействовать GPU при проведении научных расчётов.
          Читать дальше →
        • Как власти Казахстана пытаются прикрыть свой провал с внедрением сертификата

            Этот пост раньше назывался иначе, но модераторы попросили его изменить и убрать негатив, хотя это и сказалось на смысле, с моей точки зрения. Тем не менее, держите факты.

            image

            В июле я опубликовал на Хабре новость, о том что власти Казахстана обязали всех жителей Астаны установить сертификат для осуществления MITM атаки на их данные, передаваемые через мобильные сети. Новость была резонансная, набрала много комментариев, и до сих пор «тлеет»: Готовьтесь и вы, россияне, к MITM в лице государства, как это стало в Казахстане. Я стал внимательно отслеживать эту тему, читал все новости и статьи с подходящей тематикой. Мне интересно было, как на это событие отреагируют организации: как международные, так и всякие казахстанские «интернет ассоциации».

            Хорошую статью по этой теме выпустила относительно недавно Cencor Planet, которая держала руку на пульсе и отслеживала ситуацию по этой атаке. Вот статья с securitylab про это: Правительство Казахстана перехватывает трафик Facebook, VK и Google
            Читать дальше →
          • Игрушка ГАЗ-66 на пульте управления. Часть 1

            main

            Несколько последних лет хотелось заполучить игрушку на пульте управления и обязательно с видео. Но не купить готовую, а сделать самому. И в итоге заказал себе вот такую игрушку, с простенькой системой управления, но большим потенциалом для модернизации. На все работы от старта и до почти завершения ушло ~ 9 месяцев. Большую часть этого времени ждал комплектующие из Китая.
            Статью пишу по большей части для себя, что бы в дальнейшем не забыть что делал, как, зачем и почему.
            Она будет содержать две основные части: аппаратную и программную и возможно еще одну часть про компоновку железа. Сначала опишу аппаратную часть, из чего собирал, с какими проблемами сталкивался и как их решал.

            Читать дальше →
          • Хабрамегарейтинг: лучшие статьи и статистика Хабра за 12 лет. Часть 2/2

              Привет, Хабр.

              В первой части были рассмотрены некоторые закономерности развития такого интересного ресурса, как habrahabr. Материал получился длинный, так что продолжение здесь. В этой части мы заодно посмотрим как строить такие картинки, и наконец, завершим нашу статистику и рейтинг.



              Кому интересны результаты, прошу под кат.
              Читать дальше →
            • Отдам библиотеку в хорошие руки

                Давным давно, в 2008 году, когда я работал над своей диссертацией меня заинтересовала тема применения сверточных нейронных сетей для задач распознавания изображений. На тот момент они еще не были так популярны как сейчас и попытка найти готовые библиотеки ни к чему не привела — нашлась только реализация на Lush (языке созданном автором сверточных сетей, Яном ЛеКуном). Тогда я подумал, что можно было бы их реализовать на Матлабе используя Neural Network Toolbox. Но столкнулся с невозможностью реализации разделяемых весов в рамках этого тулбокса. И тогда было принято решение написать собственную реализацию.
                Читать дальше →
                • +57
                • 24.2k
                • 6
              • Собираем Wi-Fi робота



                  Давно мечтал сделать Wi-Fi робота, которым можно было бы управлять удаленно. И вот наконец настал тот день когда я смог управлять роботом через интернет, видеть и слышать все что происходит вокруг него.
                  Заинтересовавшихся приглашаю под кат
                  Читать дальше →
                • Много бесплатных книг по программированию

                  • Translation
                  image

                  Списки книг




                  Программирование графики


                  Читать дальше →
                • Кросс-компиляция OpenCV 4 для Raspberry Pi и BeagleBone Black

                  Всем привет.

                  Когда я захотел установить OpenCV на свою малинку для одного проекта, я был сильно разочарован результатом. Оказалось, что для новых версий образов Raspbian с поддержкой Python3.7 невозможно установить из репозитория библиотеку столь привычной командой pip install.
                  Читать дальше →
                  • +22
                  • 5.1k
                  • 6
                • 12 шагов по поиску удаленной работы

                  Привет, меня зовут Игорь. Я десять лет работал в офисе, но год назад решился и перешел на удаленную работу. Для начала скажу, что теперь меня палкой не загонишь в офис! Перейти на удаленку было лучшее решение в моей жизни.
                  ... Написание каркаса резюме... Анализ рынка... Анализ конкурентов... Написание резюме...
                • Опыт применения GSM модуля в домашней автоматизации

                    На даче холодно, и вы хотите за несколько часов до своего приезда туда включить обогреватель, или вас беспокоит возможность аварийного отключения системы отопления загородного дома в ваше отсутствие. Все эти проблемы можно решить с помощью GSM модуля, который умеет отправлять и получать SMS сообщения и реагировать на них, включая и выключая нужную нагрузку. В теории все просто, на практике же на пути реализации подобного устройства есть множество подводных камней.

                    image
                    Читать дальше →
                  • Vision-based SLAM: стерео- и depth-SLAM

                    • Tutorial
                    После небольшого перерыва мы продолжаем серию статей-уроков по SLAM. В предыдущих выпусках мы подготовили программное окружение, а также поработали с монокулярным SLAM. Под катом – урок по использованию SLAM на основе стереокамеры и камеры глубины. Мы расскажем о настройке пакетов и оборудования и дадим советы по использованию двух ROS-пакетов: ставшего традиционным RTAB-Map и свежего вкусного ElasticFusion.


                    Читать дальше →
                    • +12
                    • 13.7k
                    • 9
                  • Котики против нейросети. Или выбираем и запускаем нейросеть для распознавания объектов на Raspberry Zero

                      Добрый день всем.

                      Крохотный компьютер Raspberry — замечательная вещь. Я использовал Raspberry Zero W в паре проектов в течение последнего полугода. Подкупила простота протипирования и откатки различных идей. А теперь вот факультативно заинтересовал вопрос, потянет ли сей девайс полноценную сверточную сетку? [Спойлер — потянет, но есть забавые нюансы]. Кому интересна тема — добро пожаловать под кат. Осторожно, будет много котиков!

                      image
                      Читать дальше →