Мой первый успех в литературе случился в 17 лет. Тогда я стал призёром олимпиады по русскому языку среди абитуриентов в вузы с сочинением: “Почему еврей Розенталь устанавливает правила русского языка”.
User
Привет, Хабр!
Cognitive Technologies вложила 7,3 млн долларов в программу по распознаванию текстов
Cognitive Technologies является одним из лидеров российского рынка программного обеспечения, по их мнению проект сможет заработать свыше 1,8 млн долл только за первый год после запуска.
Инвестиции не такие большие, по сегодняшним меркам, а для Cognitive Technologies эти 7,3 млн долл. всего лишь какие то 7,3 млн долл. Однако нам очень хочется, чтобы им удалось оказать значительное влияние на развитие данного сегмента в целом.
Как тестировщики взламывали частушку
Привет Хабр, меня зовут Влада, я - HR в компании Аквариус. В этом году мы поучаствовали в конференции для тестировщиков Heisenbug. Там каждый желающий мог посмотреть вблизи наши новейшие модели ноутбуков, телефонов, планшетов, а также заглянуть внутрь сервера и узнать, где расположены все его составляющие. Участники подходили, ковырялись в сервере как дети в конструкторе Лего :) и с удовольствием слушали объяснения наших инженеров.
Но у нас на стенде было не только железо. Мы провели необычную активность - устроили конкурс частушек про тестирование и сервера. Это было классно! Все желающие могли проявить свои творческие таланты, а мы в итоге собрали целый сборник частушек о наболевшем с юморком и рифмой. В статье - лучшие образцы, заглядывайте под кат, чтобы насладиться творениями коллег и посетителей стенда.
В заданных условиях: импортозамещение ПО и как ИТ-специалистам с этим жить
Импортозамещение продолжается ― президент подписал поручение, по которому все государственные компании обязаны перейти на базовое российское ПО к 2025 году.
Представители Минцифры сообщили, что это в первую очередь коснется операционных систем, офисных пакетов, виртуализации и систем управления базами данных.
Но даже не в государственных компаниях происходят изменения: импортный софт перестал легально продавать лицензии. Что делать в такой ситуации?
Использовать импортный софт нелегально грозит штрафами, репутационным ущербом и даже уголовной ответственностью. Выход ― переходить на российские аналоги.
Бизнес ставит ИТ-специалистов перед фактом: закупаем и внедряем новый софт. Это надо делать в сжатые сроки, учесть все аспекты, чтобы ИТ-инфраструктура корректно работала и производительность сотрудников не снижалась.
В статье эксперты «Инферит ИТМен» рассмотрят, к каким проблемам импортозамещение ПО приводит уже сейчас и как их минимизировать.
Что такое «Big Data»?
Как работает Wine
Wine — это свободное программное обеспечение для запуска Windows-приложений на нескольких POSIX-совместимых операционных системах, включая Linux, macOS и BSD.
Если вы любите Linux, то наверняка когда-то запускали Wine. Возможно, для какой-то «важной» программы Windows, у которой нет аналога под Линуксом, или поиграться. Забавный факт: даже Steam Deck от Valve запускает игры через оболочку на основе Wine (она называется Proton).
За последний год я намучился с отладчиком, который позволяет одновременно дебажить и Wine, и Windows-приложение в нём. Разобраться во кишочках Wine оказалось очень интересно! Я-то раньше много им пользовался, но никогда не понимал механику целиком. Можно взять файл Windows — и просто запустить его в Linux без каких-либо изменений. Если вы хотите знать, как это сделано, добро пожаловать под кат.
Почему нашего филина зовут Гуамоколатокинт
Привет, Хабр! Меня зовут Николай Камнев, и я директор по развитию группы компаний Setere. Мы специализируемся в области нативной разработки под Linux и благодаря импортозамещению работы у нас достаточно, но рассказать я хочу о том, как мы взяли под опеку животное в Ленинградском зоопарке.
Расщепляем Malware PDF. Практический разбор фишинга на примере GetPDF от Cyberdefenders.com
Привет, Хабр! Меня зовут Антон, я ведущий инженер по ИБ в компании R-Vision, принимаю активное участие в развитии экспертизы в части расследования инцидентов и реагирования на них. А в свободное время я увлекаюсь расследованиями в направлении Digital Forensics & Incident Response (DFIR), Malware Analysis.
В последнее время публичное пространство пестрит новостями о резонансных инцидентах в России и мире, связанных с фишинговыми атаками на крупные компании и государственный сектор.
Замечу, что одной из самых популярных техник взлома крупных мировых корпораций был и остается фишинг с вредоносным вложением T1566.001. Пожалуй, яркий тому пример – взлом Garmin в июле 2020 года, когда известный производитель умных устройств подвергся атаке хакеров-вымогателей. Преступники атаковали системы Garmin с помощью малвари WastedLocker. В результате, сервисы компании на три дня вышли из строя, так как авторы малваря зашифровали данные и требовали выкуп в размере $10 млн за ключи дешифровки.
Как известно, логика подобного проникновения в инфраструктуру довольно проста: атакующие проводят таргетированную фишинговую кампанию – targetor sprear[T1566.001], доставляют в корпоративную среду зловреды с помощью рассылки электронных писем с вредоносными вложениями и ссылками. Пользователь открывает файл (pdf, xlsx, docx и др.), тем самым запуская вложенный туда вредоносный код, который подгружает недостающие для атаки компоненты (вирусы, трояны, шифровальщики, бэкдоры и тд.).
В этой статье я не буду углубляться в тактики и инструменты фишинговых атак, а хочу поделиться с вами личным опытом разбора техники с фишингом вредоносного файла * pdf и наглядно продемонстрировать ход расследования подобного инцидента на примере лабораторного задания GetPDF с ресурса Cyberdefenders.
Помощь и просьба о ней. Статья про информационную безопасность для рядовых пользователей
Еще один способ генерации PDF
Почему PDF? Формат PDF позволяет создавать документы с целым рядом неоспоримых преимуществ: открытость, кроссплатформеность, распространенность и, что очень важно, точностью и неизменностью передачи данных по цепочке создание, просмотр и печать.
В чем соль? В использовании SVG файлов как шаблонов с возможностью подстановки необходимых полей с последующим преобразованием в PDF.
Какие преимущества? Возможность создания и быстрого редактирования очень сложных шаблонов в привычных векторных редакторах, таких как Adobe Illustrator, Corel Draw или Inkscape. Простота программирования и использование только бесплатных программных средств. Еще одним важным преимуществом является возможность прозрачно использовать UTF-8 для вставляемых текстов.
Что для этого надо? Для использования данного метода нужен выделенный сервер с возможностью установки своих приложений (Inkscape и GhostScript) и выполнением system-команд. При этом всё будет работать как на Windows платформе, так и на Linux.
Почему так сложно извлекать текст из PDF?
Согласно распространённым представлениям, извлечение текста из PDF не должно быть такой уж сложной задачей. Ведь вот он, текст, прямо у нас перед глазами, и люди постоянно и с большим успехом воспринимают содержимое PDF. Откуда взяться трудностям в автоматическом извлечении текста?
Оказывается, точно так же, как работа с именами людей сложна для алгоритмов из-за множества пограничных случаев и неправильных предположений, так и работа с PDF сложна из-за чрезвычайной гибкости PDF-формата.
Основная проблема в том, что PDF не предполагался как формат для ввода данных – его разрабатывали, как канал вывода, дающий возможность тонкой подстройки вида итогового документа.
Как я дообучал Tesseract и что из этого получилось
Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а так же ввиду наличия большого количества документов сомнительного качества, поулучшав пайплайн разными методами, было принято решение попробовать улучшить и сам тессеракт.
Инструкция от разработчиков https://tesseract-ocr.github.io/tessdoc/Home.html не всегда сразу понятна и очевидна, поэтому и появилась мысль записать свой опыт в эту статью.
У меня на компьютере стоит Linux Mint 20.2 Cinnamon, поэтому все действия происходят в этой системе и я не могу гарантировать, что все получится точно так же в Windows или Mac.
Для начала необходимо установить бибилиотеку tesseract на компьютер. Делается это достаточно просто. Сначала проверю версию, которая уже установлена (как правило в комплекте с Linux уже есть пакет tesseract). В терминале набираем
Тестовое задание по дизайну: торг, гнев, ресёч, презентация
Не люблю тестовые задания. Проверить и дать фидбэк иногда может занять столько же времени, сколько сделать само задание. Сейчас есть чем заменить тестовые, особенно при найме старших дизайнеров или лидов. Но если вы мидл или джун, и за вас ещё не говорят предыдущие места работы в резюме, рекомендации и невероятное портфолио, без тестового задания будет сложно и компании, и вам.
Последние 5 лет я проверял тестовые задания, но до этого больше 7 лет я их выполнял. Без тестового просто невозможно было никуда откликнуться.
Тестовые задания всегда были предметом споров: делать или не делать, бесплатно или за деньги, слишком большое или непонятное, ничего не ответили или фидбек невнятный… Хочу поделиться, как я сейчас подходил бы к выполнению тестовых заданий и на что я обычно обращаю внимание при их проверке.
Разбираемся со сканерами в Linux: получение информации об устройстве и поиск подходящего драйвера
Перед вами исчерпывающее руководство по идентификации, установке и настройке сканирующих устройств в операционной системе (ОС) Linux. Описанные приемы и рекомендации применимы ко всем популярным дистрибутивам лишь с незначительными отличиями в виде различных пакетных менеджеров и используемых директорий с конфигурационными файлами.
В первой части коснемся вопроса сбора информации об устройстве при помощи системных утилит, входящих в состав ОС, а также программ от разработчиков SANE. Расскажем, как физическое устройство (например, МФУ) представляется в ОС сразу и принтером, и сканером, и много ещё чем. Обязательно затронем тему дескрипторов и детально рассмотрим значение каждого из них. База, так сказать. Заглянем в типовой пакет проприетарного драйвера и на примерах покажем, как он должен выглядеть в идеальном современном мире. Глазами разработчиков SANE, конечно. Мы не будем с ними спорить.
Как оценивать проектные задачи, чтобы не слить бюджет и не убить команду: советы QA-лида
Привет, Хабр! Я Костя — Lead QA в tekmates. Мы в компании создаём цифровые продукты для бизнеса. Проработав более трёх лет проджект-менеджером и больше года лидом QA-инженеров, я много раз оценивал задачи по времени выполнения. И не всегда это давалось (да и даётся) легко…
В этой статье поделюсь техниками для оценки проектных задач: на тестирование, разработку, техдолгов, архитектурных исследований и прочих. Будет полезно всем, кто участвует в проектной работе, но в первую очередь менеджерам и лидам команд разработки, аналитики и тестирования.
Версии, библиотеки, совместимость: какие ещё проблемы я вижу в разработке под Linux
Привет, Хабр! Меня зовут Олег Ивченков, и я управляю группой компаний Setere. У нас есть продукт: берем скан бумажного документа, распознаем его и переводим в редактируемый формат. Классическая OCR‑система. Под капотом — C++, QT, QML, немного python`а. Работаем под Linux только как десктопное приложение. И именно о Linux я хотел поговорить. У меня накопилось много опыта за более чем десять лет разработки, и хочу рассказать о тех проблемах, которые сейчас вижу в области разработки под Linux.
Главную проблему я бы озвучил так: «неконтролируемое множество». И от неё ответвляются много разных других. О них-то я и расскажу в статье, которая должна быть полезна всем, кто так или иначе связан с разработкой под Linux. Если вы прочитаете материал и почувствуете то же, что и я — добро пожаловать в комментарии, обсудим!
Еще год назад, в рамках круглого стола «Импортозамещение» Форума ассоциации Руссофт я предложил профессионалам отрасли поговорить о такой важной теме, как «реалии нативной разработки для отечественных операционных систем». Точнее не просто реалии, а — этой самой разработки сложности, по моим ощущениям приобретающие как минимум линейный рост. Прошедший год показал, что рост проблем не линейный, так что основные тезисы того выступления и несколько новых деталей стали моей первой публикацией на Хабре.
Боль не только моей компании, но и компаний коллег, начну описывать с общей информации по рынку. Согласно данным, любезно предоставленным ассоциацией «Руссофт» — год от года время на разработку решений для Windows в России постепенно снижается, а для систем семейства Linux — неуклонно растет. Помимо достаточно очевидного факта снижения интереса к Windows в нашей стране в принципе, увеличение времени разработки для Linux‑систем связано и с еще одним немаловажным фактором. Этот фактор — существенно возросшая сложность разработки, связанная с количеством Linux‑систем, их технологическим разнообразием.
Три года назад…
Время — великая вещь! И читая сейчас обзор первого iPhone от Mobile Review, датированный 2007 годом, сдерживать смех тяжело.
Оттуда же: «Мы определились с тем, что это за телефон, поняли, что это не бизнес аппарат и не мультимедийный комбайн.»
О роли изменений
В конструкторском отделе он спросил, участвует ли Porsche в гоночных соревнованиях Le Mans (считается главной гонкой для компаний, производящих спортивные машины). «Нет, — ответили ему, — не участвуем». Это было странно, ведь Porsche — один из лидеров в производстве гоночных машин. Тогда Питер поставил перед ними амбициозную задачу: «Давайте сконструируем машину, которая победит в гонке Le Mans!».
31 тезис
Information
- Rating
- Does not participate
- Registered
- Activity