Pull to refresh
2
0
Камнев Николай @Kamnevn

User

Send message

Как кандидат наук продал 230 000 экземпляров своих книг с намеком на мат в заголовке

Level of difficultyEasy
Reading time16 min
Views59K

Мой первый успех в литературе случился в 17 лет. Тогда я стал призёром олимпиады по русскому языку среди абитуриентов в вузы с сочинением: “Почему еврей Розенталь устанавливает правила русского языка”.

Читать далее
Total votes 117: ↑94 and ↓23+100
Comments158

Привет, Хабр!

Reading time2 min
Views2.7K
Мы рады приветствовать всех посетителей сайта Хабрахабр! Мы это компания Cognitive Technologies.Вероятнее всего вы слышали или даже пользовались нашими продуктами, а об одном из них — OCR CuneiForm, на Хабре уже было несколько упоминаний:Наша компания занимаемся разработкой ПО и научными исследованиями в области обработки структурированной и неструктурированной информации, то есть обработкой контента в самом широком смысле этого слова. Это технологии распознавания документов (OCR/ICR), обработки изображений, распознавания речи, анализа данных и понимания документов.
Читать дальше →
Total votes 7: ↑4 and ↓3+1
Comments2

Cognitive Technologies вложила 7,3 млн долларов в программу по распознаванию текстов

Reading time2 min
Views3.9K
Сегодня компания Cognitive Technologies объявила об инвестициях в размере 7,3 млн долл. в разработку ПО для распознавания печатных и рукописных текстов.

Cognitive Technologies является одним из лидеров российского рынка программного обеспечения, по их мнению проект сможет заработать свыше 1,8 млн долл только за первый год после запуска.



Инвестиции не такие большие, по сегодняшним меркам, а для Cognitive Technologies эти 7,3 млн долл. всего лишь какие то 7,3 млн долл. Однако нам очень хочется, чтобы им удалось оказать значительное влияние на развитие данного сегмента в целом.
Читать дальше →
Total votes 4: ↑2 and ↓20
Comments5

Как тестировщики взламывали частушку

Level of difficultyEasy
Reading time4 min
Views3.1K

Привет Хабр, меня зовут Влада, я - HR в компании Аквариус. В этом году мы поучаствовали в конференции для тестировщиков Heisenbug. Там каждый желающий мог посмотреть вблизи наши новейшие модели ноутбуков, телефонов, планшетов, а также заглянуть внутрь сервера и узнать, где расположены все его составляющие. Участники подходили, ковырялись в сервере как дети в конструкторе Лего :) и с удовольствием слушали объяснения наших инженеров.

Но у нас на стенде было не только железо. Мы провели необычную активность  - устроили конкурс частушек про тестирование и сервера. Это было классно! Все желающие могли проявить свои творческие таланты, а мы в итоге собрали целый сборник частушек о наболевшем с юморком и рифмой. В статье - лучшие образцы, заглядывайте под кат, чтобы насладиться творениями коллег и посетителей стенда.

Читать далее
Total votes 14: ↑12 and ↓2+16
Comments1

В заданных условиях: импортозамещение ПО и как ИТ-специалистам с этим жить

Reading time5 min
Views5.5K

Импортозамещение продолжается ― президент подписал поручение, по которому все государственные компании обязаны перейти на базовое российское ПО к 2025 году.

Представители Минцифры сообщили, что это в первую очередь коснется операционных систем, офисных пакетов, виртуализации и систем управления базами данных.

Но даже не в государственных компаниях происходят изменения: импортный софт перестал легально продавать лицензии. Что делать в такой ситуации?

Использовать импортный софт нелегально грозит штрафами, репутационным ущербом и даже уголовной ответственностью. Выход ― переходить на российские аналоги.

Бизнес ставит ИТ-специалистов перед фактом: закупаем и внедряем новый софт. Это надо делать в сжатые сроки, учесть все аспекты, чтобы ИТ-инфраструктура корректно работала и производительность сотрудников не снижалась.

В статье эксперты «Инферит ИТМен» рассмотрят, к каким проблемам импортозамещение ПО приводит уже сейчас и как их минимизировать.

Читать далее
Total votes 12: ↑10 and ↓2+11
Comments17

Что такое «Big Data»?

Reading time5 min
Views19K
Термин «большие данные» или «big data» начал набирать популярность с 2011 года. Сегодня его хотя бы раз слышал каждый. Проблема в том, что часто понятие используют не по определению. Поэтому давайте подробно разберемся, что это такое.

image
Читать дальше →
Total votes 13: ↑4 and ↓9+1
Comments3

Как работает Wine

Reading time10 min
Views76K


Wine — это свободное программное обеспечение для запуска Windows-приложений на нескольких POSIX-совместимых операционных системах, включая Linux, macOS и BSD.

Если вы любите Linux, то наверняка когда-то запускали Wine. Возможно, для какой-то «важной» программы Windows, у которой нет аналога под Линуксом, или поиграться. Забавный факт: даже Steam Deck от Valve запускает игры через оболочку на основе Wine (она называется Proton).

За последний год я намучился с отладчиком, который позволяет одновременно дебажить и Wine, и Windows-приложение в нём. Разобраться во кишочках Wine оказалось очень интересно! Я-то раньше много им пользовался, но никогда не понимал механику целиком. Можно взять файл Windows — и просто запустить его в Linux без каких-либо изменений. Если вы хотите знать, как это сделано, добро пожаловать под кат.
Читать дальше →
Total votes 188: ↑187 and ↓1+230
Comments48

Почему нашего филина зовут Гуамоколатокинт

Level of difficultyEasy
Reading time2 min
Views1.2K

Привет, Хабр! Меня зовут Николай Камнев, и я директор по развитию группы компаний Setere. Мы специализируемся в области нативной разработки под Linux и благодаря импортозамещению работы у нас достаточно, но рассказать я хочу о том, как мы взяли под опеку животное в Ленинградском зоопарке.

Подробности и нюансы
Total votes 16: ↑13 and ↓3+14
Comments12

Расщепляем Malware PDF. Практический разбор фишинга на примере GetPDF от Cyberdefenders.com

Reading time9 min
Views12K

Привет, Хабр! Меня зовут Антон, я ведущий инженер по ИБ в компании R-Vision, принимаю активное участие в развитии экспертизы в части расследования инцидентов и реагирования на них. А в свободное время я увлекаюсь расследованиями в направлении Digital Forensics & Incident Response (DFIR), Malware Analysis.

В последнее время публичное пространство пестрит новостями о резонансных инцидентах в России и мире, связанных с фишинговыми атаками на крупные компании и государственный сектор.

Замечу, что одной из самых популярных техник взлома крупных мировых корпораций был и остается фишинг с вредоносным вложением T1566.001. Пожалуй, яркий тому пример – взлом Garmin в июле 2020 года, когда известный производитель умных устройств подвергся атаке хакеров-вымогателей. Преступники атаковали системы Garmin с помощью малвари WastedLocker. В результате, сервисы компании на три дня вышли из строя, так как авторы малваря зашифровали данные и требовали выкуп в размере $10 млн за ключи дешифровки.

Как известно, логика подобного проникновения в инфраструктуру довольно проста: атакующие проводят таргетированную фишинговую кампанию – targetor sprear[T1566.001], доставляют в корпоративную среду зловреды с помощью рассылки электронных писем с вредоносными вложениями и ссылками. Пользователь открывает файл (pdf, xlsx, docx и др.), тем самым запуская вложенный туда вредоносный код, который подгружает недостающие для атаки компоненты (вирусы, трояны, шифровальщики, бэкдоры и тд.).

В этой статье я не буду углубляться в тактики и инструменты фишинговых атак, а хочу поделиться с вами личным опытом разбора техники с фишингом вредоносного файла * pdf и наглядно продемонстрировать ход расследования подобного инцидента на примере лабораторного задания GetPDF с ресурса Cyberdefenders.

Читать далее
Total votes 7: ↑7 and ↓0+7
Comments7

Помощь и просьба о ней. Статья про информационную безопасность для рядовых пользователей

Reading time118 min
Views102K
Я предлагаю вам некоторые шаги по повышению безопасности и приватности в интернет сети (и не только) для рядовых пользователей. Обоснование почему это необходимо – в начале статьи. Для тех, кто всё знает и недоумевает, почему этот текст находится здесь — просьба прочитать пункт «Для тех, кто уже всё знает». Три месяца назад я написала этот текст, но в связи с моей необразованностью и нескончаемым потоком новостей о новых угрозах безопасности, мне надоело переделывать, так что пусть в этом тексте остаётся всё как было).
Читать дальше →
Total votes 30: ↑27 and ↓3+24
Comments98

Еще один способ генерации PDF

Reading time8 min
Views20K
Где это может пригодиться? При необходимости генерации готовых к печати файлов в web-приложении по уже имеющемуся произвольному жесткому шаблону: сертификаты, бейджи, пропуски и прочее.

Почему PDF? Формат PDF позволяет создавать документы с целым рядом неоспоримых преимуществ: открытость, кроссплатформеность, распространенность и, что очень важно, точностью и неизменностью передачи данных по цепочке создание, просмотр и печать.

В чем соль? В использовании SVG файлов как шаблонов с возможностью подстановки необходимых полей с последующим преобразованием в PDF.

Какие преимущества? Возможность создания и быстрого редактирования очень сложных шаблонов в привычных векторных редакторах, таких как Adobe Illustrator, Corel Draw или Inkscape. Простота программирования и использование только бесплатных программных средств. Еще одним важным преимуществом является возможность прозрачно использовать UTF-8 для вставляемых текстов.

Что для этого надо? Для использования данного метода нужен выделенный сервер с возможностью установки своих приложений (Inkscape и GhostScript) и выполнением system-команд. При этом всё будет работать как на Windows платформе, так и на Linux.
Как это сделать
Total votes 32: ↑30 and ↓2+28
Comments25

Почему так сложно извлекать текст из PDF?

Reading time7 min
Views29K
Перевод статьи с сайта компании FilingDB, составляющей базу данных из документации европейских компаний

Согласно распространённым представлениям, извлечение текста из PDF не должно быть такой уж сложной задачей. Ведь вот он, текст, прямо у нас перед глазами, и люди постоянно и с большим успехом воспринимают содержимое PDF. Откуда взяться трудностям в автоматическом извлечении текста?

Оказывается, точно так же, как работа с именами людей сложна для алгоритмов из-за множества пограничных случаев и неправильных предположений, так и работа с PDF сложна из-за чрезвычайной гибкости PDF-формата.

Основная проблема в том, что PDF не предполагался как формат для ввода данных – его разрабатывали, как канал вывода, дающий возможность тонкой подстройки вида итогового документа.
Читать дальше →
Total votes 39: ↑37 and ↓2+48
Comments25

Как я дообучал Tesseract и что из этого получилось

Reading time7 min
Views42K

Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а так же ввиду наличия большого количества документов сомнительного качества, поулучшав пайплайн разными методами, было принято решение попробовать улучшить и сам тессеракт.

Инструкция от разработчиков https://tesseract-ocr.github.io/tessdoc/Home.html не всегда сразу понятна и очевидна, поэтому и появилась мысль записать свой опыт в эту статью.

У меня на компьютере стоит Linux Mint 20.2 Cinnamon, поэтому все действия происходят в этой системе и я не могу гарантировать, что все получится точно так же в Windows или Mac.

Для начала необходимо установить бибилиотеку tesseract на компьютер. Делается это достаточно просто. Сначала проверю версию, которая уже установлена (как правило в комплекте с Linux уже есть пакет tesseract). В терминале набираем

Читать далее
Total votes 11: ↑11 and ↓0+11
Comments6

Тестовое задание по дизайну: торг, гнев, ресёч, презентация

Level of difficultyEasy
Reading time5 min
Views4.6K

Не люблю тестовые задания. Проверить и дать фидбэк иногда может занять столько же времени, сколько сделать само задание. Сейчас есть чем заменить тестовые, особенно при найме старших дизайнеров или лидов. Но если вы мидл или джун, и за вас ещё не говорят предыдущие места работы в резюме, рекомендации и невероятное портфолио, без тестового задания будет сложно и компании, и вам.

Последние 5 лет я проверял тестовые задания, но до этого больше 7 лет я их выполнял. Без тестового просто невозможно было никуда откликнуться.

Тестовые задания всегда были предметом споров: делать или не делать, бесплатно или за деньги, слишком большое или непонятное, ничего не ответили или фидбек невнятный… Хочу поделиться, как я сейчас подходил бы к выполнению тестовых заданий и на что я обычно обращаю внимание при их проверке.

Читать далее
Total votes 24: ↑23 and ↓1+24
Comments7

Разбираемся со сканерами в Linux: получение информации об устройстве и поиск подходящего драйвера

Level of difficultyMedium
Reading time61 min
Views8.8K

Перед вами исчерпывающее руководство по идентификации, установке и настройке сканирующих устройств в операционной системе (ОС) Linux. Описанные приемы и рекомендации применимы ко всем популярным дистрибутивам лишь с незначительными отличиями в виде различных пакетных менеджеров и используемых директорий с конфигурационными файлами.

В первой части коснемся вопроса сбора информации об устройстве при помощи системных утилит, входящих в состав ОС, а также программ от разработчиков SANE. Расскажем, как физическое устройство (например, МФУ) представляется в ОС сразу и принтером, и сканером, и много ещё чем. Обязательно затронем тему дескрипторов и детально рассмотрим значение каждого из них. База, так сказать. Заглянем в типовой пакет проприетарного драйвера и на примерах покажем, как он должен выглядеть в идеальном современном мире. Глазами разработчиков SANE, конечно. Мы не будем с ними спорить.

Подключайте свои сканеры
Total votes 25: ↑24 and ↓1+27
Comments8

Как оценивать проектные задачи, чтобы не слить бюджет и не убить команду: советы QA-лида

Level of difficultyEasy
Reading time7 min
Views8.9K

Привет, Хабр! Я Костя — Lead QA в tekmates. Мы в компании создаём цифровые продукты для бизнеса. Проработав более трёх лет проджект-менеджером и больше года лидом QA-инженеров, я много раз оценивал задачи по времени выполнения. И не всегда это давалось (да и даётся) легко… 

В этой статье поделюсь техниками для оценки проектных задач: на тестирование, разработку, техдолгов, архитектурных исследований и прочих. Будет полезно всем, кто участвует в проектной работе, но в первую очередь менеджерам и лидам команд разработки, аналитики и тестирования.

Читать далее
Total votes 22: ↑20 and ↓2+21
Comments34

Версии, библиотеки, совместимость: какие ещё проблемы я вижу в разработке под Linux

Level of difficultyMedium
Reading time5 min
Views2.8K

Привет, Хабр! Меня зовут Олег Ивченков, и я управляю группой компаний Setere. У нас есть продукт: берем скан бумажного документа, распознаем его и переводим в редактируемый формат. Классическая OCR‑система. Под капотом — C++, QT, QML, немного python`а. Работаем под Linux только как десктопное приложение. И именно о Linux я хотел поговорить. У меня накопилось много опыта за более чем десять лет разработки, и хочу рассказать о тех проблемах, которые сейчас вижу в области разработки под Linux. 

Главную проблему я бы озвучил так: «неконтролируемое множество». И от неё ответвляются много разных других. О них-то я и расскажу в статье, которая должна быть полезна всем, кто так или иначе связан с разработкой под Linux. Если вы прочитаете материал и почувствуете то же, что и я — добро пожаловать в комментарии, обсудим!

Еще год назад, в рамках круглого стола «Импортозамещение» Форума ассоциации Руссофт я предложил профессионалам отрасли поговорить о такой важной теме, как «реалии нативной разработки для отечественных операционных систем». Точнее не просто реалии, а — этой самой разработки сложности, по моим ощущениям приобретающие как минимум линейный рост. Прошедший год показал, что рост проблем не линейный, так что основные тезисы того выступления и несколько новых деталей стали моей первой публикацией на Хабре.

Боль не только моей компании, но и компаний коллег, начну описывать с общей информации по рынку. Согласно данным, любезно предоставленным ассоциацией «Руссофт» — год от года время на разработку решений для Windows в России постепенно снижается, а для систем семейства Linux — неуклонно растет. Помимо достаточно очевидного факта снижения интереса к Windows в нашей стране в принципе, увеличение времени разработки для Linux‑систем связано и с еще одним немаловажным фактором. Этот фактор — существенно возросшая сложность разработки, связанная с количеством Linux‑систем, их технологическим разнообразием.

Больше проблем и подробностей
Total votes 11: ↑10 and ↓1+13
Comments15

Три года назад…

Reading time1 min
Views1.3K
«Что из перечисленного есть в iPhone? Ну, ни одной игры этот аппарат не имеет и в отсутствие аппаратных клавиш появление большого их числа не стоит ожидать. Соответственно игровая составляющая отсутствует как класс (вычеркиваем большой пласт молодых людей).»

Время — великая вещь! И читая сейчас обзор первого iPhone от Mobile Review, датированный 2007 годом, сдерживать смех тяжело.

Оттуда же: «Мы определились с тем, что это за телефон, поняли, что это не бизнес аппарат и не мультимедийный комбайн.»
Total votes 147: ↑95 and ↓52+43
Comments99

О роли изменений

Reading time2 min
Views1.3K
Питер Шульц, в то время президент компании Porsche, рассказывал как-то историю, которая приключилась вскоре после того, как он попал на эту должность. Его пребывание в компании началось с детального знакомства с ней: он обходил все отделы, чтобы представиться и вникнуть в работу каждого подразделения.

image

В конструкторском отделе он спросил, участвует ли Porsche в гоночных соревнованиях Le Mans (считается главной гонкой для компаний, производящих спортивные машины). «Нет, — ответили ему, — не участвуем». Это было странно, ведь Porsche — один из лидеров в производстве гоночных машин. Тогда Питер поставил перед ними амбициозную задачу: «Давайте сконструируем машину, которая победит в гонке Le Mans!».

Читать дальше →
Total votes 190: ↑167 and ↓23+144
Comments40

31 тезис

Reading time3 min
Views1.2K
Иногда, когда у меня случаются моменты не самого лучшего настроения или что-то не получается, вмешивается, происходит или еще каким-то образом отравляет жизнь, я перечитываю эти цитаты, собранные мной несколько лет назад воедино — и силы приходят!

Читать дальше →
Total votes 83: ↑62 and ↓21+41
Comments23
1

Information

Rating
Does not participate
Registered
Activity

Specialization

Chief Operating Officer (COO)
People management
Negotiation
Optimization of business processes
Project management
Organization of business processes
Strategic planning
Business development
Promotion of projects
Building a team