Search
Write a publication
Pull to refresh
0
0
Opossum @oposumo

User

Send message

Оптическое распознавание символов в Linux

Reading time17 min
Views86K

Введение


Это не просто обзор существующих OCR (мы будем говорить всего о трёх) и не руководство по установке (хотя установка будет описана). Эта статья была создана с целью разобраться, что и как реально может распознать русский и английский языки в Linux.
Читать дальше →

16 способов выбрать идеальное имя для стартапа

Reading time5 min
Views105K
imageВсе мы знаем, как трудно назвать свой проект, а также зарегистрироваться привлекательный домен. В погоне за красивым именем мы мониторим Интернет и устраиваем мозговые штурмы с друзьями и коллегами и делаем еще кучу вещей.
Хватит тратить на это много времени, пишите код и ищете клиентов, это в разы важнее.
Названия компаний, которые воспользовались этими методами, вполне заслуживают внимания.

Под катом 16 методик: в большинстве случаев они предполагают 2 этапа – создание списка слов, имеющих отношение к вашему проекту, и смешивание этих слов, т.е. поиск «золотой» комбинации.

Читать дальше →

Pictonic — необычный иконочный шрифт

Reading time1 min
Views30K

В последнее время появилось множество иконочных шрифтов для нужд веб-дизайнеров, но такой как Pictonic я вижу впервые. Это «логотипный» иконочный шрифт, где собрано более 220 логотипов известных сервисов, браузеров, операционных систем, языков программирования и т.д. Среди символов конечно нет русскоязычных сервисов.
Читать дальше →

Правильные социальные share-кнопки

Reading time2 min
Views80K
Социальные сети все сильнее проникают в нашу жизнь: сегодня наличие у сайта страницы или группы в социальных сетях — скорее норма, чем исключение, а многие пользователи Вконтакте используют свою ленту в качестве агрегатора новостей с интересующих их сайтов. Самый простой и, наверное, эффективный способ привлечения трафика из соцсетей — это размещение share-кнопок на страницах сайта. В этой статье немного рассуждений о проблемах таких кнопок и попытка найти идеальное решение.

Внешний вид


Читать дальше →

2400 иконок флагов под свободной лицензией

Reading time1 min
Views91K


Самая большая коллекция флагов: 2400 пиктограмм размерами 16×16, 24×24, 32×32, 48×48 и 64×64. Есть государственные флаги всех стран, плюс бонусы: Англия, Абхазия, Нагорный Карабах, Красный крест, Южная Осетия, Сомалиленд, флаг Марса, НАТО и проч.

Все иконки в двух вариантах: стандартный и глянцевый.

Скачать:
www.gosquared.com/download/pixels/flags.zip

Лицензия MIT (GPL-совместимая), разрешает использование иконок в коммерческих проектах.

Упражнения для тренировки мозга

Reading time3 min
Views126K

В силу склада ума или давнего увлечения скорочтением, мнемотехникой и прочим, у меня был повышенный интерес к играм состоящим из набора упражнений для тренировки мозга(BrainChallenge, Dr.Kawashima и др.). Переиграв практически во все что было на десктопе и nds, появилось желание использовать такие игры для каждодневных тренировок, но для этого они не совсем подходят(в тексте объясню почему). Поэтому на досуге решил написал небольшой сайт с набором такого рода упражнений.
Читать дальше →

Как из болота вытягивать ITшника или об общении в стрессовых ситуациях

Reading time21 min
Views275K

Неприятности случаются… Неожиданно плохой фидбек, проблемы с заказчиком или коллегами, не повысили зарплату, странные баги, внезапный овертайм или закрытие проекта — подобные события запускают цепочку реактивных реакций:

  • Нет, тут есть ошибка -> сами гады -> а может все не так и плохо -> ппц -> ладно, давай выкручиваться

В этой цепочке человек ведет себя реактивно, предсказуемо… и, часто, совершает глупости. Это напоминает машину состояний, входом в которую являются неожиданное событие. Состояния машины — цепочка психологических защит: отрицание, гнев, торг и депрессия, а выход — принятие новой информации.
Из подобных состояний часто приходится вытаскивать коллег, заказчиков, и себя самого.
Под хабракатом, кроме описания этапов, есть ответы на вопросы:

  • Как узнать каждое состояние и предугадать следующее?
  • Как помочь выйти себе и собеседнику из цепочки?
  • Что не делать, чтобы не усугубить ситуацию?
Читать дальше →

NLPub — каталог лингвистических решений

Reading time2 min
Views9.3K
Я хочу представить NLPub — небольшую базу знаний, посвящённую компьютерной лингвистике в России.

Сейчас никого не удивить устройствами и приложениями, способными понимать и говорить на человеческом языке. В основе таких приложений лежат методы обработки естественного языка, образующие общее направление на стыке лингвистики и искусственного интеллекта.

Почему подавляющее большинство устройств, приложений и сервисов не работает с русским языком?
Читать дальше →

Создаем рекурсивные ярлыки в Windows

Reading time5 min
Views124K
Все мы знаем, что такое ярлык. А что будет, если сделать ссылку ярлыка самого на себя?
Создание ярлыка на ярлык приводит к его копированию. И что будет, если принудительно создать побайтно такой ярлык?

Но, расскажу я не об этом, а о том, как можно создать папку, от вида которой все программы вылетают с ошибками.
Да, только от вида: на папку даже кликнуть не успеете.

Зайти в такую папку обычными файловыми менеджерами будет невозможно.

Но тут не обошлось без ярлыка, и я расскажу, как это сделать и для чего можно использовать.
Читать дальше →

Факторы поискового ранжирования Google

Reading time3 min
Views33K
Ребята с webmasterworld.com решили собрать все факторы, которые учитивает Google при ранжировании сайтов. Официальным представителем было заявлено (еще на тот момент), что их более 200. Пока список выглядит так, не исключено, что некоторые пункты включают в себя несколько факторов.
image
Читать дальше →

Статьи, исключённые из раздела Википедии на русском языке, да явятся миру в русскоязычных википроектах

Reading time2 min
Views39K
Сейчас в разделе Википедии на русском языке (ru.wikipedia.org), который многие краткости ради называют просто Википедией или Вики, проводится чистка от материалов, которые сочтены администрацией или пользователями неприемлемыми. Не буду вдаваться в инсайд (там сейчас тренд повышения энциклопедичности через исключение из энциклопедии незначимых статей, например статей о персонажах вымышленных миров).

Процесс этот продолжается несколько лет по мере разрастания сообщества Википедии, и особенную силу набрал в последние годы, сейчас ежедневно удаляется большое количество статей. А ведь среди статей, кроме мусора (спама, пустых или бессвязных страниц, недобросовестных изменений, которые в силу открытости проекта встречаются), попадаются и нормальные, хорошо оформленные статьи, просто для Википедии в её нынешних реалиях не подходящие.
Читать дальше →

Google представил функцию «Disavow links» для выборочного снятия влияния спамных внешних ссылок

Reading time1 min
Views19K


Думаю, эта новость будет интересна не только сеошникам, но и всем владельцам сайтов или просто всем тем, кому интересны алгоритмы работы поисковых систем. Так вот, корпорация Google запустала в работу функцию «Дезавуированные ссылки», которая позволяет выбирать внешние ссылки, ведущие на ваш сайт, и обнулять их значение. Т.е. вы можете показывать поисковику вручную, какие ссылки (внешние) ему учитывать, какие — нет.

Читать дальше →

Как определить язык напечатанного текста? (Европейские языки)

Reading time1 min
Views110K
Увидев красивую и понятную блок-схему, описывающую, как отличать одну письменность от другой, я удивился. В первую очередь тому, что это оказалось кому-то интересным. Но раз уж та схема показалась любопытной, то я попробую продолжить тему, начатую уважаемым soulburner. Здесь речь пойдёт о том, как отличать друг от друга европейские языки.

Для начала – что такое европейские языки. Предлагаю ограничиться государственными языками стран Европы. Так как границы Европы – вещь спорная, то отдельно оговоримся про соседние страны. Духовно близкий Израиль, а также Грузию и Армению можно отличить по письменности из той же блок-схемы, Азербайджан и Казахстан я включу по доброте душевной, а Абхазию и Южную Осетию – в качестве прогиба перед российской властью. Так что абхазский в наш классификатор попадёт, а баскский и гэльский – ну уж нет, перебьются.

Языков больше, чем типов письменности. Поэтому диаграмка получилась большая. Отличать языки друг от друга будем в основном по особенным буквам, в частности, по буквам с диакритическими значками (диакритикой). Диакритика бывает над гласной (в букве й), над согласной (буква č) или может как-то сопровождать букву (как в букве ç; строго говоря это не дикритика вовсе, но мы здесь будем придерживаться такого жаргона). Наиболее известные (с моей точки зрения) значки в Европе — это умляут (он же диаерезис: ü), гачек (č) и акут (é).

Тех, кто не испугался, прошу под кат

Подборка сервисов для расширения возможностей вашего Dropbox

Reading time1 min
Views80K
Сервис Dropbox любим многими хабровчанами, поэтому предагаю вашему вниманию подборку полезностей для работы с этим облачным сервисом.

Backup Box умеет синхронизировать разные облачные сервисы, а также делать бэкапы сайтов (FTP и MySQL).

Читать дальше →

Как восстанавливают данные в Storelab

Reading time6 min
Views63K


В прошлом посте мы писали о ситуациях, когда диск следует отнести в ремонт. Напомним вам, что доставка и диагностика у нас бесплатная — поэтому, если что-то не так — лучше перестраховаться. В этом обзоре мы расскажем о том, что происходит с диском, когда его привезли к нам.
Читать дальше →

Восстановление расфокусированных и смазанных изображений. Повышаем качество

Reading time5 min
Views211K
Представляю вашему вниманию заключительную статью из трилогии «Восстановление расфокусированных и смазанных изображений». Первые две вызвали заметный интерес — область, действительно, интересная. В этой части я рассмотрю семейство методов, которые дают лучшее качество, по сравнении со стандартным Винеровским фильтром — это методы, основанные на Total Variaton prior.
Также по традиции я выложил новую версию SmartDeblur (вместе с исходниками в open-source) в которой реализовал этот метод. Итоговое качество получилось на уровне коммерческих аналогов типа Topaz InFocus. Вот пример обработки реального изображения с очень большим размытием:


Читать дальше →

О сортировке контента на основе оценок пользователей: Часть 3

Reading time3 min
Views14K
В прошлой статье я вывел формулу, которая прогнозирует рейтинг на основе оценок статьи и средней оценки по сайту. Думал в этой статье, я покажу качество ее прогноза, улучшу прогноз за счет дисперсии. Однако, появилась еще одна проблема.
image
Читать дальше →

Улучшение субъективной скорости работы сайта при помощи подсказок браузеру

Reading time4 min
Views39K
Я удивлен, что эта техника упоминалась на Хабре только один раз и вскользь — если верить поиску, конечно.
Меня не покидает ощущение, что на самом деле все про это знают, но я всё же расскажу.

Суть в том, что браузеру можно подсказать, какую страницу пользователь откроет следующей — и он начнет её загружать заранее.

Делается это несложно — нужно всего-то добавить пару мета-тегов в head:

<link rel="prefetch" href="NEXT PAGE URI" />
<link rel="prerender" href="NEXT PAGE URI" />


Теперь подробнее про ограничения и нюансы.
Читать дальше →

Вспоминаем ретро Spectrum ZX с помощью ubuntu

Reading time1 min
Views26K

Не так давно


Совсем недавно, когда деревья были большими, мы с товарищами ждали момента, когда начнется игра. Ждали мы вместе с Spectrum'ом, аудио-кассетами с играми и тетрадками в рюкзаках. Последние, впрочем, не мешали нам слушать звук загрузки и считать мотки с помощью аналогового устройства.

Итак, последний момент загрузки и мы получаем в свое распоряжение шедевры!
У нас это были:

Exolon

image
Читать дальше →

Как правильно скопировать файлы и папки исключая некоторые из них

Reading time2 min
Views51K
Топик написан в ответ на похожий.

Автор оригинального топика предлагает решить задачу в лоб — а именно, скопировать все файлы а потом удалить не нужные. Это может быть неплохим решением, если вам, конечно, не нужно скопировать всю домашнюю папку на флешку, за исключением вашей коллекции видео.

Но главная проблема этого подхода в другом — он не соответствует идеологии unix: сложные задачи решаются комбинацией простых утилит.

Под катом подробности о методах решения этого класса задач — не рассматривайте это как готовый рецепт.
Читать дальше →

Information

Rating
Does not participate
Location
Россия
Registered
Activity