Все потоки
Поиск
Написать публикацию
Обновить
1.1

Семантические сети *

Веб 3.0

Сначала показывать
Порог рейтинга
Уровень сложности

ТОП-5 антисоветов для владельцев бизнеса, которые не хотят зарабатывать деньги

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.8K

Мы с ребятами в агентстве уверены: чтобы брать — нужно отдавать. А вот некоторые клиенты считают наоборот. Поэтому, исходя из собственного опыта, мы решили поделиться советами, которым следовать не нужно. Разумеется, если вы хотите расти в прибыли.

Читать далее

Как с помощью Мастера кампаний при сокращении бюджета уменьшить стоимость лида из Директа с 2500 до 344 р?

Время на прочтение3 мин
Количество просмотров1.9K

Я и мои коллеги в агентстве стабильно приводили производителю трубопроводной запорной арматуры лиды по 600–800 р. Клиента всё устраивало. Внезапно стоимость увеличилась до 2500 р. «Немыслимо» —подумали мы. «Невозможно» — ответил клиент. Делать нечего: стали разбираться, почему так произошло, и как это быстро исправить. Вот что из этого вышло…

Читать далее

Фрилансеры vs агентство: как не угробить SEO и сразу сделать все правильно?

Уровень сложностиСредний
Время на прочтение7 мин
Количество просмотров1.3K

Тренд последних лет ‒ обращение к SEO-специалистам, которые работают на фрилансе, а не в агентстве. Но так ли это безопасно, и не придется ли платить дважды? Ко мне в агентство обратился клиент, который бежал со всех ног от такого SEO-фрилансера. Давайте объясню подробнее…

Читать далее

Алгоритм поиска ключевых словосочетаний «на пальцах». Анализируем новости

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров6.4K

В современном мире объем данных в интернете постоянно растет с огромной скоростью. Возникает логичный вопрос: как ориентироваться в этом информационном потоке? 

Чтобы упростить себе задачу поиска и обобщения информации IT-энтузиасты применяют технологии генеративно обученных чат-ботов. Наиболее широкое распространение получил  ChatGPT. Яндекс, в свою очередь, добавил в браузер YandexGPT, который позволяет тезисно ознакомиться с содержанием страницы. Всё чаще вакансия Prompt-инженера начинает встречаться на hh и Хабр Карьере. Специалисты и чат-боты помогают конечному пользователю экономить время для поиска необходимой информации. 

Но что делать, если возможности обратиться за помощью к подобным технологиям нет? Указанные выше языковые модели нельзя интегрировать в собственные проекты, сценариев их использования много, но они всё равно ограничены. 

В статье мы расскажем, как (не без нейронных сетей) можно создать простой алгоритм на Python, который поможет извлекать ключевые слова из любого текста, тем самым избавляться от ненужной информации и автоматизировать процесс анализа материалов. Мы будем работать с русским текстом, а именно — с новостными постами. Поэтому в частном случае используются пакеты для обработки, поддерживающие именно русский язык. В том числе используются модели, обученные на корпусах текстов с новостной семантикой. 

Читать далее

Какие результаты можно получить от SEO на примере реальных клиентов?

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров2.6K

«Не могу решиться на SEO, вера не позволяет. А если серьезно, то специалисты закидывают меня какими-то обещаниями и сроками в 3 месяца. Ничего не понятно: что я получу, зачем столько ждать?». Лично я слышал и такие истории. Решить их можно, но нужно знать как. Давайте разбираться.

Читать далее

Приложения алгебры кортежей. Часть 2. Математическая модель вопроса

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров2.5K

В предыдущей части рассматривалась новая система счисления, в обосновании которой использовались некоторые соотношения алгебры кортежей.

Об алгебре кортежей (АК) и ее использовании для логико-семантического анализа было рассказано в моей статье в Хабре. В комментариях к статье предлагалось обратить внимание на функцию SELECT в языке SQL, которая соответствует операции Selection (Выборка) в реляционной алгебре. Эта операцию можно рассматривать как один из вариантов математической модели вопроса.

Предлагаемый здесь вариант смысла вопроса заключается в том, что в вопросе заданы некоторые ограничения (область знания, ситуация, значения некоторых атрибутов и т.д.), которые требуется использовать для того, чтобы найти или вычислить значение определенного атрибута или проверить правильность заданных в вопросе соотношений. Эта семантика применима к восполняющим вопросам типа «Что?», «Где?», «Когда?», к уточняющим вопросам типа «Верно ли, что А?» и к ИЛИ-вопросам типа «Что правильно: А или Б?». Назовем такие вопросы ограничительными. Их можно считать вариантами известной в искусственном интеллекте задачи удовлетворения ограничений.

Читать далее

Как рассказать о сайте поисковой системе

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.7K

Сайт написан, домен куплен, так почему же я до сих пор не вижу его в Google/Yandex?

В этой статье Вы узнаете как поисковые системы определяют ваш сайт и как же его добавить в поиск.

Читать далее

Разница между Data Race и Race Condition

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров18K

Рассмотрим разницу между популярными ошибками при работе с многопоточностью, такими как Data Race и Race Condition, а также способами борьбы с ними.

Читать далее

Семантики доставки событий в распределенных системах

Время на прочтение9 мин
Количество просмотров16K

Павел Агалецкий, ведущий разработчик в юните Platform as a Service в Авито, рассказал про семантики или гарантии доставки сообщений, и почему с ними не всегда просто разобраться.

Читать далее

5 стадий принятия или как мы снизили стоимость обращения в нише трубопроводной арматуры с Директа в 3,5 раза

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров961

Торг, депрессия, принятие… Все проходят в определенный период жизни эти стадии. И мы с агентством не исключение. Нам достался проект, в котором мы в полной мере ощутили эти периоды. Но! Несмотря на это мы снизили стоимость целевого обращения в 3,5 раза. Представьте, лид стоил 1781, а стал 509. И кстати, за месяц их получилось целых 94 штуки. Читайте в материале, что и к чему.

Читать далее

Почему подрядчики по digital-маркетингу все время лажают и как это исправить?

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.3K

Как же задолбало перебирать подрядчиков по маркетингу — директологи, таргетологи, SEO-шники. Все говорят: “количество лидов вырастет, а продажи полетят, как ракета!”. На деле — ракета оказывается картонной, и нифига не летит. В этой статье я хочу беспристрастно посмотреть, почему так происходит и где тут SYSTEM ERROR.

Читать далее

Дифференциальная сеть — формальная система для формальных систем

Время на прочтение17 мин
Количество просмотров1.7K

Сколько раз при изобретении очередного метода обработки структурированных данных наталкиваешься на мысль о дежавю? Работа со списками файлов, словарями имен, объектными полями, связывание разнотипных данных. В каждом новом более удобном или более быстром переизобретении проглядывается что-то общее, непреходящее. Концептуальное ядро, связующее все возможные производные множества и включающее их в свою орбиту. Что-то чему язык затрудняется сходу подобрать название, а мозг очертить предельные границы. Одновременно всеобъемлющая и при этом неуловимо малая деталь. Абсолютная абстракция. Линейный примитив.

Читать далее

Запустили Директ и нет лидов? 7 шагов базовой оптимизации рекламы

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.9K

К нам в агентство часто обращаются клиенты с проблемой — запустили контекстную рекламу, а она не работает. Рекламные бюджеты сливаются, заявки отсутствуют (в некоторых случаях их мало и они дорогие). В общем, реклама не окупается, поставленные KPI не достигаются. Почему же контекст не работает? А главное — как это исправить, чтобы заявки наконец пошли?

Читать далее

Ближайшие события

Как совместить логику и семантику в одной алгебраической системе

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров4.1K

В данной статье речь, в основном, пойдет о логике, которая необходима каждому человеку хотя бы потому, что с ее помощью можно проверить правильность обоснования разных точек зрения, мнений, теорий и т. д. Также важно и то, что в наше непростое время логика очень нужна для того, чтобы противостоять интенсивно развивающимся технологиям интеллектуальных манипуляций, с помощью которых часто вторгаются в наше сознание многочисленные мошенники, аферисты, предвзятые СМИ и, разумеется, агитаторы и политтехнологи. Ситуация усугубляется тем, что логика не является общеобразовательным предметом, а современные методики обучения логике не выдерживают критики.

С логикой тесно связана разработанная сравнительно недавно алгебра кортежей (АК). Здесь будет показано, как с ее помощью решаются непростые логические задачи, а также обоснована связь между АК и семантикой. Более подробные сведения по теме данной статьи можно найти на сайте.

В основе АК лежат свойства Декартова (прямого) произведения множеств (ДП). Многие из этих свойств были впервые сформулированы и обоснованы в публикациях по АК. Для более понятного изложения свойств ДП и основных понятий АК будем использовать в качестве иллюстрации ПРИМЕР логической задачи.

ПРИМЕР

В данном ПРИМЕРе используются сюжеты некоторых задач из книги известного специалиста и популяризатора математической логики Раймонда Смаллиана «Принцесса или тигр?». В некотором царстве король заставлял узников решать логические задачи. В данном эпизоде (он отсутствует в книге Смаллиана) перед узником были три комнаты, в каждой из которых могла находиться одна из принцесс, либо поджидал свою добычу один из тигров. Могли быть и пустые комнаты. С помощью подсказок узник должен был решить, в какой комнате принцесса, и войти в нее. В этом случае он получал свободу и мог жениться на принцессе. Если он ошибался, то мог попасть в комнату с тигром. В данном случае в помощь ему были даны три подсказки, и также было известно, что одна из первых двух подсказок ложная (какая именно, неизвестно), а остальные две – истинные.

Подсказка 1: Во второй комнате нет тигра, а третья комната не пуста.

Подсказка 2: Первая комната не пуста, а во второй нет тигра.

Подсказка 3: Принцесса находится, по крайней мере, в одной из комнат. То же самое известно и о тиграх.

Читать далее

Зализняк: основа русской прикладной лингвистики

Время на прочтение8 мин
Количество просмотров10K

При построении прикладных систем, работающих с текстами, первая же задача — это отождествление слов друг с другом. Для большинства языков индо-европейской группы её решение не представляет большой сложности. И решений этих существуют сотни, а самые простые из них, как правило, дают вполне пригодные (в рамках решаемой задачи) результаты.

Английский, с его весьма условным делением на части речи и практически отсутствующим склонением/спряжением, вполне прилично описывается простыми моделями выделения неизменяемой основы слова (стеммерами) с небольшим словариком исключений буквально на сотню слов. Слова немецкого прекрасно бьются на части по формальным признакам, словарю корней и принципу «максимума суммы квадратов длин». Системы окончаний других европейских языков также достаточно просты.

Со славянскими языками сложнее из-за развитой грамматики и глубокой изменчивости — любое русское прилагательное, к примеру, имеет как минимум двадцать четыре разных грамматических формы: три рода и множественное число, да по шесть оставшихся на сегодня падежей. А то и все двадцать девять, если принять во внимание краткие формы (широк, широка, широки) и образуемое от многих прилагательных наречие.

Для решения задачи отождествления разных форм существует некоторое количество реализаций морфологических анализаторов русского. Но почти все они — во всяком случае, заслуживающие внимания — растут из одного корня...

(По материалам внутреннего семинара компании МойОфис)

Читать далее

Фильтруй базар! Как мы параллельный русско-башкирский корпус чистили

Уровень сложностиСложный
Время на прочтение6 мин
Количество просмотров3.8K

Чтобы обучать нейросети понимать и генерировать человеческие языки, нужно много качественных текстов на нужных языках. «Много» – не проблема в эпоху интернета, но с качеством бывают сложности. В этом посте я предлагаю использовать BERT-подобные модели для двух задач улучшения качества обучающих текстов: исправление ошибок распознавания текста из сканов и фильтрация параллельного корпуса предложений. Я испробовал их на башкирском, но и для других языков эти рецепты могут оказаться полезны.

Читать далее

[Кейс] Продвижение сайта, поднявшее количество заявок

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.8K

Проект «Едим Дома» принадлежит Юлии Высоцкой, известной российской кулинарной блогершей и телеведущей. Сайт посвящен кулинарии и содержит множество рецептов, начиная от традиционных русских блюд и заканчивая экзотическими рецептами из разных стран мира. Кроме того, сайт предлагает советы по приготовлению и подаче блюд и статьи о питательной ценности продуктов.

Читать дальше

Предоставляем бесплатное облачное распознавание речи ASR

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров3.4K

В этой статье мы, расскажем, как сделали первое действительно бесплатное облачное распознавание речи и как им воспользоваться.

Разработчики систем распознавания речи, как правило, используют поминутную тарификацию распознавания. В одной из прошлых статей я уточнял почему считаю это далеко не всегда правильным (если кратко, то при такой тарификации вендоры округляют длительность в большую сторону, а значит, за распознавание коротких записей вы заметно переплачиваете, а при большом трафике это очень дорого).  

Давайте теперь разберемся, действительно ли для вендоров экономически оправданно брать деньги с хобби-проектов и небольших компаний, которым нужно распознавать не миллионы, а всего лишь десятки или сотни минут в день.

Читать далее

Как я учил ChatGPT

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров21K

Много лет я занимаюсь разработкой событийной семантики [1, 2], событийной логики [3], спецификации языка описания деятельности, а также Event Flow архитектуры [4], на базе которой построен семантический workflow-движок. Все это выросло из идеи субъектно- событийного подхода к моделированию сложных систем [5], который условно можно считать инженерным наследником философской темпоральной онтологии [6, 7].

И вот, некоторое время назад я решил провести эксперимент и научить ChatGPT создавать и исполнять событийные модели. Результат сообщу сразу: это у меня получилось, хотя и не без головной боли, с постоянными упрашиваниями, подсказками, напоминаниями… Но по порядку.

Упомянутый Event Flow движок работает с событийными семантическими моделями, описывающими сущности или действия какой-либо предметной области. Он проглатывает очередное модельное событие (согласно условиям, прописанным в этом событии) и либо строит по нему поле экранной формы, если значение надо получить от человека, либо выполняет запрос к уже имеющимся данным, создавая в итоге новое предметное событие. Таким образом после выполнения всех событий одной модели у нас получается индивид сущности или действия, а по сути, выполняется фрагмент бизнес-логики. (В Приложении есть несколько слов о событийной семантике от самого ChatGPT).

Что требовалось от ChatGPT? (1) Запомнить формат записи событий; (2) освоить синтаксис инициации свойств и актов, правила построения моделей и создания индивидов; (3) научиться по текстовому описанию строить модели и (4) при предоставлении в текстовом же виде конкретных значений - создавать индивиды. При этом, что существенно, в модели могут иметься запросы к значениям уже созданных индивидов.

Читать далее

Информация, как много в этом слове…

Время на прочтение8 мин
Количество просмотров8.9K

Очень сложно дается для понимания (уж поверьте, проверено много раз) простая мысль, что одним и тем же словом в разных предметных областях, на разных уровнях анализа, разными людьми могут обозначаться принципиально разные понятия. Например, большинство убеждено, что существует некое реальное, как оно есть на самом деле, сознание, и проблема только в том, что у нас не получается описать его словами. Сколько человек ни возьмется за это, у всех получается как-то про разное. Хотя можно просто признать, что слово «сознание» многие используют в разных значениях, то есть обозначают им разные понятия, и на этом завершить бесконечные споры. Ту же историю мы наблюдаем и со словом «информация» – можно насчитать под сотню различных, порой очень далеких друг от друга по содержанию определений.

Согласно одним, информация – это «любые данные, представленные в электронной форме», согласно другим –  «универсальное свойство материи», и  тут же – «мера организованности системы», а еще «сведения, воспринимаемые человеком». Кто-то пытается объяснить наличие множества определений информации тем, что само понятие ‘информация’ является многогранным, сложным, и даже объявляет его базовым, неопределяемым. Но ведь очевидно, что приведенные определения никак не могут описывать нечто одно: потоки символов, передаваемый по каналам связи, не могут быть мерой сложности системы, а воспринимаемые человеком сведения – универсальным свойством материи.

Далее я попытаюсь убедить вас в следующем: во-первых, нет никакой самой по себе информации, про которую можно говорить, что именно она и есть информация (сложная, первичная, вездесущая) и требуется только дать ей единственно правильное определение; во-вторых, мы имеем дело с рядом несводимых друг к другу понятий, которые в разных областях разными людьми обозначаются одним и тем же словом «информация». 

Читать далее