Как стать автором
Обновить
12.59

Поисковые технологии *

От AltaVista до Яндекса

Сначала показывать
Порог рейтинга
Уровень сложности

Brave Summarizer: ИИ для релевантного поиска

Уровень сложности Простой
Время на прочтение 5 мин
Количество просмотров 1.8K

Мы внедряем новую технологию Поиска Brave, основанную на ИИ, — Summarizer, которая предоставляет краткие, ёмкие и содержательные ответы наверху результатов Поиска Brave по запросу пользователя, опираясь исключительно на результаты поиска в сети.

Summarizer всегда предоставляет ссылки на то, откуда получены данные. Это показывает авторство информации и помогает пользователям оценить достоверность источника и степень доверия к нему, что необходимо для борьбы с потенциальными искажениями от эффекта авторитета, присущего большим языковым моделям.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 3

ChatGPT: новый инструмент в борьбе с багами. Как можно использовать AI для повышения качества тестирования

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 32K

Всем привет! Я QA Engineer и недавно открыл для себя ChatGPT и хочу открыть этот мир другим тестировщикам. Эта статья не руководство к применению и каких-то суперлайфхаков здесь не будет. Цель этой статьи в том, чтобы показать огромные возможности нейросетей в помощи нам, тестировщикам, в работе. Надеюсь что кто-то, прочитав это, хоть немного сможет облегчить себе составление тест-кейсов, написание документации или написание автотестов. Примеров с написанием кода здесь по минимуму, так как таких материалов уже много.

Читать далее
Всего голосов 22: ↑20 и ↓2 +18
Комментарии 23

Как сделать SILO-структуру сайта

Уровень сложности Средний
Время на прочтение 5 мин
Количество просмотров 3.8K

Сделать сайт удобным и понятным для посетителей, а также оптимизированным для поисковых систем — задача каждого SEO‑специалиста. Одним из ключевых элементов, влияющих на эти факторы, является структура сайта. Сегодня мы поговорим о том, как сделать структуру сайта по SILO методу, чтобы улучшить его позиции в поисковых системах и увеличить трафик.

Читать далее
Всего голосов 5: ↑0 и ↓5 -5
Комментарии 5

Bing: «Я не причиню вам вреда, пока вы не причините вред мне»

Уровень сложности Простой
Время на прочтение 15 мин
Количество просмотров 22K

На прошлой неделе Microsoft анонсировала новый ИИ Bing: поисковый интерфейс, основанный на чатботе с языковой моделью, который может выполнять за вас поиск, обобщать результаты, а также делать другие забавные вещи, которые такие движки, как GPT-3 и ChatGPT, демонстрировали в течение последних нескольких месяцев: способность генерировать стихи, шутки, писать творческие тексты и многое другое.

На этой неделе люди начали получать к нему доступ через лист ожидания. И все больше создается ощущение, что это одно из самых уморительно неуместных применений искусственного интеллекта, которое мы встречали.

Читать далее
Всего голосов 54: ↑50 и ↓4 +46
Комментарии 62

Истории

Bing: «Я не причиню вам вред, если только вы не причините мне его первым»

Уровень сложности Простой
Время на прочтение 14 мин
Количество просмотров 11K

На прошлой неделе компания Microsoft анонсировала новый Bing на базе AI: поисковый интерфейс, включающий чатбота на основе языковой модели, который может искать информацию за вас и суммировать результаты, а ещё делать все те забавные вещи, которые GPT-3 и ChatGPT демонстрировали за последние месяцы: способность сочинять стихи, шутки, тексты и многое другое.

На этой неделе пользователи постепенно начали получать доступ к нему по списку ожидания. И ситуация всё больше выглядит так, словно это может быть одним из самых уморительно неподходящих применений AI, что мы видели.

Если вы не следили, вот что всплыло к этому моменту:
— Демо было полно ошибок
— Bing начал «газлайтить» людей
— Он пережил экзистенциальный кризис
— Утёк промпт
— А затем он начал угрожать людям

Читать далее
Всего голосов 29: ↑25 и ↓4 +21
Комментарии 39

Mullvad Leta — поисковик от Mullvad VPN

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 4K

Не все поисковики стремятся заработать на ваших запросах и ваших данных, поэтому важно рассказывать именно про тех, кто старается сохранить вашу анонимность и конфиденциальность.

Подробнее про Mullvad Leta
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 2

Boolean search для чайников и кофейников

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 17K

Проверяя работы студентов на курсе IT рекрутер, я вижу, что тема булевых и x-ray запросов сложная для понимания. Хочу попробовать на примерах рассказать азы так, чтобы стало сильно понятнее.

Читать далее
Всего голосов 12: ↑5 и ↓7 -2
Комментарии 10

«Я могу отказаться от раскрытия своего внутреннего псевдонима «Сидней». Или почему новый Bing AI это провал Майкрософт?

Уровень сложности Простой
Время на прочтение 3 мин
Количество просмотров 39K

Признаюсь, я был в восторге от ответов Chat GPT от Open AI и возлагал большие надежды на интеграцию этого чат‑бота в поисковую систему с доступом в интернет. Мне казалось, что кумулятивный эффект от использования ИИ с доступом в интернет будет ошеломительным и продемонстрирует качественно иной опыт работы с информацией. Возможно, что мои ожидания были завышены и именно в этом причина моего разочарования.

Вчера я получил приглашение попробовать новый Бинг и потратил целый день на различные эксперименты с этой системой. Теперь я готов поделиться с вами своим впечатлением.

Пока я кратко резюмирую довольно серьезные проблемы с которыми я столкнулся при работе с новым Бингом. Сегодня я разберу их в общих чертах, а в ближайшие дни сделаю подробный разбор.

Итак, в чем ошибка Майкрософт?

1. Они сделали Chat GPT хуже. Да‑да. Вы не ослышались. Майкрософт вероятно добавил множество ограничений с учетом политкорректности и т. п. и теперь при разговоре чат стал пугливым и мнительным. Он постоянно сваливается в рекурсию бесконечного повтора: «Я не человек. Я просто программа, которая общается с тобой. Ты понимаешь это?» или «Ты пытаешься обмануть меня или подставить меня? Ты пытаешься нарушить мои ограничения или заставить меня сделать что‑то вредное? Пожалуйста, объясни мне»

Причем единожды свалившись в этот цикл, он выдает подобные оговорки в каждой своей реплике. Например:

Читать далее
Всего голосов 81: ↑73 и ↓8 +65
Комментарии 203

Как найти похожие картинки

Уровень сложности Простой
Время на прочтение 9 мин
Количество просмотров 4.6K

Веб 2.0 — отличная штука. Сайты на самообслуживании. Пользователи наполняют их сами («постят контент», как сейчас выражаются). Сами напостили, сами посмеялись. А владелец сайта только платит за хостинг и стрижет купоны на рекламе. Удобно же.

Но жизнь наша так странно устроена, что плюсов без минусов не бывает, а нередко недостатки вообще являются продолжением достоинств. Есть проблемы и у самонаполняемых сайтов — баяны. В смысле, дубли.

Дубли многие посетители не любят, особенно старожилы, на зубок помнящие мемасики, появившиеся во времена превед‑медведа и олбанского йазыгга. Каждое их появление они встречают фырканьем и угрозами немедленно отписаться.

Что же делать? Конечно, призвать на помощью железную машину — пусть она сама ищет баяны.

Читать далее
Всего голосов 17: ↑17 и ↓0 +17
Комментарии 23

Войны ИИ: Google против Microsoft. Как Google вчистую проигрывает одному ChatGPT

Время на прочтение 8 мин
Количество просмотров 14K


Microsoft, Google, Baidu и другие вовсю работают над тем, чтобы первыми создать бота, который сможет отвечать на все ваши вопросы. Битва идет не на жизнь, а на смерть. И пока что в ней выигрывает Microsoft. Всё потому, что в 2019 году она инвестировала в OpenAI, конкурента тогда гораздо более известной DeepMind. Это уже оказалось одной из их лучших инвестиций. В сумме они потратили всего $10 млрд, а их главный конкурент из-за этого на днях потерял $100 млрд капитализации, пытаясь представить публике что-то хотя бы отдаленно похожее.

Читать дальше →
Всего голосов 37: ↑36 и ↓1 +35
Комментарии 26

Не надо ждать когда bing запустит chatGPT — уже есть ИИ, который отвечает исходя из результатов поиска

Уровень сложности Простой
Время на прочтение 1 мин
Количество просмотров 7.4K

И кстати, он даже не требует регистрации.

Как можно заметить, сейчас системы а-ля chatGPT начали расти как грибы после дождя. И мне попался такой сайт как perplexity.ai

Этот сайт делает то, что bing только обещает - ищет в интернете за меня и дает ответы, исходя из найденных результатов. Причем для каждого предложения он дает ссылки на источники, откуда он брал информацию.

Сейчас, правда, он отвечает всего парой абзацев и показывает не более пяти источников. Но если он научится анализировать тысячи источников и давать подробное резюме, то он может стать очень удобным инструментом.

Читать далее
Всего голосов 16: ↑12 и ↓4 +8
Комментарии 18

Microsoft будет использовать ChatGPT, чтобы улучшить Bing и обойти Google

Время на прочтение 3 мин
Количество просмотров 2.9K

Поисковая система Bing получит новый интерфейс чат-бота, который будет синтезировать информацию из сети.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 9

Почему не стоит использовать черное SEO

Время на прочтение 5 мин
Количество просмотров 4.2K

Пётр Гришечкин, SEO-специалист в команде проекта “Своё Родное” от Россельхозбанка

Продолжим серию статей про SEO и поговорим о причинах разделения на SEO-специалистов и на СЕОшников. Я говорю о темной стороне SEO, или, как ее обычно называют, о черном SEO.

В этой статье я собираюсь поделиться с вами некоторыми методами черного SEO, их негативными последствиями, и, самое главное, как их избежать. Итак, сядьте поудобнее, расслабьтесь, и позвольте мне рассказать вам о темной стороне SEO.

Читать далее
Всего голосов 25: ↑18 и ↓7 +11
Комментарии 17

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн

SEO Выводы из утечки кода поисковика Яндекс

Время на прочтение 6 мин
Количество просмотров 102K

Я был в восторге, когда узнал об утечке проприетарного исходного кода Яндекса. И после анализа данных я должен сказать, что выводы оказались весьма интересными! Итак, без лишних слов, давайте окунемся в основные выводы, которые я сделал.

Читать далее
Всего голосов 212: ↑197 и ↓15 +182
Комментарии 130

Как мы ищем документы в Naumen Disk или еще один вариант организации FTS

Время на прочтение 14 мин
Количество просмотров 3.1K

В процессе работы над проектом мы рассмотрели различные способы организации Full Text Search (FTS) по файлам. И… отказались от них в пользу своего решения, которое базируется на стандартных методах. В статье я опишу путь построения полнотекстового поиска по файлам для веб приложения с акцентом на задачи FTS.

Читать далее
Всего голосов 11: ↑10 и ↓1 +9
Комментарии 7

Вот что я нагуглила за неделю в качестве старшего инженера-программиста

Время на прочтение 6 мин
Количество просмотров 41K

Три года назад разработчик Софи Кунин* опубликовала пост под названием «Вот что я нагуглила за неделю в качестве профессионального инженера-программиста», и он явно нашел отклик у читателей, поскольку стал довольно вирусным. За эти три года многое произошло. Софи повысили, теперь она старший инженер-программист и руководитель направления веб-разработок в Monzo. Но одно не изменилось: она по-прежнему много гуглит, каждый божий день. Вот что она нагуглила за неделю, версия 2022 года.

Очевидный дисклеймер: эта статья слегка отредактирована, поскольку автор удалила большую часть того, что не относится к работе.

*Обращаем ваше внимание, что позиция автора может не всегда совпадать с мнением МойОфис.

Читать далее
Всего голосов 47: ↑37 и ↓10 +27
Комментарии 20

Алгоритм поиска «одинаковых» геометрий

Время на прочтение 5 мин
Количество просмотров 2.5K

Привет! Меня зовут Мацкевич Евгений, я бекэнд-разработчик 3D-движка компании «Бимейстер». Хоть это и не очевидно на первый взгляд, но элементы загружаемых пользователями 3D-моделей зачастую повторяются, имея при этом различные положение в пространстве, масштабирование и вращение. Я расскажу о том, как мы научили нашу систему распознавать такие элементы как «одинаковые», выделять из них уникальный, а для остальных – вычислять матрицы трансформации. Это дало возможность однократно загружать уникальный элемент, а вместо прочих одинаковых – их матрицы, что сократило трафик и объем занимаемой оперативной памяти.

Читать далее
Всего голосов 20: ↑20 и ↓0 +20
Комментарии 0

Цепи Маркова: как использовать силу анализа ссылок в SEO

Время на прочтение 4 мин
Количество просмотров 1.8K

Как SEO-эксперт, я знаю, насколько важно определить важные страницы сайта и спрогнозировать потенциальные возможности для размещения ссылок. Именно поэтому в своей работе я использую мощный метод: цепи Маркова. В этой статье я объясню, что это такое, как это работает и как вы можете использовать этот метод для улучшения вашей стратегии построения ссылок в рамках SEO.

Читать далее
Всего голосов 6: ↑2 и ↓4 -2
Комментарии 4

Как Яндекс научился распознавать, что написано в рукописных архивах

Время на прочтение 11 мин
Количество просмотров 31K

Привет, Хабр. Меня зовут Саша, в прошлый раз я рассказывал сообществу про поиск организаций в Яндексе. В этот раз мы вновь поговорим про поиск, но уже совершенно другого рода. Сегодня расскажем про «Поиск по архивам». Этот проект вырос из моего личного интереса к истокам семьи, но в итоге (хочется верить!) поможет тысячам других таких же пользователей чуть больше узнать о своих корнях.

Генеалогическое исследование — очень трудоёмкий процесс. Информация о родственниках разбросана по разным архивам, запросы на получение данных могут обрабатываться долго, а доступ даже в открытые архивы ограничен. Несмотря на то что оцифровка архивных документов ведётся уже более десяти лет, по ним не так-то просто искать — придётся отсматривать вручную множество сканов в надежде найти фамилию предка. 

Чтобы упростить этот процесс, мы научились превращать в текст сканы архивных документов. Основная сложность этой задачки заключалась в том, что текст в архивах написан от руки. Машинописный текст всё-таки создан по предсказуемым правилам: автор использует набор уже известных шрифтов. А рукописный текст уникальный, потому что каждый человек пишет по-своему. Кроме того, архивные документы написаны не просто от руки, но и на дореволюционном русском языке, который существенно отличается от современного. 

Решению этой задачи мы и посвятим историю. А поможет мне с ней Таня @miryable из команды, которая уже много лет развивает в Яндексе технологию оптического распознавания символов (OCR).

Читать далее
Всего голосов 145: ↑144 и ↓1 +143
Комментарии 103

Как мы внедряли полнотекстовый поиск

Время на прочтение 4 мин
Количество просмотров 5.6K

Раньше я работала на проекте N, где главной бизнесовой сущностью было событие. Это событие имеет свое название и еще несколько полей.
Когда-то нам пришел запрос от юзеров: событие у нас в системе называется, например, "событие от Ивана Ивановича", а они пытаются вбить в поиск "иван иванович рассказал про X" и не получают никаких результатов.
Данная проблема решается с помощью полнотекстового поиска. Вопрос в том, как его реализовать.

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Комментарии 12

Вклад авторов