Микробаш

    Рассказ о том, зачем и как я сделал для себя робота, который публикует микроцитаты с bash.org.ru, полностью влезающие в твит. А также о том, как я буду его развивать, если топик на хабре возымеет эффект, и количество подписчиков даст понять, что это интересно не только мне.

    Зачем


    В моей тви-ленте иногда появляются цитаты с башорга. Бывали случаи, когда особо замечательные цитаты озвучивались сразу несколькими твиплами по очереди.

    Я пошёл проверять, есть ли у башорга твиттер. Ведь если читаешь баш и пользуешься твиттером, правильно было бы его зафоловить и ретвитить то, что понравилось, не заморачиваясь с добавлением информации об источнике («цэ баш» и т.п. — а то мало ли сочтут за автора). Можно даже на сам bash.org.ru не заходить и таким образом огородить себя от залипания в Бездне.

    Твиттер-то нашёлся (@b_o_r). Но читать там нечего, т.к. большинство цитат превышают 140 символов и содержат только начало и ссылку на продолжение. Кликать или тапать каждый раз, когда хочешь узнать, чем всё заканчивается, — сомнительное удовольствие. (Впрочем, на этот твиттер сейчас подписано 9800 человек…)

    А что насчёт меньшинства — цитат, которые не превышают 140 символов? Из-за настроек экспорта даже они почти всегда превращаются в твиты с продолжением.

    Например: «Ksenya Gavrilova: Первый раз посмотрела Эммануэль. Нелегко жилось тетеньке, куда ни повернется - всюду выебут» — превращается в «Цитата #412428: Ksenya Gavrilova: Первый раз посмотрела Эммануэль. Нелегко жилось тетеньке, куда ни повернется -... http://bit.ly/pAlimr».

    В общем, сплошная печаль, а не твиттер башорга.

    Как


    С помощью сервиса яху-пайпс, которым воспользовался впервые, сделал вот такую трубу:

    1. Импортируется рсс башорга.

    2. В текстах цитат тег переноса строки заменяется на «/ ». Некрасиво, конечно, но зато конец первой фразы и начало второй хоть как-то разделены, а не как в официальном твиттере: «xxx: У тебя под одеялом нет комаров?yyy: нетxxx: Пустишь?;)yyy: комаров?».

    3. Главное, что делает яху-пайпс, — фильтрация по длине цитат. На выходе получается слегка улучшенный и сильно сокращённый рсс-поток.

    Далее сервис twitterfeed.com (его использует и @b_o_r, кстати) публикует записи из рсс в твиттер. Делает он это каждые полчаса, если есть что-то неопубликованное, по одной записи. Можно настроить, чтобы вываливал сразу всё, что накопилось. Но я считаю, что периодически радовать подписчиков в течение дня — лучше, чем краткосрочная оккупация их тви-ленты.

    Получился @microbash.

    Именем пользователя значится «© Баш», так что всем, кто увидит его сообщение в своей ленте, будет понятно, что это «цэ баш», а не что-то другое. В инфо есть ссылка на первоисточник — bash.org.ru.

    Поначалу подключил к микробашу сервис, который позволял автоматически фоловить всех новых подписчиков. Я думал: роботу всё равно, а людям приятно. Но потом набежали массфоловеры и всякие смм-эксперты, по большей части даже не русскоговорящие, ведомые другими хитрыми сервисами, и автофоловинг пришлось отключить, т.к. хочется, чтобы количество подписчиков отражало реальный интерес.

    Что дальше


    Более сложные преобразования. Например:

    xxx: повесил турник на балконе
    xxx: решил что каждый раз, выходя покурить, буду подтягиваться до изнеможения
    xxx: я не думал что я ТАК много курю


    По сути это монолог. Нет смысла повторять имя автора в каждой строчке, да и имени как такового нет, поэтому xxx: можно удалить. Так как всё будет выводиться в одну строчку, фразы лучше разделить, расставляя точки в конце там, где никакого знака препинания не оказалось, и переводя в верхний регистр первую букву фразы там, где следует. Вуаля:

    — Повесил турник на балконе. Решил что каждый раз, выходя покурить, буду подтягиваться до изнеможения. Я не думал что я ТАК много курю.

    В принципе, тире с пробелом в начале и точка в конце фразы — для красоты, и ими можно пожертвовать, если для публикации цитаты будет не хватать пары символов.

    Вот пример диалога:

    xxx: точнее пускалка не прописана
    yyy: это так надо или что то поломалось? или недоделали?
    xxx: программисту денег недодали
    xxx: это распространённая ошибка


    После его обработки получится вот что:

    — Точнее пускалка не прописана. — Это так надо или что то поломалось? или недоделали? — Программисту денег недодали. Это распространённая ошибка

    При желании можно публиковать цитаты подлиннее (до 278 символов), разбивая их на 2 твита, в которых стрелки показывают, где находится продолжение или начало. Оба твита публикуются сразу, чтобы подписчики в своих лентах видели их рядом. Например:

    Муж пошел в ателье брюки перешивать. Еще пиджак есть, дома висит - эт костюм со свадьбы. Его тетка спрашивает: -Зачем вы такой размер↓

    ↑большой купили? Он: - Так это было 5 лет назад. Она: - Ух ты. А что это у вас за диета такая? Он: -Я просто женился.

    Цель всех этих преобразований — получить больше цитат, влезающих в твит. И как бонус — оформить, чтобы их было удобнее читать в твиттере.

    Вместо заключения


    Собственно, подписчиков ещё сравнительно мало, чтобы заморачиваться с реализацией описанных выше идей (тут уже не обойтись сервисами, придётся кодить). Но если интерес к @microbash будет расти, всё это можно сделать.

    С идеями, критикой и словами одобрения — велкам в комментарии.
    Поделиться публикацией
    Похожие публикации
    Ой, у вас баннер убежал!

    Ну. И что?
    Реклама
    Комментарии 54
    • +7
      Отличная идея! Огромное спасибо за реализацию)
      • +1
        Подписываться пока не буду — все-таки зайти под вечер на башорг и почитать цитаты как-то приятнее (это уже стало своего рода ритуалом), но за реализацию плюсую однозначно :).

        По поводу идей: не знаю, для чего, но можно было бы сделать в боте «обратную связь» — возможность голосовать за цитаты.

        В любом случае, спасибо за сервис — уверен, что он найдет свою аудиторию!
        • 0
          Сейчас есть в некотором роде возможность проголосовать за цитату — ретвит. В подробностях твита будет список: кому он понравился настолько, что они решили им поделиться со своими фоловерами.
          • –2
            Возможно, я неточно выразился. Возможность отправить боту команду вида «vote idxxx», с помощью которой на самом башорге будет подниматься рейтинг цитаты.
        • 0
          А ссылку на трубу можно?
          • 0
            & lt; и & gt; «экономичнее» заменять на обычные скобки например, либо убирать вообще. Зафоловил :-)
            • 0
              Вы не могли бы подробнее объяснить, я не совсем понял идею.
              • 0
                Например вот twitter.com/microbash/status/94291110888869888 такой твит.
                Хотя, что делать со «смайликами» типа >_< — ума не приложу, т.к. тви заменяет их на вышеозначенные комбинации.
            • +2
              Сделайте еще ленту для лучшего бездны.
              • 0
                Есть такое в планах.
              • +5
                Я один кто пользуется RSS?
                • 0
                  Дело не столько в RSS, сколько в зачастивших там в последнее время длинных и нудных портянках несмешных историй (которые обязательно в качестве «лопата» завершается каким-нибудь«все лежали» или «занавес»), и которые не будут попадать в такую ленту из за ограничений на размер.
                  • 0
                    \тут всё делается ради твиттера, вообще, не понимаю, что в нём люди находят? И зачем в систему с такими жёсткими ограничениями пытаются впихнуть как можно больше контента? Скоро будут кодировать цитаты Хаффманом «чтобы поместились» а потом учиться в уме декодировать.
                    • +1
                      Не стоит критиковать какую-либо систему только потому, что вы «не понимаете, что в нём находят». Для меня это удобно и привычно.
                      • 0
                        Я не критикую, просто подвергаю сомнению соответствие системы тем целям, которыеставит автор.
                  • +2
                    Напомнили про баш, а я ведь пару месяцев уже не заходил.
                    • 0
                      Идея!
                      1.Анализировать повторение символов по типу :DDDDDDDDDDDDDDDDD
                      И оставлять только один.
                      2. Анализировать ники по шаблонам (Если слово в каких либо кавычках повторяется два раза и больше трех символов то заменять на ххх) типа <ИвановИванИванович> Алло <муся> Ы <ИвановИванИванович> Ё <Муся> Четырнадцать
                      То заменять на
                      <ххх> Алло <ууу> Ы <ххх> Ё <ууу> Четырнадцать
                      ТОгда больше цитат пройдет под ограничение. =)
                      • 0
                        блин не дочитал до конца… тупанул. извиняюсь
                        • +1
                          К удалению нормальных ников нужно подходить с осторожностью. Например, есть такие цитаты:
                          [Little-StrawBerry]: Леш, а как будет клубника по-английски?

                          За первый пункт — спасибо.
                          • 0
                            Ну вот конкретно этот пример не пройдет под фильтр, так как там должно быть повторение 2 раза, то есть как бы уже на 90 % указывает на то, что это диалог, и вряд ли фишка в нике. И на память, может пару цитат вспомню, шедевральных, у которых вся "«фишка» в нике) Один Помню. Что то типа я тебя переименовала как зайчик… А ты меня? Секрет… Что то типа того короче ) Вообщем, пожертвовать одной нелогичной цитатой в фиде ради увеличения их числа на 30 %, я считаю нормально ) Хотя вы автор, вам и карты в руки
                            • 0
                              Думаю, лучше тогда при первой встрече никак его не укорачивать, а вот начиная со второго вхождения менять: -> , при условии, что второго ника на L нет, в таком случае добивать длину до тех пор, пока разница не будет понятна.
                              • 0
                                Парсер съел.

                                А вот начиная со второго вхождения менять: Alex на А и т.д.
                        • 0
                          bezdny.net/ рулит)
                          • +1
                            И там есть рсс. Значит, в ленту можно будет добавить ещё и топ бездны :)
                            • 0
                              И по сути там намного веселее… Вот только цитат несравнимо больше и можно забыться)
                            • –1
                              Или ещё один аггрегатор бездны: bezdna.su
                            • 0
                              Мне кажется, что эти монологи с «ххх:» в начале каждой строчки и есть визитная карточка баша, иначе уже не отличить от популярных ныне сервисов, вроде netjoke.
                              А в целом, подписался, опробуем.
                              • 0
                                /пиарюсь/ у меня давненько на сайте есть подобная фича :)

                                strizzle.com/tag/short — лимит на 140 символов
                                • +1
                                  strizzle.com/tag/short — лимит на 320 символов
                              • +1
                                Отличное решение для тех, у кого закрыт баш на работе )) Спасибо.
                                • 0
                                  Как это «закрыт баш на работе»? Кем закрыт?
                                  У вас так бухгалтеры мстят сисадминам?
                                  • 0
                                    Неужели вообще может быть закрыт баш, но открыт твиттер?
                                    • 0
                                      Баш закрыт, а твиттер открыт?
                                      • +1
                                        Твиттер может быть и с телефона, а интернет серфить с телефона не очень удобно по сравнению с твиттером. Тем более на работе =)
                                    • 0
                                      Наконец-то, свершилось. Теперь во всех твиттерах страны)
                                      • 0
                                        Автор, может ещё оттипографируешь (не в ущерб длине конечно) за одно? А то жутко раздражают все эти дефисики вместо тире и пр.

                                        + идея по сокращению: три символа «...» отлично заменяются на один «…».
                                        • 0
                                          Да, я думал об этом, спасибо.
                                        • +1
                                          Не сочтите за брюзжание, давно не заходил на баш, поэтому заинтересовался топиком.
                                          Но после примеров «шуток» из топика желание возвращаться туда снова отпало.
                                          • 0
                                            Мне кажется, разбивать на два твита — плохая идея. Нельзя ретвитнуть. Да и, очевидно, не формат твиттера.
                                            • 0
                                              Можно быстро ретвитнуть их подряд :) А вообще, я, например, если вижу в ленте два твита, явно связанных, не обращаю внимания, если между ними еще твиты есть.
                                              • 0
                                                Можно быстро ретвитнуть их подряд :) А вообще, я, например, если вижу в ленте два твита, явно связанных, не обращаю внимания, если между ними еще твиты есть.
                                              • 0
                                                285 фолловеров… не очень-то успешно.
                                                • 0
                                                  В топике я так и написал: «подписчиков ещё сравнительно мало».

                                                  Сейчас уже больше.
                                                  • –1
                                                    Когда регался твит када начались сообщения, а учитывая количество ретвитов еще через несколько дней вообще от зависти все помрут. Даже не смотря на то что вначале боты подключались.
                                                • 0
                                                  Идея отличная!
                                                  Мой вам совет забейте на успех на хабре, сделайте. В процессе можно что-то изменить да и потом.
                                                  Опубликуете на хабре как закончите?

                                                  • 0
                                                    Обязательно опубликую. Спасибо.
                                                  • +1
                                                    Объясните мне, в чём прикол вводить эти ограничения на длину сообщений в твиттере было, что бы потом мучится от этого?
                                                    Ещё немного и будет сервис с ограничением, скажем, в 15 символов.
                                                    — Мне классно
                                                    — Я поел
                                                    — Музыка
                                                    • 0
                                                      Наноблоги — секретная разработка Сколково :)
                                                      • 0
                                                        Мне кажется, в этом какая-то фишка — выражать свои мысли компактно. К тому же, не хотелось бы в своей ленте километровые сообщения на пустые темы.
                                                        • 0
                                                          Мне кажется, в этом какая-то фишка — выражать свои мысли компактно. К тому же, не хотелось бы в своей ленте километровые сообщения на пустые темы.
                                                        • 0
                                                          А зачем мучиться и насиловать твиттер с его ограничением на символы, если есть RSS и куча агррегаторов для них?
                                                          мыши плакали, кололись, но продолжали есть кактус?
                                                          • 0
                                                            имхо, ники можно заменять на 1: 2: 3:
                                                            • 0
                                                              Когда изучал Google App Engine написал парсер лучшего бездны c определенной периодичностью отправляющий новые цитаты на джаббер, подписал несколько человек. Через месяц все попросили их отписать)
                                                              Сам до сих пор так читаю.
                                                              А в базе уже почти 15к цитат.

                                                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                              Самое читаемое