Универсальная on-line проверка грамматики с помощью google ajax search api

    Обычно я проверяю английскую грамматику, вбивая в Google куски фраз, и смотрю, что получится.
    Если найдено много вариантов, то фраза правильная, если не очень много — то неправильная.

    image

    Вот, написал сервис, который отсылает запросы в Google, а сам подсвечивает, «правильно», или «неправильно» написаны куски предложения, и местами даже подсказывает — какое слово можно поставить на то, или иное место в предложении.
    Еще он показывает в каком именно контексте найдено слово.

    Замечательно то, что ему все равно, какой язык вы проверяете.



    Вы вводите фразу в текстовое поле, и проверка начинается автоматически. Проверяемая фраза отображается ниже поля ввода, а для некоторых слов предлагаются варианты. Красным подсвечиваются неподходящие слова.

    Логика проверки правильности проста. Фраза разбивается на покрывающие ее кусочки, которые а далее проверяется. Например из фразы «маша очень любит сашу» мы получим в том числе кусочек «очень любит сашу». Для него будет два проверяющих запроса: «очень любит *» и «очень любит сашу». И если запрос «очень любит *» дает в тысячу раз больше ответов, чем «очень любит сашу», то значит, что «саша» тут не подходит, и надо выбрать какой-нибудь другой вариант.

    При наведении на вариант, показывается контекст, в котором он встречается. Если на вариант кликнуть, то он заменит соответствующее слово в предложении. При наведении на слово в самой фразе показывается статистика по слову: сколько документов найдено по звездочке, а сколько по точному совпадению.

    image

    Моей серверной части вообще нету, то есть страничка написана исключительно на html+javascript.

    Понятно, что грамматику она проверяет далеко не идеально, а иногда вообще не проверяет. Зато можно увидеть, хорошо или плохо сочетаются слова, удобным образом посмотреть статистику, обратить внимание на возможные нестыковки, найти другие сочетающиеся слова, или использовать еще для чего-нибудь.

    P.S.
    Еще у меня осталось несколько вопросов, касательно лицензионного соглашения google search api. (Читал английскую версию, т.к. русская чуть ли не google translate-ом написана)
    1. обязательно ли ставить ссылку на сайт, на котором был найден контент (ровно таких строк не нашел, хотя ссылку и поставил)?
    2. каковы ограничения по количеству (официально их нет, но очевидно, что должны быть. На каждую фразу из n слов у меня отслыается 2n+4 запросов. Кеширование в течении одной загрузки страницы у меня есть (правда пока нет сброса кеша, когда долго сидишь:) ), но это не спасет в целом.)

    Изначально в сервисе не предполагалась возможность заходить на сайты с которых взят контент. Но по-моему такую возможность надо давать, поскольку чужие материалы все-таки используются, хоть и косвенно.
    Пока что реализовать эту возможность так, чтобы она не портила интерфейс, мне не удалось.
    Так что ссылки сделал, но кроме как с помощью tab-а, на них попасть нельзя :).

    P.P.S.

    Еще забыл написать, что есть ограничение на длину фразы — где-то 25 слов.
    Еще, верстка не рассчитана на длинные фразы, он едет, если фраза вылезает за пределы окна.
    Пока что даже не знаю — а нужно ли с этим что-либо делать, или может просто запретить пользователю вводить слишком много слов,
    т.к. сервис не рассчитан на длинные фразы или тексты.
    Скорее — на проверку небольших предложений :)

    Similar posts

    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 114

      +6
      А где сервис то? Только картинкой?
        0
        Видимо, есть только html-файл )
          –2
          Только картинкой, да…
            +4
            да, ссылку то и забыл поставить, пока правил пост,
            все уже заметили
          +4
          grammcheck.org/

          я так думаю :)
            0
            Подскажите мне, в какой блог лучше топик перенести?
            +1
            Поправьте ссылку в начале поста — grammchek.org
              0
              спасибо
              0
              C:\Program Files\Far>ping grammchek.org
              При проверке связи не удалось обнаружить узел grammchek.org. Проверьте имя узла и повторите попытку.
                0
                ck в конце нужен

                ping grammcheck.org
                  +2
                  тогда пост свой поправьте что ли
                    0
                    вот слепой, не видел, что именно там ошибка, спасибо
                  +1
                  Кому-то точно нужен spellcheck :)
                  0
                  Сайт лег, но обещал подняться…
                    +1
                    по идее там три html-странички и nginx
                    и железо достаточно хорошее,
                    и другой нагрузки нет.
                      0
                      Все оказалось проще, урл был не верный, посему пост выше считать недействительным ;)
                  • UFO just landed and posted this here
                      +1
                      Wikianswers do your homework

                      Прекрасно :)
                        0
                        На длинных предложениях — медленно работает, а так — очень даже ничего, понравилось
                          0
                          это отчасти специально.
                          наверное можно было поставить асинхронные запросы по поиску,
                          но было как-то страшно это делать.

                          Вдруг пользователи захотят проверять тексты целиком. Тогда google будет явно недоволен.

                          Еще я забыл написать про то, что там есть ограничение — фразы более чем из 25 слов не обрабатываются
                            0
                            И еще верстка едет, если предложение занимает больше длины экрана (Chrome) Пример
                            +3


                            Это судя по всему максимум слов за раз.
                              0
                              Весело :)

                              Ну в общем да, максимум, наверное.
                              я бы меньше поставил, только не хотелось обижать тех, у кого монитор очень большой.

                              Вообще, я не рассчитывал на длинные фразы и тексты,
                              а что делать с ними, если пользователю все-таки хочется проверить, пока не знаю.
                                +1
                                Вертикально влезет :)

                                PS Поправьте ссылку в посте :)
                                0
                                вопрос автору, чем плох вертикальный скроллинг в таких случаях, могу бы доработать…
                                +5
                                Это просто космическая чума для создания бессмысленных смешных фраз! Вводишь два слова — потом кликаешь мышкой и ржешь! А самое смешное — смотреть из какого контекста слово берется.

                                А вообще идея просто великолепная!
                                  +1
                                  А как по мне то этот сервис точно пригодится для подбора популярных запров в SEO и грамотного их составления.
                                    0
                                    космическая чума для создания бессмысленных смешных фраз! =>
                                    жуткая кошмарная космическая акупунктура для предотвращения бессмысленных смешных человеков
                                    вы правы, бредогенератор очень неплохой.
                                    0
                                    шикарно:)
                                      0
                                      Да нет. Просто гениально.
                                      –1
                                      Скажите честно, вы в будующем решили задосить Гугл?
                                        +1
                                        Вообще я жду комментариев от инженеров google, что бы тут можно было бы сделать, чтобы не досить их. :)

                                        А вообще, надеюсь, обладатели индексов сами в скором времени реализуют нечто подобное.
                                          +1
                                          Сайт заддосился раньше гугла. А вот если куча народа скачает себе и начнет проверять «Войну и мир», аж интересно)
                                          +2
                                          проверил фразу «ни чего себе». Все заебись, везде пишут раздельно. Такой сервис я бы точно использовать не стал, опасно стало полагаться на правописание масс))
                                            –10
                                            Мне не нравиться, что там для русково языка нет
                                              +4
                                              А для русского есть
                                                0
                                                там вообще все равно какой язык — хоть французский
                                                  0
                                                  китайский не подходит.
                                                    0
                                                    для него у меня нету диапазонов UTF8- символов (
                                                    когда найду — добавлю
                                                  +2
                                                  Простите, но вы разговариваете не на русском.
                                                    –12
                                                    Сдесь все так разговаривають
                                                      0
                                                      Нет, Вы точно перепутали хабр с чем-то ещё…
                                                  0
                                                  А нет ли на примете простого сервиса, который переводил бы слово с указанного языка сразу на все доступные языки и выдавал это на одной странице?
                                                    0
                                                    translate.google.com
                                                      0
                                                      Это не то. Ключевая фраза «все языки на одной странице».
                                                      0
                                                      Вот есть пример code.google.com/apis/ajax/playground/#batch_translate в Translate API
                                                        0
                                                        Да, примерно такое…
                                                          +1
                                                          Специально для вас :) tsepelev.net/tmp/translate.php
                                                            0
                                                            Cпасибо, извините, плюсануть не могу. Но все же немного не то) надо бы словарные статьи)
                                                        0
                                                        Может быть, подойдёт «Викисловарь»? Там обычно есть раздел «Translations» со ссылками на словарные статьи, хотя он не всегда полон.
                                                        +12
                                                        Пишу из под стола:
                                                        img198.imageshack.us/img198/8268/fsit.jpg
                                                          +6
                                                          симпатично, хотя это все, что угодно, но не проверка грамматики
                                                            0
                                                            Интересно, я тоже таким же образом проверяю правильность написания фразы, только язык немецкий. И очень google в этом помогает. Сервис интересный и для меня нужный, только привыкнуть надо.
                                                              +1
                                                              Ну не знаю… проверил на латышском, он берет предложения с сайта объявлений… там бывает такое понапишут… хоть вешайся
                                                                +1
                                                                В лучших традициях всего, что связано с Гуглом, в Опере не работает :(. 10.10.
                                                                  0
                                                                  только что попробовал — работает,
                                                                  а в чем именно у Ва проблема?
                                                                    0
                                                                    Просто ничего не происходит при вводе текста. Если же поставить «Mask as Firefox» в Site Preferences, всё начинает работать. Но это не айс.
                                                                      +1
                                                                      10.10 1893 Win32 работает
                                                                        0
                                                                        тоже проверял под win в opera 10.01 и 10.10 — работает.
                                                                          0
                                                                          Моё дело доложить…
                                                                            0
                                                                            а скажите еще про какие-нибудь особенности Вашей системы — может все-таки какой-нибудь noscript стоит,

                                                                            или Linux у Вас?

                                                                            Вас гугл не банил на других сервисах?
                                                                              0
                                                                              About Opera
                                                                              Version information
                                                                              Version
                                                                              10.10

                                                                              Build
                                                                              1893

                                                                              Platform
                                                                              Win32

                                                                              System
                                                                              Windows XP

                                                                              Java
                                                                              Sun Java Runtime Environment version 1.6

                                                                              XHTML+Voice
                                                                              Plug-in not loaded

                                                                              Browser identification

                                                                              Opera/9.80 (Windows NT 5.1; U; en) Presto/2.2.15 Version/10.10


                                                                              Гугл не банил — я же говорю, если я включаю «Mask as Firefox», сервис работает. Ставлю обратно «Identify as Opera» — перестаёт.

                                                                              Проверьте, а в каком режиме у Вас работает Опера? Edit Site Preferences… -> Network -> Browser identification.
                                                                                0
                                                                                Как Опера стоит…
                                                                                  0
                                                                                  Казус :)!
                                                                    +2
                                                                    В safari 4 под mac после ввода первого слова url меняется на grammcheck.org/#слово и ввод последующих слов становится невозможным (они волшебным образом исчезают))
                                                                      0
                                                                      хотя, видимо оно работает только до относительно небольшого перерыва в наборе слов, до тех пор пока не началась проверка.
                                                                        0
                                                                        да, есть некоторый баг, связанный с параллельной обработкой и вводом, пока разбираюсь с ним

                                                                        если фразу вводить быстро, то работает, а
                                                                        если новые слова вводить неравномерно — сначала пробел, а потом с паузой еще слово, то слова не вводятся.
                                                                      0
                                                                      Браво! сам иногда гуглом грамматику проверяю.

                                                                      Да, плохо работает с дефисами и тире, к примеру фраза «вот набери что-то», будет подбирать к «что» и к «то» слова, хотя должна к «что-то»

                                                                      я еще часто проверяю граматику явно заданным поиском «She teachs» или «She teach»
                                                                        +2
                                                                        В каком месте тут проверка грамматики?

                                                                        Вбил фразу «Could you tell me what time is it?» — ноль реакции.
                                                                          0
                                                                          именно так и работает проверка орфографии в гугловолне.
                                                                          но там доступ к данным гугла, конечно, на более глубоком уровне.
                                                                          ну и «саша» не превращается в «рыбий» :)
                                                                            0
                                                                            По-моему это не грамматика, а crowdsourcing. Фраза «превед медвед» встречается больше раз, чем «привет медведь», но от этого более правильной не становится.
                                                                              0
                                                                              Это только мне нехватает кнопки «очистить», или чего-то подобного?
                                                                              Пытаюсь что-то написать (а не скопипейстить туда фразу) — бамц, и мне подставляют предидущую.

                                                                              пс. хром 3.0.195.33
                                                                                0
                                                                                этот баг уже поправил вроде должно работать
                                                                                +1
                                                                                не работает с китайским языком
                                                                                  0
                                                                                  странно работает с японским языком grammcheck.org/#%E3%81%8F%E3%81%9D%E3%81%A3%E3%81%9F%E3%82%8C
                                                                                    0
                                                                                    не подскажите, какие диапазоны в UTF-8 для японского и китайского?
                                                                                      0
                                                                                      черт его знает… там ещё будет сложность в том, что слова не разделяются пробелами, а идут сплошным потоком
                                                                                        0
                                                                                        Плоскость 2 (Дополнительная иероглифическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.
                                                                                        В Unicode 5.2 в этой плоскости представлены следующие наборы иероглифов:
                                                                                        Унифицированные иероглифы ККЯ (расширение B) (20000—2A6DF)
                                                                                        Дополнение совместимых иероглифов ККЯ (2F800—2FA1F)

                                                                                        зы. ru.wikipedia.org/wiki/Символы,_представленные_в_Юникоде
                                                                                      0
                                                                                      Не сильно он проверяет, попробуйте на англ. неправильно посторенное предложение ввести например:
                                                                                      «application was stopped»
                                                                                      он предложит все что угодно, кроме правильного варианта «application have been stopped»

                                                                                        0
                                                                                        have :)?
                                                                                          0
                                                                                          Что «have»?
                                                                                            0
                                                                                            «application has been stopped», да и то — вариант «was stopped» ничуть не неправильный.
                                                                                              +1
                                                                                              А ну да изиняюсь. «was stopped» — неправильный в корне, т.к. нет указания на время события. «Application was stopped on Monday» — так правильно
                                                                                                0
                                                                                                Указание на время вовсе не является обязательным! В past simple ссылка на точное время может отсутствовать, если подразумевается из контекста.

                                                                                                Кроме того, описанный сервис, я так понимаю, направлен на помощь в исправлении лишь фраз, то есть частей предложений, так что указание на время в приведённом Вами примере могло где-то и быть — в другой части предложения.
                                                                                        0
                                                                                        «Обычно я проверяю английскую грамматику, вбивая в Google куски фраз, и смотрю, что получится.
                                                                                        Если найдено много вариантов, то фраза правильная, если не очень много — то неправильная.»


                                                                                        А я думал, что я один такой извращенец. ))
                                                                                            0
                                                                                            «ехал грека через реку видит грека крокодил сунул грека руку в щелку там было все очееень дешево» :D
                                                                                            0
                                                                                            Спасибо, идея очень интересная. Вот ещё как нибудь к этому всему общедоступные словари прикрутить бы.

                                                                                            Иногда, хочется зайти на сайт и посмотреть в каком контексте написано то или иное предложение. А табом всё-же не так удобно перебирать. Но и оставлять постоянно источник на странице тоже не хочется. Нужно найти какое-то оригинальное решение. Может быть, по сочетанию каких то клавиш оно будет открывать новый таб со страницей, на которой был найден текст? Тогда и источник будет упомянут и пользователь получит немаловажную функцию.

                                                                                            В любом случае, сервис в закладки!
                                                                                              0
                                                                                              А у нас, на Нигме, тоже есть такая функция, правда для Английского языка ;) Вот тут было его описание: habrahabr.ru/blogs/nigma/64635/

                                                                                              А вообще сервис у Вас хороший)
                                                                                                0
                                                                                                а почему вы не сделаете поиск точного совпадения фразы? а то я ввожу фразу он мне чуть ниже результат поиска фразы выводит и в этом результате — слова разбросаны по разным предложениям. Тоесть не совсем то что мне нужно.
                                                                                                  0
                                                                                                  На «I can has cheezburger» смачно фейлится. :)

                                                                                                  А так идея неплоха.
                                                                                                    +2
                                                                                                    Да, идея отличная, но на популярных ошибках будет давать сбой

                                                                                                      0
                                                                                                      Я не вижу вижу в этой фразе ошибок, кроме отсутствия запятой и больших пробелов.
                                                                                                      Я что-то не понимаю?
                                                                                                        0
                                                                                                        зачем запятая
                                                                                                        и дождь и рота идут :)

                                                                                                        я только не уверен, что такие ошибки грамматическими называются
                                                                                                          0
                                                                                                          Тогда у меня для вас плохие новости. А как насчет фразы «проезжая мимо вокзала, с меня слетела шляпа»?

                                                                                                          p.s. пробелы стандартные, запятая не нужна.
                                                                                                            +2
                                                                                                            Кстати, фраза «за окном шел дождь и рота солдат» частно приводится в пример как зевгма, античный стилистический прием пропуска повторного члена предложения. Однако для зевгмы по-прежнему справедливо требование к согласованию членов предложения. Так, правильным вариантом будет «за окном шли дождь и рота солдат». Такое предложение грамматически верно, а стилистически является зевгмой. Лично я бы отнес такой прием к низкому стилю, но в литературе он встречается регулярно.
                                                                                                              0
                                                                                                              Ну да, из разряда «На мосту стояли трое: он, она и у него» ))
                                                                                                              0
                                                                                                              Ого, мне даже не пришло в голову, что эта фраза подразумевает собственную законченность. Смутило отсутствие точки?
                                                                                                              Я думал, это начало предложения. :(
                                                                                                          0
                                                                                                          Отличный сервис, добавьте пожалуйста возможность не только заменять ошибочный вариант на правильный, но и добавлять в вводимую строку как продолжение предложения.
                                                                                                            0
                                                                                                            написал she want me, ошибку не нашло. А идея хорошая. Тоже гуглю для проверки правописания использую
                                                                                                              0
                                                                                                              так вроде красненьким подсвечивает, нет?
                                                                                                                0
                                                                                                                только правильного варианта нет
                                                                                                                  0
                                                                                                                  вот если бы у меня был прямой доступ к индексу, тогда я мог бы более-менее гарантировать наличие правильного варианта.

                                                                                                                  а так — все зависит от того, что гугл отдаст в выдаче :)
                                                                                                                    0
                                                                                                                    возможно это и не ошибка, гугл дал 2 000 000 записей с таким слово сочетанием
                                                                                                                      +1
                                                                                                                      Если говорить о более-менее правильном английском, налицо отсутствие согласнования подлежащего и сказуемого. Но в традиционно «черном» разговорорном варианте многие все чаще опускают согласования, а иногда и все сказуемое (см. текст песни — «He just drinking» вместо he's just drinking). Приходит вроде бы в основном из музыки, где появляется ради подгонки ритма слов под имеющийся текст. Но в любом случае, в письменной речи употреблять этот оборот не стоит.

                                                                                                                      p.s. Я и сам последнее время все чаще говорю I'm gonna вместо I'm going to :(
                                                                                                              0
                                                                                                              А разговаривать голосом будет?

                                                                                                              www.google.com/dictionary?aq=f&num=100&langpair=en|ru&q=welcome&hl=ru
                                                                                                                0
                                                                                                                Идея — блеск. Шедевр. Апплодирую.
                                                                                                                  0
                                                                                                                  Гениально!
                                                                                                                    0
                                                                                                                    я с помощью гугл сервиса, проверяю на ошибки слова(php скрипт), в английском и на русском находит, на других пока не проверял. Молодец, только что мне не нравится, очень большие данные, то нужно долго ждать, у меня бывает что текст бывает около 300 предложений, но наверное это можно убрать с помощью механизма кеширований как у тебя. И ограничение на 500 символов, :( Это я о гугле…
                                                                                                                      0
                                                                                                                      Большущее спасибо за проделанную работу. Приятно встретить на столько полезный сервис.
                                                                                                                      PS. Заметил, что фраза «I can't» разделяется на 3 слова.
                                                                                                                        0
                                                                                                                        Есть предложение по улучшению алгоритма подсветки правильности слов.
                                                                                                                        На примере фразы «мне би это знать», видно, что неправильное слово «би» портит статистику для других слов, и в результате — все слова красные (а должно было быть только оно).
                                                                                                                        Определить такое вредное слово можно по его статистике (наводим на «би» и видим: «1 for query «мне би это „» и «529000 for query “мне * это „»). Очень сильный контраст. И тогда такое слово исключать из фраз, используемых для оценки других слов.
                                                                                                                          +1
                                                                                                                          Отличная идея сервиса, и приятно видеть лёгкую и ненагруженную реализацию.

                                                                                                                          По сути это всё же не проверка грамматики, а ответ на вопрос «говорят ли так?»
                                                                                                                          Хотя да, зачастую можно проверить своё предложение, когда сомневаешься, особенно для иностранного языка.

                                                                                                                          Спасибо и успехов.

                                                                                                                          Only users with full accounts can post comments. Log in, please.