Как стать автором
Обновить

google translate script

Время на прочтение5 мин
Количество просмотров15K
Всем привет. Все что изложено ниже — мой первый реально полезный (во всяком случае для меня) опыт использования питона. Буду благодарен если подскажете как улучшить/оптимизировать скрипт.



С давних времен был у меня скриптик на баше которые переводил через гугл транслэйт все что ему кормишь
translate 'test' en ru

Мне захотелось чтоб он еще выдавал возможные альтернативы, как гугл недавно научился. Заодно решил устроить себе питон практику :)


Вот что получилось:
#! /usr/bin/env python
# -*- coding: utf-8 -*-
"""This script allow users to translate a string
from one language to another with Google translate"
""

import sys
import re
import urllib
import urllib2
import json

def print_params(data):
  """print parameters from list"""
  for val in data:
    if isinstance(val, basestring):
      print "\t " + val

def main():
  """
  Usage:
    first arg - string to translate
    second arg - source lang
    third arg - target lang  
  Example:
    translate.py 'text to translate' en ru
    translate.py 'text to translate' ru en
  "
""
  
  url = "http://translate.google.com/translate_a/t?%s"
  list_of_params = {'client' : 't'
                    'hl' : 'en',
                    'multires' : '1', }  
  
  #all arguments given
  if len(sys.argv) == 4:
    list_of_params.update({'text' : sys.argv[1],
                           'sl' : sys.argv[2],
                           'tl' : sys.argv[3] })

    request = urllib2.Request(url % urllib.urlencode(list_of_params),
      headers={ 'User-Agent': 'Mozilla/5.0', 'Accept-Charset': 'utf-8' })
    res = urllib2.urlopen(request).read()

    fixed_json = re.sub(r',{2,}', ',', res).replace(',]', ']')  
    data = json.loads(fixed_json)
    
    #simple translation
    print "%s / %s / %s" % (data[0][0][0], data[0][0][1],
                data[0][0][2] or data[0][0][3])
    
    #abbreviation
    if not isinstance(data[1], basestring):
      print data[1][0][0]
      print_params(data[1][0][1])
      
    #interjection  
    try:
      if not isinstance(data[1][1], basestring):
        print data[1][1][0]
        print_params(data[1][1][1])
    except Exception:
      print "no interjection"
  else:
    print main.__doc__
    
if __name__ == '__main__':
  main()


* This source code was highlighted with Source Code Highlighter.


Скачать скрипт

P.S.
Спасибо за конструктивные комментарии. Обновил код и файл.
Выдавал ошибку если фраза была типа how are you? # fixed

P.P.S
Спасибо всем за положительные отзывы и конструктивную критику.
По заявкам написал еще один вариант скрипта, который переводит через гугл API v2. К сожалению API не предлагает несколько значений одного слова. Возможно в будущем эту функцию добавят.

Для использования 2й версии скрипта нужно получить API key по ссылке code.google.com/apis/console/?api=translate и заменить в скрипте ***** на ваш ключ.

Вот собственно сам скрипт:

#! /usr/bin/env python
# -*- coding: utf-8 -*-
"""This script allow users to translate a string
from one language to another with Google Translate API
You have to insert Your Translate API key
Get your API key from here:
  code.google.com/apis/console/?api=translate
Replace
  api_key = '**********' with your API key
"
""

import sys
import urllib
import urllib2
import json

def translate(list_of_params):
  """Translate given text"""    
  url = "https://www.googleapis.com/language/translate/v2?%s"    
  request = urllib2.Request(url % urllib.urlencode(list_of_params),
    headers={ 'User-Agent': 'Mozilla/5.0', 'Accept-Charset': 'utf-8' })
  res = urllib2.urlopen(request).read()
  translated = json.loads(res)
  for translations in translated['data']['translations']:          print translations['translatedText']  

def main():
  """
  Usage:
    first arg - string to translate
    second arg - source lang
    third arg - target lang  
  Example:
    translate.py 'text to translate' en ru
    translate.py 'text to translate' ru en
    translate.py 'auto detect source language' ru
  "
""
  api_key = '**********'
  list_of_params = {'key' : api_key, }  
  
  if len(sys.argv) == 4:
    #both langs entered
    list_of_params.update({'q' : sys.argv[1],
                'source' : sys.argv[2],
                'target' : sys.argv[3] })
    translate(list_of_params)
  elif len(sys.argv) == 3:
    #auto source language
    list_of_params.update({'q' : sys.argv[1],
                'target' : sys.argv[2] })
    translate(list_of_params)    
  else:
    print main.__doc__
    
if __name__ == '__main__':
  main()

* This source code was highlighted with Source Code Highlighter.


Скачать скрипт
Теги:
Хабы:
Всего голосов 74: ↑59 и ↓15+44
Комментарии38

Публикации

Истории

Работа

Python разработчик
129 вакансий
Data Scientist
82 вакансии

Ближайшие события

AdIndex City Conference 2024
Дата26 июня
Время09:30
Место
Москва
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область