ラベル google の投稿を表示しています。 すべての投稿を表示
ラベル google の投稿を表示しています。 すべての投稿を表示

2012年6月30日土曜日

Using Google Text-to-Speech

Googleのテキスト読み上げapiのText-to-Speechを使って、
文字列から音声ファイル(mp3)を作成する


http://translate.google.com/translate_tts?tl=ja&q=おはようございます。気持ちのよい朝ですね。

↑のURLにアクセスすると、mp3形式で返ってくるので、ブラウザにmp3再生プラグインが入っていればテキストを読み上げてくれる。
(URLをブラウザのアドレスバーをコピーしてアクセスしてもよい)


パラメータは、次のようになっている。


tl・・・言語の指定(日本語 ja、英語 en、中国語 zh-CN、フランス語 fr、ドイツ語 de、ロシア語 ruなど)

q・・・読み上げるテキスト(最大100文字)





試しにPythonでURLにアクセスして帰ってきたmp3をファイルに保存するようにしてみた。
実行すると、sample.mp3ファイルが作成される。

#!/usr/bin/python
# -*- coding: utf-8 -*-

import urllib2

text = 'むかしむかしあるところにおじいさんとおばあさんがいました。'

opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
url = 'http://translate.google.com/translate_tts?tl=ja&q=' + text
mp3data = opener.open(url).read()

f = open("sample.mp3","wb")
f.write(mp3data)
f.close


適当なUser-agentを付けないと、403エラーが返ってくるので注意

2012年6月20日水曜日

Tesseract OCR 3.01 and Leptonica 1.68 Installation on CentOS 6.2

googleのオープンソース文字認識ソフト Tesseract OCR をインストールする。

ローカル環境(OS: CentOS6.2) 2012年6月20日現在ソフトウェアの最新バージョン
Tesseract OCR 3.01
Leptonica 1.68