Python 3 – Pythonでのテキスト読み上げ

テキスト読み上げ(TTS)は、書かれたテキストを話し言葉に変換することです。PythonでTTSプログラムを作成できます。 話される音声の品質は、音声エンジンによって異なります。

この記事では、独自のTTSプログラムを作成する方法を学習します。

関連コース: 完全なPythonプログラミングコースと演習

Pythonでのテキスト読み上げ

espeakの例

プログラム「espeak」は、書かれたテキストを話し声に変換する単純な音声合成装置です。 espeakプログラムは少しロボットのように聞こえますが、基本的なプログラムを作成するのに十分シンプルです。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import subprocess

def execute_unix(inputcommand):
p = subprocess.Popen(inputcommand, stdout=subprocess.PIPE, shell=True)
(output, err) = p.communicate()
return output

a = "Say something in natural language."






c = 'espeak -ven+f3 -k5 -s150 --punct="<characters>" "%s" 2>>/dev/null' % a
execute_unix(c)

GoogleでのTTS

グーグルは非常に自然な響きの声を持っています。 以下のコードでTTSエンジンを使用できます。
このプログラムには、モジュールgTTSとプログラムmpg123がインストールされている必要があります。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15




from gtts import gTTS
import os


s = "escape with plane"
file = "file.mp3"


tts = gTTS(s, 'en')
tts.save(file)
os.system("mpg123 " + file)

音声/ mp3ファイルを出力します。

関連コース: 完全なPythonプログラミングコースと演習

Hope this helps!

Source link