Reconocimiento de voz en Python (Texto a voz)

Podemos hacer que la computadora hable con Python.

Dada una cadena de texto, pronunciará las palabras escritas en inglés.
Este proceso se llama Texto a voz (TTS).

Texto a voz

Pyttsx texto a voz

Pytsx es un contenedor de texto a voz multiplataforma.
Utiliza diferentes motores de voz basados ​​en su sistema operativo:

nsss – NSSpeechSynthesizer en Mac OS X 10.5 y superior

sapi5 – SAPI5 en Windows XP, Windows Vista y (no probado) Windows 7

hablar – eSpeak en cualquier distribución/plataforma que pueda alojar la biblioteca compartida (p. ej., Ubuntu/Fedora Linux)

Instale con pip (usando pyenv, pipenv o virtualenv):

sudo pip install pyttsx

Luego ejecute el código de ejemplo:

import pyttsx
engine = pyttsx.init()
engine.say('Good morning.')
engine.runAndWait()

gTTS texto a voz

gTTS es un módulo y una utilidad de línea de comandos para guardar texto hablado en mp3.
utiliza el API de texto a voz (TTS) de Google.

Escuche la muestra de voz a continuación:

Curso relacionado: El curso completo de machine learning con Python

Este módulo admite muchos lenguajes y suena muy natural.

Instalar
Instale con la herramienta de paquete de python (pip):

sudo pip install gTTS

Ejemplo

from gtts import gTTS
import os
tts = gTTS(text='Good morning', lang='en')
tts.save("good.mp3")
os.system("mpg321 good.mp3")

Si desea probarlo en la línea de comando, use:

gtts-cli.py "Hello" -l 'en' -o hello.mp3

iOS TTS y reconocimiento de voz

TTS en Pythonista para iOS:

import speech
speech.say('Hola mundo', 'es_ES')

Para grabar sonido:

import sound

r = sound.Recorder('audio.m4a')
r.record(3)  

Para reconocerlo como texto:

text = speech.recognize('audio.m4a', 'en')[0][0]

Motor de voz de Microsoft

Si usa Microsoft Windows 10, tiene un motor de voz incluido.
Instale el módulo win32com, luego puede usar este código:

import win32com.client as wincl
speak = wincl.Dispatch("SAPI.SpVoice")
speak.Speak("Hello World")

IBM Watson TTS

IBM ha creado una API tts, que es gratuita para una cantidad limitada de consultas.

Su API tiene muchos lenguajes, incluidos inglés, alemán, español, francés, italiano, japonés y portugués. También tienen diferentes altavoces.

Puede escuchar datos de muestra en la página de Watson TTS.

Puede usar el módulo tts-watson para interactuar.

pip install tts-watson

Después de registrarse en el sitio de IBM Watson (generar claves allí),
podemos escribir nuestro código:

 
from tts_watson.TtsWatson import TtsWatson

ttsWatson = TtsWatson('watson_user', 'watson_password', 'en-US_AllisonVoice') 
ttsWatson.play("Hello World")

Alternativamente, puede usar curl para buscar directamente desde la API.

Te recomiendo mas entradas sobre Machine Learning:

El mundo de los negocios está cambiando y uno de los principales impulsores de esta transformación es la tecnología. Entre ...
Trabajar con Big Data es muy costoso, además de que muchas empresas aún no cuentan con la infraestructura adecuada para ...
Python lidera en lenguajes de desarrollo de Machine Learning por su sencillez y facilidad de aprendizaje. Python es utilizado por ...
Quería comparar el rendimiento de una CPU y una GPU que se venden en el mercado. Para realizar esta comparación, ...
Los datos de entrenamiento y prueba son comunes para los algoritmos de aprendizaje supervisado. Dado un conjunto de datos, se ...
Pero para que sirve? Según la **revista (http://forbes.es/)**, estas son las diez aplicaciones y usos más habituales de esta disciplina: ...

¿ Te sirvió este artículo Reconocimiento de voz en Python (Texto a voz)?
⬇️ Tu apoyo compartiendo me ayuda bastante.⬇️