Proyecto Euphonia: La investigación del reconocimiento automático del habla se amplía para incluir nuevos idiomas, entre ellos, el español

Cuando las computadoras son capaces de reconocer patrones de habla más diversos, pueden ayudar a proporcionar más recursos para las personas con discapacidades y dificultades del habla en su vida diaria. En 2019, Google comenzó a trabajar hacia este objetivo a través del Proyecto Euphonia, una iniciativa de investigación que tiene como objetivo hacer que el reconocimiento de voz sea más accesible para las personas con discapacidades del habla. Hoy, en honor al Día Mundial de Concientización sobre la Accesibilidad, Google está ampliando sus esfuerzos de investigación a idiomas más allá del inglés, comenzando con pilotos en francés, hindi, japonés y español.

En muchos casos, cuando alguien con una discapacidad del habla usa cualquier asistente activado por voz, éste no lo entiende. Esto se debe en gran medida a que estas tecnologías de reconocimiento de voz no fueron entrenadas con un conjunto suficientemente diverso de muestras de habla, incluidas las muestras de personas con discapacidades del habla. Desde el lanzamiento de su investigación, los voluntarios han contribuido con más de 1600 horas de muestras de habla, creando el conjunto de datos de habla desordenada más grande conocido en el mundo.

Estas contribuciones han permitido a los equipos de habla e investigación de Google llevar a cabo una investigación de aprendizaje automático de vanguardia en el reconocimiento de voz, que incluye la capacidad de crear modelos personalizados que comprendan a las personas individuales y el reconocimiento de voz a voz que permita la repetición de palabras en una voz sintetizada clara. Este trabajo también les ayudó a lanzar Project Relate, una aplicación para Android actualmente en fase beta, que permite a las personas acceder a un modelo personalizado que ayuda a que la comunicación sea más accesible.

La compañía está muy emocionada por el éxito de su investigación en inglés y esperan poder hacer progresos similares en otros idiomas, comenzando con francés, hindi, japonés y español, pero para hacerlo posible, necesitan de su ayuda. Google ha aprendido a través de su trabajo que cuantas más muestras de habla exponen a sus modelos de reconocimiento de voz, más personas son capaces de ser potencialmente entendidas.

Si a su teléfono, computadora o dispositivo inteligente le resulta difícil responderle, o a las personas que acaba de conocer les cuesta entenderle, considere contribuir con este esfuerzo de investigación registrándose a través de sus formularios de interés en francés, hindi, japonés y español.

Be the first to comment

Leave a Reply

Your email address will not be published.