5 tips para que la voz sintética se escuche más natural

5 tips para que la voz sintética se escuche más natural

En Telencuestas los audios de las preguntas se generan utilizando voces sintéticas de manera predeterminada. Aunque la calidad de la voz es excelente, por la forma en que el robot "lee" lo que escribimos, algunas frases se escuchan poco naturales. En este artículo comparto cinco tips que he aprendido durante muchas pruebas con las voces sintéticas. Espero que te ayuden a lograr que tus cuestionarios se escuchen lo más natural posible.

Tip #1: Tu texto no debe cumplir con las reglas de puntuación

Cuando escribimos para generar audio utilizando una voz sintética no tenemos que ser estrictos con las reglas de puntuación, ni con la ortografía. Lo que buscamos es que la voz sintética diga exactamente lo que queremos, y con las pausas y entonacion que queremos. El propósito del texto es lograr que la voz sintética se escuche lo más natural posible y que suene como un entrevistador haciendo la pregunta.

El texto final puede que no haga mucho sentido a un ser humano, pero el audio resultante sí lo hará. Como verás más adelante, a veces es necesario insertar una coma en lugares poco usuales para lograr una pequeña pausa y que la pregunta se escuche más natural.

Tip #2: Escribe los acrónimos como se escuchan en palabras

El robot es bastante bueno leyendo los acrónimos que escribes en mayúscula cerrada. Escucha el siguiente ejemplo sobre partidos políticos.

Si las elecciones fueran hoy, ¿por qué partido votaría usted? Presione 2 para PRD; presione 3 para PRI; presione 4 para MORENA; presione 5 para PAN; presione 6 si no sabe, o presione asterisco para repetir la pregunta.

En este ejemplo el robot leyó bien el acrónimo PRD, como “pe” “erre” “de”, e inclusive el PRI lo leyó como "pri" en lugar de "pe" "erre" "i". Sin embargo, en ocasiones el robot no lee los acrónimos de la forma que esperamos. Escucha el siguiente ejemplo sobre alianzas políticas.

Si las elecciones fueran hoy, ¿por qué alianza votaría usted? Presione 2 para PAN-PRI-PRD; presione 3 para MORENA-PT-PVEM; presione 4 si no sabe, o presione asterisco para repetir la pregunta.

Cuando el robot no "lee" los acrónimos de la forma que esperas, escríbelos como las palabras que deseas escuchar. Para el ejemplo de las alianzas, primero debemos eliminar los guiones. Luego, debemos escribir PVEM como "pe" "vem" para que el robot lea las palabras en lugar de deletrear el acrónimo.

Si las elecciones fueran hoy, ¿por qué alianza votaría usted? Presione 2 para PAN PRI PRD; presione 3 para MORENA PT pe vem; presione 4 si no sabe, o presione asterisco para repetir la pregunta.

Tip #3: Inserta una coma donde escuches una cacofonía

Las cacofonías son combinaciones de sonidos en una frase que la hacen desagradable al oído, sencillamente no suenan bien. Escucha el siguiente ejemplo que contiene varias de ellas.

¿Qué edad tiene usted? Presione 1 si tiene menos de 18 años, presione 2 si tiene entre 18 y 29 años, presione 3 si tiene entre 30 y 39 años, presione 4 si tiene entre 40 y 49 años, presione 5 si tiene entre 50 y 59 años, presione 6 si tiene 60 años o más, o presione asterisco para repetir la pregunta.

Una de las cacofonías está en la frase:

…presione 3 si tiene entre 30 y 39 años…

A primera vista no se nota, pero si escribimos los números en palabras, el problema se hace evidente.

…presione tres si tiene entre treinta y treinta y nueve años…

Normalmente no lo escribiríamos así, pero en este caso debemos insertar una coma después del “30” para lograr una pequeña pausa que elimine la cacofonía, de la siguiente forma:

…presione 3 si tiene entre 30, y 39 años…

La misma cacofonía se produce en las frases cuarenta y cuarenta y nueve, cincuenta y cincuenta y nueve. Al final, la pregunta corregida quedaría así:

¿Qué edad tiene usted? Presione 1 si tiene menos de 18 años, presione 2 si tiene entre 18 y 29 años, presione 3 si tiene entre 30, y 39 años, presione 4 si tiene entre 40, y 49 años, presione 5 si tiene entre 50, y 59 años, presione 6 si tiene 60 años o más, o presione asterisco para repetir la pregunta.

Tip #4: Utiliza punto solo cuando quieras pausas muy prolongadas

La pausa que introduce un punto es mucho más prolongada que la de una coma y hace que la pregunta tenga poca fluidez. Escucha esta versión del ejemplo anterior que tiene las opciones separadas con puntos.

¿Qué edad tiene usted? Presione 1 si tiene menos de 18 años. Presione 2 si tiene entre 18 y 29 años. Presione 3 si tiene entre 30, y 39 años. Presione 4 si tiene entre 40, y 49 años. Presione 5 si tiene entre 50, y 59 años. Presione 6 si tiene 60 años o más. O presione asterisco para repetir la pregunta.

Cuando necesites introducir una pausa, prueba primero con una coma. Si no logras que se escuche como quieres, entonces prueba con el punto. En la mayoría de los casos lograrás las pausas necesarias utilizando solo una coma.

Tip #5: Separa los dígitos con espacios cuando se trata de un número telefónico

El robot lee cualquier número como una cantidad. El típico ejemplo es la pregunta del nivel socioeconómico:

¿Cuál de las siguientes opciones refleja mejor su ingreso familiar mensual? Incluyendo todas las personas que aportan al hogar. Presione 1 si es menos de 400 dólares; presione 2 si está entre 400 y 799 dólares; presione 3 si está entre 800 y 1499 dólares; presione 4 si está entre 1500 y 2499 dólares; presione 5 si es de 2500 dólares o más; presione 6 si no sabe, o presione asterisco para repetir la pregunta.

Sin embargo, hay situaciones en las que necesitas que el robot lea un número dígito por dígito, como cuando incluyes un teléfono en un mensaje de voz:

Si deseas una cotización, envíanos un mensaje de WhatsApp al 5501235678, y en breve te atenderemos.

El único problema es que el robot lo lee como una cantidad, y se escucha así:

La solución es sencilla, separa el número de teléfono con espacios de la siguiente forma:

Si deseas una cotización, envíanos un mensaje de WhatsApp al 5 5 0 1 2 3 5 6 7 8, y en breve te atenderemos.

Y el robot leerá el número telefónico dígito por dígito:

Conclusión

Cuando utilizamos voces sintéticas, pequeños cambios en los signos de puntuacion hacen que las frases tengan la pausa y entonación adecuadas, las que nos hacen olvidar por un momento que estamos escuchando a un robot. Espero que estos tips te ayuden a lograr que tus cuestionarios se escuchen tal y como quieres, y sin tener que grabarlos.

Dioris Moreno

Acerca de Dioris Moreno

Desarrollador de Software, Consultor VoIP y amante de la política.

Creé Telencuestas para ayudar a los encuestadores a conocer lo que piensa la sociedad. @Telencuestas

¡Regístrate gratis!

Reclama tu crédito de $10 dólares y empieza a encuestar hoy.
No necesitas una tarjeta de crédito.

Una breve historia de Telencuestas
Una breve historia de Telencuestas
En este artículo cuento brevemente la historia de Telencuestas: cómo surgió la idea, qué funcionalidades hay en la nueva versión y hacia dónde vamos.
Leer más
El Manual de Sabotaje
El Manual de Sabotaje
Descubre las tácticas de sabotaje utilizadas por la OSS durante la Segunda Guerra Mundial y explora las similitudes con comportamientos en tu equipo de trabajo.
Leer más
Cuántas entrevistas son suficientes
Cuántas entrevistas son suficientes
Descubre cuál es el tamaño de la muestra más adecuado para tu encuesta. Aprende sobre los parámetros que inciden en el margen de error de tus resultados.
Leer más
Qué es la ponderación de encuestas y cómo funciona
Qué es la ponderación de encuestas y cómo funciona
Aprende cómo funciona la ponderación de encuestas y cómo aplicarla para obtener muestras que representen a la población.
Leer más
Qué preguntas hacer en una encuesta electoral telefónica
Qué preguntas hacer en una encuesta electoral telefónica
Descubre cuáles son las preguntas más importantes para determinar la preferencia de los votantes con una encuesta electoral telefónica.
Leer más
Cómo hacer una encuesta electoral telefónica
Cómo hacer una encuesta electoral telefónica
Aprende cómo hacer una encuesta electoral telefónica automática. Utiliza una plantilla para crear tu cuestionario con voces sintéticas.
Leer más
Cómo analizar datos con tablas dinámicas de Excel
Cómo analizar datos con tablas dinámicas de Excel
Aprende cómo utilizar las poderosas tablas dinámicas de Excel para automáticamente agrupar, sumar, contar, promediar y cruzar tus datos.
Leer más