TechSmith ®
TechSmith ®

Generar voces con IA a partir de un texto o un guion

Aprende a generar audio profesional con voces de IA y a personalizar la configuración de la voz.

 

¡Pasa de texto a audio con calidad de estudio en segundos! Escribe, pega o importa texto en el modo de guion de Audiate y luego genera audio en una variedad de voces de IA personalizables en diferentes idiomas y estilos.

Prueba a generar audio a partir de texto cuando quieras:

  • Calidad de audio profesional, pero estás en un entorno poco propicio para la grabación.
  • Audio coherente en todo tu proyecto o si no te gusta cómo suena tu propia voz.
  • Ajustar el tono o el lenguaje para reutilizar el contenido en diferentes lugares o con diferentes fines.
  • Imitar una conversación o utilizar varios interlocutores.

Nota: la generación de voz mediante IA está disponible con la suscripción a Camtasia Audiate, Camtasia Create o Camtasia Pro.

Generar audio a partir de un guion

  1. Abre Audiate.
  2. Escribe texto completando cualquiera de las siguientes acciones:
    Pantalla de inicio con etiquetas en ubicaciones para añadir un guion
    1. Haz clic en Generate (Generar) y especifica instrucciones para que Audiate genere un guion con IA. Consulta Generar un guion con IA.
    2. Escribe o pega el texto en el campo Script (Guion).
    3. Arrastra un archivo de texto a Audiate.
    4. Haz clic en el botón Import a file (Importar un archivo) para importar un guion.
  3. Haz clic en el botón Generate (Generar) junto a la sección de texto.
    Botón Generate (Generar)
  4. En la pestaña Generate Audio (Generar audio), completa cualquiera de las siguientes acciones:
    Captura de pantalla de la pestaña Generate Audio con etiquetas para la vista previa de voz, el nombre de la voz, la búsqueda, el filtro y los ajustes de calidad de audio
      1. Haz clic en el icono de vista previa botón de vista previa de audio para previsualizar una voz.
      2. Para las voces premium, pasa el cursor sobre una voz para ver una descripción del estilo y el uso recomendado.
      3. Busca por nombre de voz.
      4. Haz clic en el icono de filtro icono de filtro para filtrar las voces por género, idioma, acento, categoría o grupo de edad.
      5. Haz clic en el icono de engranaje icono de engranaje para configurar la calidad del audio generado:
        • Una calidad inferior significa una frecuencia de muestreo menor, pero se tarda menos tiempo en generarla.
        • Una mayor calidad implica una frecuencia de muestreo más alta, pero requiere más tiempo para generarse.
    1. Para editar una voz, haz clic en el icono de edición icono para editar voz que aparece al pasar el cursor sobre el nombre y ajusta cualquiera de los siguientes elementos:
      • Para voces premium:
        Diálogo de edición de voz premium

        Nota: la colección de voces premium solo está disponible en determinados planes de suscripción (Camtasia Audiate, Camtasia Pro, Camtasia Create) comprados directamente en la tienda en línea de TechSmith. Las suscripciones adquiridas a través de distribuidores no dan derecho a voces premium. Todos los clientes tienen acceso a la colección de voces predeterminadas.

        • Speed (Velocidad): controla la velocidad de la voz generada. Arrastra el control deslizante o introduce un valor entre 0,7 y 1,2 para ralentizar o acelerar. Los valores extremos pueden afectar a la calidad.
        • Stability (Estabilidad): controla la coherencia entre las distintas pruebas de generación. Arrastra el control deslizante o introduce un valor entre 0,0 y 1,0. Una mayor estabilidad puede hacer que la voz generada suene más monótona. Para fragmentos de texto más largos, recomendamos reducir este valor.
        • Similarity (Similitud): controla la similitud con la voz del modelo de entrenamiento. Arrastra el control deslizante o introduce un valor entre 0,0 y 1,0. Esta propiedad puede ser muy subjetiva; te recomendamos que vayas probando hasta encontrar el valor óptimo.
        • Style Exaggeration (Exageración del estilo): intenta amplificar el estilo del hablante original. Arrastra el control deslizante o introduce un valor entre 0,0 y 1,0. Recomendamos 0,0 para obtener una estabilidad y una velocidad de generación óptimas. Aumenta el valor para conseguir un estilo más exagerado.
        • Speaker Boost (Amplificación del hablante): aumenta la similitud del discurso generado con el modelo de entrenamiento.

          Nota: esta opción requiere más tiempo para generar el audio.

      • Para voces predeterminadas:
        Diálogo de edición de voz predeterminada
        • Style (Estilo): elige entre una variedad de estilos de expresión, como amistoso, empático o entusiasta.
        • Speed (Velocidad): controla la velocidad de la voz generada. Arrastra el control deslizante o introduce un valor entre 0,5 y 2,0 para ralentizar o acelerar. Los valores extremos pueden afectar a la calidad.
        • Pitch (Tono): controla el tono de la voz generada. Arrastra el control deslizante o introduce un valor entre 0,5 y 1,5 para bajar o subir el tono.
    2. Cuando hayas terminado de editar, haz clic en Save Custom Voice (Guardar voz personalizada), dale un nombre y haz clic en OK.
      La voz guardada aparece en la sección de voces personalizadas de la pestaña Generate Audio (Generar audio).
    3. Haz clic para seleccionar una voz.
    4. Para generar audio con esta voz para todo el proyecto, habilita la opción Apply to entire project (Aplicar a todo el proyecto).
      Opción para aplicar a todo el proyecto

      Nota: al aplicar el audio generado a todo el proyecto, se sobrescribirá todo el audio grabado y generado anteriormente.

    5. Haz clic en el botón Generate Audio (Generar audio).

      Nota: para generar un avatar de vídeo de IA sincronizado con tu guion o audio, haz clic en el botón Add Avatar (Añadir avatar). Para obtener más información, consulta Generar avatares de IA.

      Audiate genera audio a partir del texto del guion. El texto cambia de blanco a amarillo.

    Cambios en los guiones

    Audiate facilita la actualización del audio en cualquier momento. Si actualizas el guion, haz lo siguiente para regenerar el audio de forma que coincida con el guion:

    1. Haz clic en cualquier sección de texto para entrar en el modo de guion Script.
    2. Introduce el texto que quieras. Cualquier texto nuevo o edición aparecerá en blanco hasta que se genere el audio para la sección.
      Actualizar guion
    3. Cuando hayas terminado de editar el guion, haz clic en el botón Done Scripting (Terminar guion) para regenerar el audio.

    Generar diferentes estilos de audio dentro de un proyecto

    Puedes aplicar una voz, idioma o estilo de audio diferentes a secciones individuales de texto dentro de un proyecto de Audiate. Por ejemplo, escenifica una conversación, establece el tono cambiando de locutor entre secciones de audio o cambia el idioma en todo tu proyecto de audio.

    1. Para entrar en el modo de guion Script, haz doble clic en una sección del texto.
    2. Puedes generar audio y aplicar estilos diferentes a cada sección de texto. Para crear una nueva sección de texto, pulsa dos veces la tecla Intro.
      Dos secciones de texto en Audiate
    3. Haz clic en el botón Generate (Generar) y sigue las instrucciones de Generar audio a partir de un guion para generar audio en cada sección de texto de tu proyecto.

    Nota: para saber más sobre cómo TechSmith aprovecha la tecnología de IA, consulta TechSmith y la IA.

    Todos los tutoriales de Audiate