Mostrando entradas con la etiqueta Tutoriales. Mostrar todas las entradas
Mostrando entradas con la etiqueta Tutoriales. Mostrar todas las entradas

martes, 12 de marzo de 2013

Tutorial para producir audiolibros


Tutorial para la producción de Audiolibros

Leer TODO antes de bajar y usar...
Por favor, pasar el tutorial, pero no publicar abiertamente los links aqui propuestos.
(Y avisar si caducan... gracias!)

Requisitos:
Manejo de WinRar (u otro programa para descomprimir),
Saber dónde se guardan los archivos descargados por internet en la computadora de cada uno...
Un emulador virtual (programas que permiten ver los contenidos de un cd sin su soporte material, como alohol 120%  o  clone drive . Muchos se descargan gratuitamente y basta para encontrar otros, que pongamos la búsqueda de emulador virtual gratis decarga en google, e instalemos… o que tengamos instalado Nero (o similar) y dispongamos de un cd virgen.
Correo-e por si surge una duda.

Ténme y ténganse paciencia...  Nadie hizo milagros a la primera.

Así que empezaremos con lo básico: para poder sintetizar un libro o cualquier documento de texto necesitamos una serie de programas, y descargarlos e instalarlos previamente, claro:

I

*Descargamos el motor de las voces, que es el SAPI 5.1.
Sin este motor, nos sería imposible hacer funcionar las voces. Las voces no sólo se utilizan para producir audiotextos: las personas con dificultades visuales, con dificultades para leer (analfabetos o de lengua materna extranjera, por ejemplo), o con dificultades motrices, etc. la usan para guiarse en el ámbito informático – virtual.
Obtendréis el enlace de descarga con el cursor sobre el texto coloreado y subrayado.

¿Instalado ya?

II

 *Luego bajamos el programa sintetizador de las voces a partir de un documento de texto: el Textaloud 2.3
Hay versiones más modernas, pero son no se adquieren gratuitamente.  Dentro del archivo descargado suele haber intrucciones en un archivo de texto (.txt). Recuerden tener abierto el texto con los códigos a mano, pues cuando lo instalen; se los pedirá.

¿Listo?

III

*Ahora descargamos e instalamos el programa y las voces loquendo, en el orden dado en las instrucciones, como aparecen en la imagen más abajo. Las voces son programas sueltos que se obtienen de acuerdo al motor disponible, al lugar de procedencia de cada uno o el idioma del texto a sintetizar.
Hay decenas entre las cuales elegir, pagas, gratuitas, populares o no, y todo es cuestión de meterse en el mundillo e ir buscando y probando.
Estos son enlaces a sitios de descarga del archivo .iso  (Una copia o imagen de un CD) que bajamos y que podemos ejecutar (o ver) habiéndolo grabado en un cd (con Nero, por ejemplo) o visualizándola con un emulador virtual previamente istalado (como el virtual clone driver), opción para quienes no quieran grabar el cd. También hay entre ellos un archivo .rar con los ejecutables: .exe equivalentes a los botones de la foto de pantalla que utilizamos justo abajo, en este tutorial.

TTS 7 es la versión más nueva del programa Loquendo. El TextAloud es reemplazable por el Loquendo Director. Instalando ambos dispondrán de la opción de ver qué interfaz les resulta más práctica, eficiente y veloz. Mientras que uno deja accesos directos, el otro tendrán que buscarlos en “Inicio”, “Programas”, “Loquendo TTS7”, “Loquendo Director”.




El grupo Loquendo es un programa motorizador de voces y un pack de voces numerosísimas, pero las más utilizadas las teneís aquí incluidas. Son la voz de Jorge y la de Carmen. Encontrarán más, y si son de su gusto y solo tienen que instalarlas.



***

Hay más voces “no loquendo” para instalar y utilizar con TexAloud, tales como las de AT&T, Rosa, Inés y Antonio, muy utilizadas para textos juveniles e históricos, pero este grupo tiene el inconveniente de no ser compatible con Windows Vista, y suele crear problemas.  
Una opción es que si os gusta su voz, instaleís los Ejecutables AT&T para vista.rar. Y a intentarlo.

Una voz loquendo muy popular es la de Leonor, para textos de suspense o policiales.
Hay muchas más, con acentos de diferentes países... podéis buscar información adicional en internet.
Por ejemplo...
Esperanza, (Chilena) Francisca,  (Argentina) Diego
Aquí un enlace para varias voces extra... Aquí otro... 

Pero de todas formas, sumar voces es algo que podréis hacer con tiempo, explorando y experimentando.

***

Si trabajar con una imagen de CD les parece complicado, pueden entre los enlaces optativos descargar los archivos comprimidos con los ejecutables del programa sueltos, (los que aparecen como botones para apretar en el cd), solo que hay que ejecutarlos en este orden:

1) Loquendo TTS 7 Win32 Engine Full Distribution

2) Loquendo TTS 7-Win32 Spanish Distribution

3) Voces (Las que quieran, según los links sueltos dados u estos otros): Juan
Ximena, Esperanza, Diego

4) ParcheParche para las voces


IV

Otro programa muy bueno y útil:
El  Mp3DirectCut, que nos sirve para cortar los audios que hayamos sintetizado
(O cortar los segmentos muy largos de los audios bajados de  internet); es muuuuy facil de utilizar.
La dirección la teneís aquí, y es gratuita.


V

Ahora bien,  una vez ya tenemos todo descargadito, nos vestimos de paciencia y empezamos.

Configuración para el funcionamiento correcto del programa

Cuando abramos TextAloud nos saldrá esta imagen. (Dejaremos el Loquendo Director para más adelante, aunque son realmente parecidos)

En Title, se muestra el título del libro o el texto a sintetizar.
En Voice, la voz que nosotros hayamos escogido.
Podemos cambiarlos según deseemos.

Del texto a sintetizar

Para poder acceder a los libros, o diferentes textos, hay que prepararlos como primera medida:

Corregir su puntuación, ortografía y pasarlo a txt de ser posible, ya sea copiándolo de word y pegándolo en la gran ventana del TextAloud –así garantizamos que no haya pausas innecesarias en los saltos de renglón, por ejemplo- o los vamos dejando guardados en un Directorio como txt, sea el directorio que viene por defecto con el programa o el que nosotros le querramos asignar.
Será en el Icono de Open, donde tendremos los diferentes textos guardados previamente. Si no los guardamos y simplemente lo pegamos antes de sintetizarlo, no pasa nada. Incluso hay quien así lo prefiere.
 Esta es la imagen que saldrá si tienes diferente libros, y en el formato de txt. Pueden procesarse otros formatos -.doc, .pdf, etc.- pero muchos caracteres son malinterpretados como imágenes o el programa leerá pausas donde uds. vean un cambio de página, por ejemplo. 



***


De las voces

Ahora vamos a ver si tenemos instaladas las voces y cómo acceder a ellas.
Cuando están bien instaladas, saldrán en la viñeta de Voice, o si quieren  cambiar el formato de voz es en esta ventanita donde lo podeís hacer.
Accedemos a ella en Options, y le damos a Voices. Dentro de la ventana podeís ver las voces que hay instaladas. Se suele usar SAPI5, porque es el motor que arranca todas las voces disponibles. 



En la pantalla principal hay una ventana donde podemos modificar la rapidez o profundidad de la voz que vayamos a utilizar.


Cada uno utilizará el volumen, la agudeza del timbre o la velocidad según su gusto. Pero hemos de tener presente, que algunas voces por defecto vienen muuuuy lentas, tal como la voz de Carmen.
Un ejemplo de una buena posible configuración es CARMEN: pitch: 0; speed: 2; volumen: 255 ; bit rate: 24kb 16 kHZ

Teneís que modificar ciertas ventanas que viene por defecto del programa , y hay que ajustarlas.


Pueden  poner a 32 kbps o 24, según la densidad que quieren darle a la voz. Cierto que a menos bits, mayor velocidad en el procesado y menos espacio ocupa el audio. Lo mismo que cuando incrementamos la velocidad tanto de escritura como de reproducción de una voz: se ahorra tiempo en detrimento –mínimo, a mi modo de ver- de la calidad.
El resto todo igual, pero tened en cuenta en qué carpeta quieren que se guarden los archivos sintetizados (Audio Output Directory). Y salvo que cambien la voz, el audio saldrá automáticamente con la voz por defecto seleccionada.


***
Otras Configuraciones

En text aloud Options   verán varias pestañas que tendrán que modificar:

Article Option




Clipboard Options




Predefined Pauses


Miscellaneos
En esta ventana teneís que tener muy presente,que la voz que siempre por defecto os va ha salir en el programa cada vez que la abrais será la que pongaís en Default Voice.


Ahora que está todo a punto:
Nos situamos en la página principal del programa.
Tenemos el texto escogido y visualizado en la ventana principal, y la voz que deseamos.
Todavía no vamos a sintetizar,  tenemos que modificar ciertas cosas.
Textaloud lee tal como está escrito.

VI

Ahora tenemos una gran labor por delante, pues en esta sección es donde se diferencian los buenos sintetizadores de los "mediocres".
(sin embargo, al final de esta explicación, encontraréis un "atajo" que, solidariamente, hemos encontrado)
Si en el texto hay alguna palabra en otro idioma como el inglés, habrá que modificarla.
Ejemplo: “Lady”, cambiaremos la pronunciación a Leidi.
              Siglo X ,
cambiaremos a Siglo diez.


Os encontrareis con nombres difíciles, pero vale la pena trabajar en este asunto. Todas las palabras que modifiquéis en el programa quedarán guardadas.

Para hacerlo, hay dos formas:
Aparece el nombre James –es el protagonista de nuestro libro- pero el TextAloud lee James y no yéims o shéims, como es la fonética inglesa. 
(Yo recomiendo siempre que sea posible, la segunda forma, pero conozcámoslas a ambas)


1)      Podemos modificarlo durante la preparación del texto cuando es word o ya copiado en la ventana grande del programa; utilizando buscar (search) y reemplazar (Replace)por la fonética (Esta opción aparece en la barra superior, dentro de “edicion” o Edit, al lado de “archivo” o “File”)

Buscar james y reemplazar por Yéims

 Remplazar en Texaloud

En Edit, accederemos a Replace.



En la viñeta de Text to Find escribiremos el texto tal y como sale en el programa, y en Replace With escribiremos como queremos que salga apartir de ahora en el texto que tenemos. Esta modificación solo será activa para el texto que tenemos ahora mismo, no para futuros textos.  La casilla Whole Words Only debe activarse cuando el cambio puede afectar erróneamente a otras palabras, por ejemplo, cuando observo que la palabra Capítulo no está llevando tilde y el corrector de Word no lo ha detectado como incorrecto –porque es, de hecho, un verbo en primera persona del castellano: Yo capitulo.
Dentro del texto, sin embargo, puede hallarse la palabra “recapitulo” y si dejo sin tildar la opción para sólo Palabras Completas, cada “capitulo” –sea o no una palabra entera, cambiará su pronunciación.
Quizás este no sea el mejor ejemplo, pero puede suceder también que el texto contenga guiones para anunciar el corte de una palabra:
Él la cul-
pó y la abandonó.
Si aparece tildada la opción “palabras completas” no podrán detectar eliminar los guiones para que las palabras queden unidas sin una pausa intermedia; porque en este caso son parte de una palabra al no estar separados por espacios.

Parece difícil, pero de a poco iremos aprendiendo a automatizar estas cosas.

2)      O podemos agregar la fonética en el botón “Options”, la función  Pronuciation Editior



En Word os deberá estar la palabra tal como se escribe en su idioma (James) y en Pronciation
escribís la palabra modificada según su sonido (Yéims). Así el programa, cada vez que lo lea en cualquier texto, lo enunciará como habremos modificado nosotros.
También sirve para evitar que nuestro loquendo lea sin parar, en expresiones que es bueno darle entonación. Si no lo leería todo de corrido y sin inflecciones.

Ejemplo, los : (dos puntos) deberían significar una pausa mínima; pero de momento el programa no lo hace, así que lo modificamos y le damos el valor de un punto o una coma.
Lo mismo pasa con: ...  - _ —  y otros signos.

A su vez, es indispensable para que no haga pausas innecesarias, como sucede con las abreviaturas:
Dr. Debe leerse doctor (sin pausa por el punto al final), y esto sucede con Mr., Mrs., Dra. Srta., Sra., Sr., St. (séint en inglés), etc.

Estos son los editados más habituales utilizados en pdf y Word, que textaloud no lee; y si los incorporamos a nuestro editor, ya nunca más deberemos preocuparnos por ellos. Deberemos escribir...




Como vemos, muchos signos debemos colocarlos en el editor arropados con el signo "&" tanto delante como detrás (Significa comodín, puede haber cualquier cosa antes o después, depende de donde esté el &, y cuidado con los casos donde se incluye el espacio! –como en &ou  &).
Los números a los que apunta la instrucción "Pause", hacen referencia a los segundos de pausa que queramos que el lector haga al encontrarla. Esto se puede variar al gusto de cada uno.
Sumen todos los nombres en inglés que se les ocurra. Además, palabras como house, road, Street, honey, y que vayan siendo detectadas por el corrector ortográfico de Word.
Una vez hecho, arreglado para simpre.

Créanme, esto deberán hacerlo una única primera vez.  Desde luego es una labor menos de la que ocuparse a la hora de preparar un texto, y todo aquello que nos facilite el trabajo futuro se agradece un montón.
Sólo tienen que modificar en el "Pronciation Editor", esas pequeñas modificaciones, y después sí ir sólo atendiendo a algunos términos propios de cada libro.


¿Cómo saber que todo está bien?

Siempre podemos situar el lector colocando el cursor con el mouse delante de un trozo texto a leer y presionar Cursor. (Arriba, en los botones del medio y con los parlantes del ordenador o computadora encendidos). Esta función es la que nos permite escuchar “en vivo y en directo” determinado texto.


Grabar
Con el texto en pantalla le daís al Icono numero 6 Text to file , y os saldrá una ventanita en la cual os preguntará dónde quieren guardar el audio. Le dais a OK, y
ya estamos listos para empezar.




Aquí el atajo: cuando vamos haciendo estas "correcciones fonéticas", se va modificando un archivo alojado en C:/ Archivos de Programa / Textaloud; llamado usertranslations.chl, que podemos compartir con uds. por este medio y al que simplemente tienen que sustituir por el que ya existe allí; es decir, meted éste en la carpeta Textaloud, y listo. Horas y horas de correcciones ahorradas!





Tengan este tutorial a mano. Puede parecer complicado... pero siguiendo paso a paso, será sencillo...  SUERTE!

domingo, 9 de diciembre de 2012

Tutorial para crear un archivo PDF o DOC, a partir de un libro de papel y un escáner...

En la base de todo libro digital
hubo antes un libro en soporte de papel... 
¿Cómo conseguir digitalizarlo?
Maravillosa informática y milagrosa Internet que nos alcanza todas las herramientas para ganar conocimiento y poner al alcance de otros el conocimiento que nosotros podemos generar con nuestro tiempo y saberes adquiridos... Y como este es un sitio para multiplicar nuestros aprendizajes...
Hete un tutorial aquí;
Y el magnífico programa que lo consiquqe, aqui. (o en sitios similares).
Para transformar un PDF a word, dos sitios on line gratuitos acá o aquí mismo.

martes, 4 de septiembre de 2012

Tutorial para hacer audiolibros II (Con Balabolka)

Programas imprescindibles:

Sapi 5
Necesario si se trabaja con WIN XP. Vista, W7 y W8 ya integran versiones más avanzadas. Se trata de un motor de voz, una especie de códec necesario para que Windows sepa que hacer con las voces.

Voces:
Muchas opciones, cada día más humanizadas y más complejas. Con todo Jorge, del fabricante Loquendo, sigue siendo el rey y en este manual nos centraremos en él y en una de las últimas versiones.

Programas TTS (Text to Speech) (Texto a voz):
En este apartado también podemos encontrar variedad de ellos. Sin duda los más famosos y populares creo que se puede afirmar son Textaloud y Sodelscot.
¿He dicho populares?, Sí. Pero no siempre lo más común es lo mejor. En mi caso prefiero con diferencia Balabolka. Además de ser Free posee algunas cualidades que para hacer audiolibros de manera seria resultan muy prácticas y facilitan mucho la vida.

Así pues nos vamos a centrar en Jorge de Loquendo y Blabolka. Sus configuraciones más prácticas y en como obtener los mejores resultados.

SAPI 5.1
Primero y en caso de tener WinXP o inferior debemos hacernos con Sapi 5.1 e instalarlo. Se encuentra en toda la red. Es un producto de Microsoft y es gratuito. No representa mayor problema.

Loquendo SDK y voces V7
A continuación deberemos instalar las voces que queramos. En nuestro caso ya digo que nos centramos en Jorge de Loquendo por ser la más popular y la más agradable a mi juicio.

Aquí nos encontramos con varias versiones que van desde las muy antiguas del año 2005 y que deben de ser versiones 4 o 5, hasta las más actulaes versiones 7.4.
En esta ocasión nos vamos a quedar con la versión 7 que es sencilla de instalar y ofrece muy buena calidad de sonido.
Y dicho sea de paso debéis de huir de las antiguas versiones de 25 megas que rascan tremendamente y están llenas de bugs. La diferencia es notable entre unas y otras.

Aquí tenemos el SDK 7 de Loquendo junto con algunas voces de calidad.  
 Son dos ficheros que hay que bajar al ordenador y descomprimir el primero en una carpeta de nuestra elección. (winrar automáticamente echará mano del segundo fichero cuando lo necesite)

Nos encontramos con un instalador muy sencillo y que bastará con seguirlo en orden para tener las voces correctamente instaladas y listas para su uso:

Imagen


Como vemos es una TEU (todo en uno) y con seguir las instrucciones que figuran en la parte inferior derecha tendremos instalado lo necesario en unos minutos.

Si todo ha ido bien ya tenemos a Jorge listo para contarnos todos los cuentos que queramos.

Balabolka:

Para la ocasión nos vamos a quedar con una versión portable que ofrece de manera gratuita el fabricante. Aquí la podéis obtener.
 Descomprimimos el archivo donde mejor nos parezca de nuestros discos duros e iniciamos el programa desde balabolka.exe.

Lo primero que haremos será configura el formato de salida de audio. Para ello iremos a Opciones/Archivos de Audio y nos aparecerá esta ventana. Configuramos tal y como se ve el la imagen la calidad de los archivos mp3 ya que es la ideal para obtener la mejor calidad con un tamaño menor de archivo.

Imagen


Ahora vamos a la pestaña Ver/Ver/Grupo de diccionarios. A la derecha aparecen varios del fabricante. Ninguno nos es útil por lo que podéis prescindir de ellos. Desmarcar cualquier casilla que esté marcada, vamos. Entonces situamos el cursor dentro de la ventana de diccionarios y con el botón derecho hacemos clik y seleccionamos “NUEVO”. Le ponéis el nombre que mejor os parezca y una vez creado lo marcáis para que sea vuestro diccionario para siempre. Os recomiendo hacer copias de seguridad del diccionarios de vez en cuando.
Bien. Ahí es donde se guardarán los palabros que vayamos editando. Es decir, por ejemplo las palabras o nombre en inglés que vamos a encontrar en todos los libros y deberíamos de editar para que Jorge las pronuncie algo más católicamente.

El resto de opciones son secundarias y por defecto están relativamente correctas. El programa tiene muchas otras opciones pero no es la intención de este manual profundizar en todas ellas.

Procedemos a seleccionar a Jorge como voz a utilizar según se ve en la siguiente captura:
Imagen


Abrimos un documento que queramos sintetizar en Word o en el editor que utilicemos y copiamos todo el texto que contenga.
Lo pegamos en la ventana principal de balabolka y procedemos si procede a colocar los punto y aparte que el texto necesite. Por ejemplo, tras cada “CAPÍTULO X”. de no haber puntos y aparte en estas líneas el lector no hará una pausa y el resultado a la hora de escucharlo no será todo lo bueno que debía de ser.

Bien. Este programa tiene una opción muy práctica que consiste en que busca todos los nombres que no se encuentran en el diccionario español de la lengua. Y con ellos abre una nueva ventana donde permite ir editándolos de manera muy cómoda.

Para ver a que me refiero vamos a Opciones/Pronunciación correcta/buscar nombres en el texto.

Imagen


Nos aparecerá algo similar a esto. Pues bien, a la izda aparece un listado con todas las palabras paganas que se encuentran en el texto. Muchas de ellas no será necesario editarlas. Pero otras sí. Para escuchar como las lee Jorge basta con hacer click en cada palabra de la izda. Cuando encontramos con una que la pronuncia horriblemente hacemos clik en “Agregar una palabra al diccionario” (Diccionario éste que ya habremos creado anteriormente si habéis leído todo el manual) Y nos aparece otra ventana:

Imagen


En ella vemos arriba la palabra original, debajo la misma palabra esperando ser modificada para que el lector la pronuncie a nuestro gusto. Una vez hcha la edición pinchamos sobre “Ad and Save” y a partir de ese momento Jorge leerá ese palabro tal y como le hemos indicado. En este texto y en los futuros. Siempre. Además, si marcas la casilla “Ocultar palabras de los diccionarios” nunca más te volverá a salir en,los listados ni te molestará para que la edites de nuevo.

Una vez hayamos editado todos los palabros necesarios cerramos el editor y ya podemos proceder a sintetizar el texto en audio.

Para ello vamos a “Archivo/dividir y convertir a audio”. Este programa se encarga de todo el proceso de manera transparente y no requiere intervención alguna. Se abrirá una nueva ventana donde seleccionaremos la carpeta de destino y el nombre de los ficheros de audio. Así mismo tenemos varios métodos para determinar el tamaño de estos. Lo normal es seleccionar “Por tamaño de bloques de texto” y darle un valor de 5 o 6 KB. A mayor tamaño menos ficheros pero más grandes, claro está. Le damos a dividir y convertir y Voila! En unos minutos tendremos todos los ficheros del audio en la carpeta que hayamos elegido.

Imagen


Le damos a “Dividir y Convertir” y nuevamente a “Dividir” en la siguiente pantalla y a esperar que termine de sintetizar y convertir a mp3 los fragmentos del texto.

En esta última captura veréis que hay varias opciones para dividir el texto y los consiguientes ficheros mp3. Yo siempre me limito a cortar por lo sano en ficheros de 6 kb pero se pueden establecer otros parámetros que a algún@s os pueden ser útiles. Todo es cuestión de experimentar y ver que resultados obtenemos.

Pues bien, eso es todo a grandes rasgos. En el caso de que tengáis dudas puntuales estaremos encantados de intentar daros una solución.

Este manual queda abierto a posibles mejoras y/o actualizaciones futuras.

Gracias, mi amigo Maese, por estas clarísimas instrucciones!