Tecnología del MP3

Avances tecnológicos. Codificación perceptual. Internet. Bandas. Copia digital. Elaboración. Compresión o Encode. Nombre y tags. Reproductores

  • Enviado por: Pakote
  • Idioma: castellano
  • País: Puerto Rico Puerto Rico
  • 8 páginas
publicidad

Introducción

Trataremos de explicar brevemente que se esconde tras un MP3 y en que se basan sus capacidades. Para saber como funciona no tenemos (ni queremos) porque llegar a las matemáticas profundas del modelo psicoacústico solo nos basta con entender algunos conceptos relativamente sencillos.

Además para disfrutar de un MP3 no es en absoluto necesario saber como funciona

Si no te gusta leer te bastará con saber lo siguiente: Un MP3 es un sistema de compresión de audio con el cual podemos almacenar música con calidad CD en 1/12 del espacio original.

La mayoría de nuestras fuentes están en Internet, procuraremos añadir enlaces con páginas en las que se pueda profundizar sobre estos temas para el que le pueda interesar.

Aquí no vamos a descubrir nada nuevo, que nadie nos

venga luego diciendo que hemos copiado tal o cual

Concepto... así funciona Internet. Todo lo que he

Aprendido ha sido a base de leer, probar y volver a leer.

Si bien es cierto que la mayoría de las páginas

Especializadas están en ingles.

MPEG 1 layer 3

Las siglas MP3 responden a una abreviación de MPEG 1 layer 3. Es un algoritmo de codificación perceptual desarrollado por el consorcio MPEG (Moving Picture Expert Group) junto con el Instituto Tecnológico Fraunhofer que finalmente se ha estandarizado como norma ISO-MPEG Audio Layer 3 (IS 11172-3 y IS 13818-3) y que viene a ser un avance importante sobre los anteriores desarrollos (Layer 1 y Layer 2).

El hecho de que haya sido adoptado como una norma ISO es más importante de lo que cabría suponer. Las normas ISO definen muchos estándares del mercado y tienen peso frente a la industria. Además eso habilita a las personas que quieran desarrollar aplicaciones o cualquier otra cosa dado que tiene a su alcance el funcionamiento del sistema.

Esta tecnología no es nueva, realmente ya lleva desarrollándose más de 10 años, lo que ocurre es que ahora es el momento en el que la velocidad de proceso de los ordenadores la han hecho asequible para el usuario medio.

Codificación Perceptual y Oído Humano

El sistema de codificación perceptual es un sistema de compresión con pérdida, esto quiere decir que el sonido original y el comprimido no son exactamente iguales. Estas pérdidas responden al funcionamiento del oído humano, así aunque los sonidos no son iguales si los percibimos como si lo fuesen.

Se suele comparar el sistema de compresión perceptual del sonido con los sistemas de compresión gráficos JPEG. Estos se diferencian de otros como el BMP o TIFF porque no mantiene la imagen inalterada sino que realizan "aproximaciones" al original en pos de una mayor compresión.

El rango de frecuencias que percibe el oído humano esta aproximadamente entre los 20Hz y los 20kHz siendo más sensible entre los 2Hz y 4Hz.

Además cuando tenemos una señal de un volumen alto en una frecuencia y otra de un volumen más bajo en una frecuencia cercana esta queda "tapada" por la anterior. Esto es lo que se llama efecto enmascar

Codificación de

Sub Bandas

Para aprovechar estas características se utiliza un sistema denominado Codificación de Sub Bandas.

En este proceso la señal original se descompone en sub bandas mediante un banco de filtros o algún método parecido. Estas sub bandas son comparadas con el original mediante el modelo psicoacústico que determina que bandas son importantes cuales no y cuales pueden ser eliminadas.

Dependiendo del bitrate al que vayamos a producir la codificación este proceso eliminara más o menos datos siguiendo el modelo psicoacústico hasta lograr la compresión necesaria.

Luego se cuantifican y codifican las sub bandas restantes y el resultado es finalmente comprimido mediante un algoritmo standard Huffman o LZWamiento.

Así pues de lo que se trata es de aprovechar los "defectos" del oído humano para desechar todo aquello que realmente no vamos a oír. Por supuesto cada uno tiene su oído y por eso para probar el éxito de estos sistemas se utilizan métodos estadísticos.

Dentro del formato MP3 podemos comprimir con distinto ancho de banda, modo y bitrate obteniendo distintas calidades según para que vayamos a utilizar ese sonido. 
 

calidad del sonido

ancho de banda

modo

bitrate

ratio de compresión

sonido telefónico

2.5 Khz.

mono

8 kbps

96:1

mejor que onda corta

4.5 Khz.

mono

16 kbps

48:1

mejor que radio AM

7.5 Khz.

mono

32 kbps

24:1

similar a radio FM

11 Khz.

estéreo

56...64 kbps

26...24:1

cercano al CD

15 Khz.

estéreo

96 kbps

16:1

CD

>15 Khz.

estéreo

112..128kbps

14..12:1

En un disco compacto tenemos una onda de 44.1kHz 16bit estéreo eso significa aproximadamente 1400Kbps (44100 x 16 x 2 bits por segundo). Codificándolo por ejemplo a un MP3 de 128kbps obtenemos una reducción en torno al 1/12 del espacio inicial.

También se puede optar por compresiones a mayor bitrate llegando a 192 o incluso 256kbps. Pero el más popular es el de 128kbps con el que se consigue una calidad excelente con una compresión sobresaliente.

Como hacer un mp3

Para hacer BIEN un MP3 hay que tener en cuenta una serie de conceptos y precauciones que la mayoría de las veces se aprenden a base de experiencia y de "prueba y error". 

Aprovechando nuestras pruebas y errores vamos a explicar los pasos que hay que seguir, que programas podéis usar (con sus ventajas y desventajas) y que opciones consideramos las más adecuadas. 

Básicamente podemos dividir el proceso en tres partes: Copia digital (rip), Codificación (compresión) y adición de ID3 tags (y nombres de archivo). 

Ya hemos dicho que la gramática aquí importa poco, usaremos términos como rip, encodeado, etc... que evidentemente no se encuentran en ningún diccionario pero que son usados comúnmente. Eso si, procuraremos definir los términos antes de usarlos.

Copia digital o rip

Esta es sin duda la parte más complicada y la que nos traerá más quebraderos de cabeza. 

 

Conseguir hacer la copia digital a veces parece una cuestión mística. No hay que desanimarse si es necesario probad con todos los programas que puedan hacerlo, donde algunos fracasan otros milagrosamente funcionan perfectamente. Incluso a veces depende del CD-Audio, en fin... suerte!.

Con esta operación pretendemos copiar digitalmente la pista del CD-Audio a nuestro disco en formato WAV a 44.1Khz 16bit estéreo. Esto representará aproximadamente unos 10 megas por minuto, luego hay que contar con ese espacio reservado. 

Para conseguirlo es NECESARIO que nuestro lector CD-Rom tenga un modo de lectura denominado RAW (crudo) y, lamento decirlo, hay lectores que sencillamente no lo tienen, así que les será imposible realizar una copia digital. 

Como puedo saber si mi lector tiene o no ese modo de lectura?. Básicamente de dos maneras: Mirando en unas listas de compatibilidad o con algún programa que nos informe de las características de nuestro lector como el ATAINF. Los lectores SCSI no tienen problemas son los IDE los que muchas veces carecen de este modo de lectura.

La opción que les queda a los desafortunados que posean un lector de este tipo es lo que se denomina "sampleado" . Cosa que no recomendamos por la gran perdida de calidad que representa. 

Se entiende por "samplear" el grabar a través de la tarjeta de sonido la pista del CD-Audio. Para que os hagáis una idea es como si grabaras la pista desde tu equipo de música a través de la entrada de micrófono de la tarjeta de sonido. Lo malo es que aquí el trabajo lo realiza el DAC (Conversor Analógico Digital) de la tarjeta de sonido y por muy buena que esta sea siempre dará una calidad muy inferior a un rip.

Otro problema añadido es la manera en la que se almacenan los datos en un CD-Audio que es muy diferente a la de un CD-Rom o a la de un disco duro. Como los CD-Audio están pensados para una reproducción secuencial continua los datos están almacenados sin ningún tipo de "índice" (sectores, clusters, etc...). Así, si el láser del lector se detiene en una determinada posición (para transferir los datos o lo que sea) nadie nos asegura que al continuar parta exactamente de la misma posición. 

Debido a esto aparecen los temidos "pops" o chasquidos metálicos que indican un rip defectuoso. 

Aquí entran en juego los distintos modos de lectura que puedes encontrar en la mayoría de los rippers: 

 

  • Normal: Lectura y escritura alternativamente.

  • Burst o Power Mode: Lectura y escritura simultáneamente. Es el más rápido.

  • Sincronización de Sectores, Jitter o Overlaping: Las lecturas van solapadas de manera que se asegura que esta es correcta. Es el más lento.

El uso de un modo u otro depende de cada caso y lo más recomendable es que cada uno use el que le vaya bien. Aun asi, no me cansare de recomendar el método de sincronización de sectores. No hay nada peor que una vez terminado todo el trabajo encontrarte con que hay varias canciones que tienen los malditos chispazos. Aunque es le método más lento siempre será más rápido que tener que repasar canción por canción.

Ya existen multitud de programas que permiten hacer una copia digital cómodamente y que traen opciones muy interesantes. Vamos a ver los más conocidos con sus características: 

 

  • CD-Copy (W95/freeware): Magnifico sobretodo si posees SCSI. En mis pruebas siempre ha sido el más rápido en todos los modos de lectura. Además trae la opción de "bajarte" los nombres de las canciones a través de un servidor CDDB e incluso las letras de estas. También permite normalizar el WAV una vez extraído.

  • Windac (W95/shareware): Probablemente el más usado, funciona tanto con IDE como con SCSI y entre sus cualidades destaca la posibilidad de automatizarse mediante scripts. También se puede extraer directamente la pista en formato MP3 (WAV-Layer3)

  • Audio Grabber (W95/Shareware): Destaca por su opciones. Poco a poco se va haciendo un sitio entre los programas de culto. Permite normalizar el WAV.

CDDA y CDDA32 (DOS/W95/shareware): Clásico entre los clásicos sigue siendo una opción a considerar si tienes problemas con alguno de los anteriores. Funciona con línea de comandos.

Estos programas los encontraras junto con enlaces a sus homepages en la sección PROGRAMAS.

Una última cuestión sería la del volumen del CD. Seguro que habréis comprobado que en distintos CD-Audio el volumen general de las canciones cambia, esto ocurre sobretodo en los más antiguos. No es un problema muy serio, pero si queréis que se mantenga el volumen general de todas las canciones habría que "normalizar" el WAV una vez extraído. Algunos rippers ya traen esta opción pero también existen programas independientes para hacerlo. 

Esta operación no afecta a la calidad del WAV, aunque quizás no sea tan necesaria y solamente habría que usarla en casos extremos. Si que es muy recomendable cuando lo que pretendemos hacer es un CD-Audio y vamos a tomar pistas de distintos cds.

Codificación, Compresión o Encode

Esta parte es mas sencilla y casi exclusivamente hay que elegir un programa y un bitrate. Aunque nos interesaremos por algunos conceptos añadidos. 

El bitrate (los kbits por segundo) a utilizar estará entre los 112kbps y los 256kbps y normalmente se utiliza 128kbps debido a que es el que ofrece mejor relación calidad/compresión. Con esa cifra llegaremos a reducir en 1/12 el tamaño de la pista. 

Sabemos que hay gente que se esta empezando a trabajar a 256kbps, con este bitrate solo conseguiremos una reducción aproximada de 1/6. La ventaja es que así es IMPOSIBLE diferenciar el original del comprimido. Tal vez la llegada del DVD quite importancia al tamaño de los archivos pero hay que tener en cuenta que también viene empujando otras tecnologías como el ACC y el MP4 que dejarán "antiguo" al MP3.

También tenemos que decidir si queremos que el compresor funcione en modo HQ (high quality o slow) o en modo LQ (low quality o quick). La diferencia entre ambos modos esta en las iteraciones que el programa realiza para optimizar la calidad de la compresión, en modo HQ el programa no parara hasta dar con la más óptima. Y por supuesto en HQ tardaremos unas tres veces más. 

Y con esto llega la famosa pregunta: Realmente se nota la diferencia?. A decir verdad yo casi ni la noto entre 112kbps y 128kbps así que diferenciar entre el modo HQ o LQ me parece imposible. Pero lo que esta muy claro es que si lo hacemos en HQ obtendremos la MEJOR CALIDAD. Yo lo recomiendo. 

Si tomamos como referencia lo que se mueve dentro de internet hay una tendencia generalizada a EXIGIR en los ftps que la compresión se haya realizado en HQ.

Otra cuestión es el formato en el que obtendremos el MP3. Hay compresores que permiten como formato de salida el WAV (WAV layer 3). Evidentemente se trata realmente de un MP3 con la extensión WAV y con la cabecera de este. Lo único útil es que ese WAV lo podremos reproducir con cualquier aplicación (reproductor multimedia, etc...), pero para eso necesitaremos tener instalado el CODEC que se encarga de que W95 sepa "traducirlo". 

Esto no es muy recomendable, es como si al aparecer el JPEG a alguien se le hubiese ocurrido ponerle la extensión BMP y hacer que Windows internamente fuese capaz de reconocerlo. Solo como parche temporal podría funcionar, sobretodo para aquellas aplicaciones que no entendiesen el nuevo formato. 

Un WAV y un MP3 son dos cosas MUY DISTINTAS conviene no mezclarlas. Lo que realmente queremos es que tanto Windows como las aplicaciones multimedia sea capaces de reconocer un MP3... y parece ser que Bill nos lo ha concedido con su Windows98. 

Para transformar un WAV-Layer3 a MP3 no bastara con renombrarlo, deberemos quitar la cabecera de este. Hay aplicaciones como el STRIPHDR que acompaña al Windac que lo realizan satisfactoriamente.

La lista de posibles programas para comprimir podría ser muy extensa, nos limitaremos a nombrar los que consideramos mejores dejando a un lado aquellos que creamos que no nos van a ofrecer la suficiente calidad (Xing, MPlifier, etc...): 

 

  • Producer 2.01 (W95/Comercial): El mejor sin duda por su relación velocidad/calidad. Esta desarrollado por el Instituto Tecnológico Franhofer y comercializado por Opticon. Y eso supone que trae los últimos avances. Esta versión además permite proceso por lotes y llegar hasta los 256kbps.

  • MP3Compressor (W95): Es simplemente un shell (ilegal) de la anterior versión del Producer, pero sigue siendo muy usado debido a su comodidad.

  • MPEG Encoder 0.07 (W95/freeware): Siguiendo la norma ISO consigue una calidad superior al resto pero a costa de un tiempo de compresión elevadisímo. Puede llegar a los 320kbps.

  • L3Enc (DOS/Shareware): Todo un clásico. Hay que usarlo con línea de comandos y es bastante más lento que el resto.

Una vez que el compresor ha hecho su trabajo lo primero que debemos hacer es liberar el espacio ocupado por el archivo WAV, algunos de ellos permiten borrarlo automáticamente. 
 

ID3 Tags y Nombres de Archivo

Estupendo!, ya tenemos nuestro propio módulo recién hecho. El siguiente paso será cambiarle el nombre y añadir la información ID3

El nombre del archivo normalmente habrá salido del tipo Track01.MP3, por supuesto para identificarlo tendremos que cambiárselo. Hay varias opciones dependiendo de que vayamos a hacer con él. Lo más habitual será poner uno del tipo "Título (Autor).mp3". 

Más adelante en Como hacer un CD discutiremos sobre este asunto que, aunque pueda parecer trivial, también merece nuestra atención para que el resultado final sea el mejor.

La información ID3 (ID3tag) son un conjunto de campos que se añaden al final del fichero en los que se identifica el nombre de la canción, autor, año, estilo musical, etc... Actualmente, en su versión 1.1, esta muy limitado sobretodo por el tamaño de los campos. 

Ya existe y es funcional el ID3tag 2. Con esta nueva norma se ha mejorado mucho sobre la anterior permitiendo añadir de todo trás una canción... casi sin limitación.

No es estrictamente necesario añadir esa información, pero si muy recomendable ya que la mayoría de los reproductores la utilizan. Hay programas que nos facilitaran esa tarea, aunque muchas veces los propios reproductores permiten añadirla.

Mas reproductores:

No solo la cuestion de nombrar a los reproductores de mp3, nos referimos al uso de estos comop simples “walkmans electrónicos”. Los mp3 salieron a raiz de los ordenadores y por ellos llegaron al los reproductores portátiles, pero en los ordenadores hay cantidad de reproductores de pequeño tamaño ( en bits), y de multiples posibilidades, les adjuntamos una lista de ellos y un pequeño referente a sus características:

IV