Aprobado el 30 de septiembre de 1999, tras un proceso de selección de cuatro años que implicó pruebas extensivas, ITU-T Recommendation G.722.1 es un algoritmo de compresión de audio de banda ancha que se ha convertido en un estándar internacional. Se basa en la tecnología de compresión Siren de tercera generación de Polycom y se deriva del algoritmo confirmado de Polycom PT716plus. Polycom desarrolló esta tecnología para cumplir con las exigentes necesidades de audio de la comunidad multimedia. Proporciona audio de alta calidad a tasas de bits reducidas y una escasa complejidad. Funciona para todas las clases de señales de audio, incluido voz, música o canciones, por ejemplo.
Siren at 16 kbps es una extensión del estándar G.722.1 que funciona a 16 kbps.
Se puede comprar una copia electrónica de G.722.1 directamente en la librería en línea de ITU en http://www.itu.int/rec/T-REC-G.722.1/en.
El uso de ITU-T Recommendation G.722.1 está sujeto a la ejecución de un contrato de licencia con Polycom.
ITU-T Recommendation G.722.1 consiste en los siguientes elementos:
En primer lugar, compre una copia de G.722.1 en ITU-T. Recommendation G.722.1 contiene toda la información necesaria para implementar el algoritmo. Las señales de salida de cualquier implementación de G.722.1 en cualquier hardware debe coincidir exactamente con la del código C de referencia al procesar las mismas señales de entrada. Los vectores de prueba ofrecidos en el estándar están diseñados con el objeto de probar la corrección de una implementación.
Hay vectores de prueba de entrada y de salida para poder probar las implementación del codificador y del descodificador. Los vectores de prueba fueron creados para poner en práctica la mayor parte posible del algoritmo. Por lo tanto, cualquier implementación del algoritmo que reproduzca de forma correcta los vectores de prueba de salida se considera que reproduce adecuadamente el rendimiento del código C de referencia.
SirenZip es un programa que se ejecuta en Microsoft Windows 95 o versiones superiores del sistema operativo Microsoft Windows. Puede ejecutar G.722.1 a una de estas tres tasas de bits seleccionables (la extensión de 16.000 kbps, 24.000 kbps o 32 kbps). Descargar la copia de demostración gratuita de SirenZip (tamaño de la descarga 208 KB).
Cómo utilizar SirenZip
G.722.1 se especifica como algoritmo de punto fijo en el estándar ITU-T. En el futuro ITU-T estandarizará una versión de punto flotante y ésta interoperará con el estándar de punto fijo. (En Polycom existe una versión de punto flotante interoperable). Los números de complejidad de MIPS, a continuación, son ejemplos de implementaciones no optimizadas en tres tipos distintos de DSP. Tenga en cuenta que dos de los DSP mostrados son unidades de punto flotante.
Parámetros generales de G.722.1
Parámetro |
Valor |
|---|---|
Índice de audio de muestra |
16 kHz |
Tasa de bits (la tasa puede cambiar en cualquier límite del marco) |
16, 24, 32 kbps (16 kbps es una extensión de Polycom del estándar) |
Ancho de banda de audio |
50 Hz - 7 kHz. |
Tamaño del marco de audio |
20 ms |
Retardo del algoritmo (consulte la Nota 1) |
40 ms |
RAM (punto fijo) |
< 7,5 k bytes |
Espacio de tabla ROM (punto fijo) |
~ 20 k bytes |
Índice de MIPS entre el codificador y el decodificador |
aproximadamente 1 a 1 |
Cifras de ejemplo de MIPS para procesadores distintos
Procesador |
MIPS (codificar + descodificar) |
|---|---|
TI TMS320C50 |
13,9 (= 6,95 + 6,95) (código sin optimizar para el punto fijo G.722.1) |
TriMedia TM 1300 |
4 (= 2+2) (implementación de punto flotante) |
TI TMS320C31 |
9,25 (= 4,51+4,51) (implementación de punto flotante) |
La telefonía tradicional se denominaba de "banda estrecha" porque pasaba las señales de audio sólo en el rango de 300-3500 Hz, un ancho de banda de sólo 3,2 kHz. Este ancho de banda estrecho confería a las llamadas telefónicas su característico sonido "a hojalata", en comparación con el sonido de banda ancha enriquecido de los sistemas de alta fidelidad. G.722.1 proporciona 7 kHz de ancho de banda de audio (50-7000 Hz), una enorme mejora mucho más cercana a la calidad de la radio FM que a la calidad de la telefonía tradicional. El audio de banda ancha es el preferido por unanimidad en comparación con la calidad de audio de banda estrecha.
Por ejemplo, en una conversación telefónica, ¿ha confundido alguna vez las palabras en inglés "see" y "fee"? Los sonidos de la "f" y la "s" se confunden fácilmente porque su inteligibilidad se pierde con la traslación inadecuada de la altas frecuencias. Dicha confusión nunca ocurre con la codificación de banda ancha porque todas las frecuencias necesarias para la voz están ahora completamente representadas.
Toda la experiencia de audio cuando se usa la banda ancha es mucho más natural y relajante para los oídos.
G.722.1 es también capaz de ofrecer una reproducción excelente de música en tasas de bits extremadamente bajas. Suena mucho mejor que la radio AM.
Ejemplos de las aplicaciones G.722.1 y Siren at 16 kbps
La telefonía IP, las videoconferencias y las audioconferencias tienen todas necesidades de audio muy similares: alta calidad de audio con latencia y complejidad baja. Además, es necesaria la capacidad de cambiar la tasa de bits con el objeto de acomodar los requisitos del canal. G.722.1 permite a la tasa cambiar entre las tasas de 24, 32 y la extensión de Siren de 16 kbps en un límite de marco de 20 ms.
En las aplicaciones de streaming, la escasa complejidad y coste para el cliente es un aspecto a tener muy en cuenta. G.722.1 cumple con este requisito sin sacrificar la calidad. Las tasas de 16, 24 y 32 kbps permiten a los clientes experimentar audio de alta calidad incluso en conexiones de módem V.90 (56 kbps).
La mensajería es una aplicación de almacenamiento y reenvío. La baja complejidad implica una implementación de hardware de coste reducido. La compresión de audio de alta calidad garantiza una excelente traslación de la voz del remitente o clip de música.
Descargue estos archivos .WAV para comprobar la calidad del G.722.1 por usted mismo.
(Tenga en cuenta que estos archivos de muestra son archivos .WAV sin comprimir y reproducibles en cualquier ordenador. No necesita el códec G.722.1 para reproducirlos, pero como consecuencia tardarán un poco en descargarse).
Archivos de voz |
Descargar |
|---|---|
Ancho de banda de audio de 3,5 kHz, calidad para larga distancia POTS |
|
Ancho de banda de audio de 7 kHz, comprimido a 16 kbps con Siren |
|
Ancho de banda de audio de 7 kHz, comprimido a 24 kbps con G.722.1 |
|
Ancho de banda de audio de 7 kHz, comprimido a 32 kbps con G.722.1 |
|
Archivos de música |
Descargar |
|---|---|
Ancho de banda de audio de 3,5 kHz, calidad para larga distancia POTS |
|
Ancho de banda de audio de 7 kHz, comprimido a 16 kbps con Siren |
|
Ancho de banda de audio de 7 kHz, comprimido a 24 kbps con G.722.1 |
|
Ancho de banda de audio de 7 kHz, comprimido a 32 kbps con G.722.1 |
|
Para los usuarios que cuentan con un acceso a Internet de baja velocidad, Siren funciona muy bien con tasas de bits bajas (por ejemplo, si el acceso a Internet se lleva a cabo a través de módems de marcado de 28,8 a 56 kbps). Escuche ejemplos de comparación:
Siren a un ancho de banda de audio de 14 kHz a 22 kbps en comparación con Windows Media Player (sólo es compatible con una tasa de muestreo de 44 kHz a 22 kbps)*.
Tasa de bits |
Descargar |
Descargar |
|---|---|---|
22 kbps |
*El ancho de banda de Windows Media Player es el que permita la tasa de bits, la tasa alta de muestreo de 44 kHz sólo permite la posibilidad de un ancho de banda de audio de 20 kHz.
Siren a un ancho de banda de audio de 14 kHz a 24 kbps en comparación con MP3 (tiene un máximo de ancho de banda de audio de 11 kHz a 24 kbps)
Tasa de bits |
Descargar |
Descargar |
|---|---|---|
24 kbps |
Con el fin de que los distintos equipos de los proveedores puedan interoperar mediante G.722.1, es necesario estandarizar el intercambio de capacidades y la selección de modos para G.722.1. Estos aspectos técnicos para los sistemas H.320, H.323 y H.324 se han definido gracias al Grupo de estudio 16 de ITU-T.
Los titulares de licencia recibirán toda la información necesaria para negociar el uso de G.722.1 por los estándares ITU-T, así como el intercambio de capacidades y los procedimientos de negociación para el uso interoperable entre los proveedores de la extensión de 16 kbps que Polycom ha realizado del estándar.
ITU son las siglas de International Telecommunications Union, con sede en Ginebra, Suiza. ITU es la organización del tratado internacional más antiguo del mundo (fundado en 1865), ahora forma parte de las Naciones Unidas y es responsable de la estandarización de la tecnología para las telecomunicaciones internacionales, incluido el teléfono, la radio y las comunicaciones de datos. Para obtener más información, visite el sitio web de ITU en http://www.itu.int.
Para obtener información técnica adicional envíe un email a: SirenInfo@polycom.com
El programa de licencias y el contrato de licencia de muestra están disponible en: Programa de tarifas de licencia y condiciones de la licencia