Instalando Python

Python es un lenguaje de programación sumamente versátil. Instalarlo es muy sencillo.

Actualmente existen dos versiones del lenguaje: 2 (2.7) y 3 (3.4). Las dos son muy parecidas pero son fundamentalmente diferentes, por lo que hay que estar seguros que queremos instalar.

En Ubuntu (Linux)

Python generalmente viene pre-instalado y lo único que hay que hacer es echarlo andar, con el comando python

    Python 2.7.4 (default, Sep 26 2013, 03:20:26) [GCC 4.7.3] on linux2
    Type "help", "copyright", "credits" or "license" for more information.

Para echar andar la versión 3 solo basta ejecutar el comando python3


Lee Mas →

MFCCs

Un problema que surge inmediatamente al trabajar con archivos de audio es la gran variabilidad de los valores en el dominio de la amplitud. Por ejemplo el siguiente audio1 :

esta compuesto por una secuencia consecutiva de 984,000 valores/muestras que representan el ‘volumen’ del sonido para diferentes tiempos en la grabación. Tratar de identificar patrones en esta secuencia de valores es una tarea titánica, además que no representa la forma en como el oído humano escucha, que es en el dominio de la frecuencia en lugar en el dominio de la amplitud. Los coeficientes cepstrales en la frecuencia-Mel tratan de resolver este problema (Mel-frequency cepstral coeficients, MFCC). Para lograr esto se intercambian segmentos/ventanas de la señal original con 13 valores/coeficientes. En la práctica una configuración común es reducir 160 muestras de amplitud a 13 valores, que significa que nuestro audio original queda representado por aprox. 79,950 valores.


Lee Mas →

Audiolab: Audio en Python

Aunque hasta ahora me había resistido a trabajar con grabaciones de audio, dado los proyectos en los que estamos trabajando en el Grupo Golem he terminado con la necesidad de procesar una gran cantidad de grabaciones. Ya sea para hacer scripts de evaluación, identificar actividad o para extraer caracteristicas del audio. Como es esperarse en mi caso he estado utilizando python, sobretodo por la necesidad de automatizar las tareas.

Python tiene varias librerías y herramientas para trabajar con audio1 . Uno de los requisitos que rápido surgió fue que la librería debería ser compatible con ScyPy y NumPy, inmediatamente identificamos a Audiolab . Esta es un librería que puede leer de muchos formatos y lo más importante nos entrega una estructura numpy directamente!


Lee Mas →