Instalando Python

Python es un lenguaje de programación sumamente versátil. Instalarlo es muy sencillo.

Actualmente existen dos versiones del lenguaje: 2 (2.7) y 3 (3.4). Las dos son muy parecidas pero son fundamentalmente diferentes, por lo que hay que estar seguros que queremos instalar.

En Ubuntu (Linux)

Python generalmente viene pre-instalado y lo único que hay que hacer es echarlo andar, con el comando python

    Python 2.7.4 (default, Sep 26 2013, 03:20:26) [GCC 4.7.3] on linux2
    Type "help", "copyright", "credits" or "license" for more information.

Para echar andar la versión 3 solo basta ejecutar el comando python3


Lee Mas →

Distancias en texto

Para entrar en ambiente comenzamos con Cake y su éxito “The Distance” ;-)

Ya ambientados proseguimos. Para cuantificar que tan cerca o lejos están dos puntos usamos el concepto de distancia. En la vida cotidiana usamos distancias sin detenernos a pensar mucho en ello, por ejemplo:

  • La distancia entre las esquinas en un lado de una cancha de fútbol internacional es entre 100-110 m.
  • La distancia de la UNAM al centro histórico de la Ciudad de México según el Google Maps es de 21.3km.
  • La distancia de un maratón es de 42.195 km.
  • La distancia de Tijuana, una de las ciudades más al norte de México, y Tapachula, otra ciudad muy al sur, es aproximadamente de 3,837km.
  • La distancia de la Tierra a la Luna es de 384,400km.
  • La distancia del Sol a Neptuno es de 4 mil 500 millones de km.

De esta forma podemos intuir que esos dos banderines en las esquinas de una cancha de fútbol están muy cerca en comparación de la UNAM al Centro Histórico, o aún mucho mucho mucho más cerca que lo que está el Sol de Neptuno. Resulta que esa intuición de que dos puntos están cercanos o lejanos los podemos calcular de distintas formas, sobretodo cuando los puntos en cuestión son representados en vectores.


Lee Mas →

MFCCs

Un problema que surge inmediatamente al trabajar con archivos de audio es la gran variabilidad de los valores en el dominio de la amplitud. Por ejemplo el siguiente audio1 :

esta compuesto por una secuencia consecutiva de 984,000 valores/muestras que representan el ‘volumen’ del sonido para diferentes tiempos en la grabación. Tratar de identificar patrones en esta secuencia de valores es una tarea titánica, además que no representa la forma en como el oído humano escucha, que es en el dominio de la frecuencia en lugar en el dominio de la amplitud. Los coeficientes cepstrales en la frecuencia-Mel tratan de resolver este problema (Mel-frequency cepstral coeficients, MFCC). Para lograr esto se intercambian segmentos/ventanas de la señal original con 13 valores/coeficientes. En la práctica una configuración común es reducir 160 muestras de amplitud a 13 valores, que significa que nuestro audio original queda representado por aprox. 79,950 valores.


Lee Mas →

Audiolab: Audio en Python

Aunque hasta ahora me había resistido a trabajar con grabaciones de audio, dado los proyectos en los que estamos trabajando en el Grupo Golem he terminado con la necesidad de procesar una gran cantidad de grabaciones. Ya sea para hacer scripts de evaluación, identificar actividad o para extraer caracteristicas del audio. Como es esperarse en mi caso he estado utilizando python, sobretodo por la necesidad de automatizar las tareas.

Python tiene varias librerías y herramientas para trabajar con audio1 . Uno de los requisitos que rápido surgió fue que la librería debería ser compatible con ScyPy y NumPy, inmediatamente identificamos a Audiolab . Esta es un librería que puede leer de muchos formatos y lo más importante nos entrega una estructura numpy directamente!


Lee Mas →

Hello World

Hello World, from my new blog!!

    print "hello world"

This is an simple example.


Lee Mas →