Skip to content

JJ/perl-moderno

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

27 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Un tutorial más de Perl

Objetivos

  1. Dar a conocer el lenguaje a quien no lo haya usado antes.
  2. Comprender los principios en los que se basa.
  3. Una introducción a su sintaxis.
  4. Trabajar con módulos (librerías) de forma fácil.

Perl moderno

Nuestro primer programa en Perl es el siguiente:

#!/usr/bin/env perl

use Modern::Perl '2015';
use autodie;

say "Hola k ase";

Se ve desde el principio que es moderno: pone Modern::Perl. Así que vayamos por partes a ver qué hace de este Perl moderno (y de otro antiguo, o viceversa).

Primero: ¿por qué Perl?

Hay decenas de lenguajes hoy en día.

Menuda tontería. Siempre los ha habido.

Vale, ahora hay más. Ayer mismo vi uno nuevo del que no había oído hablar nunca, Nim, un lenguaje estupendo, compilado, rápido y nuevo. Lo nuevo siempre es mejor y Perl nació en el año 1987, más o menos cuando todavía se daba esgrima en el instituto y el WhatsApp se hacía a base de pulsaciones de telégrafo, ¿no?. Mi historia personal con el Perl empieza en el año 93, más o menos, cuando lo aprendí... no recuerdo por qué. Porque me gusta aprender cosas. Pero también porque era un lenguaje interpretado que permite hacer cosas rápidamente. Antes, con el Pascal o el C, era editar el programa, compilar, vaya, aquí hay un error, compilamos de nuevo, ejecutamos, vaya, otro error, vamos a depurar y así sucesivamente... Perl es interpretado. Los programas en Perl son scripts o guiones que se pueden ejecutar directamente en cualquier sitio que haya un intérprete de Perl. El que sea interpretado explica la primera línea del programa anterior:

#!/usr/bin/env perl

que es la clásica de los lenguajes interpretados (comenzando por Shebang) y que carga el primer intérprete de Perl en el camino de ejecución y, a continuación, usando ese intérprete, lee el resto del fichero y lo ejecuta usándolo. El poner esto en vez de directamente el camino a un intérprete nos permite que se pueda ejecutar en cualquier ordenador, independientemente de dónde se instale Perl y también el uso de intérpretes gestionados por el usuario.

Que es, de hecho, la principal razón para usar este tipo de invocación al binario de Perl.

Y hay intérpretes de Perl en todos los sistemas operativos y en cosas que no lo son, como Windows. En la mayoría de las distribuciones de Linux está ya instalado, porque parte de las herramientas del sistema están escritas usándolo. El paquete perl-base de Ubuntu se lista como essential, así que en estas y distribuciones similares no tienes que preocuparte por su presencia. Escribe

which perl

y te dirá el camino en el que está instalado o

perl --version

para la versión que tienes, algo así:

This is perl 5, version 20, subversion 0 (v5.20.0) built for x86_64-linux

Copyright 1987-2014, Larry Wall

Perl may be copied only under the terms of either the Artistic License or the
GNU General Public License, which may be found in the Perl 5 source kit.

Complete documentation for Perl, including FAQ lists, should be found on
this system using "man perl" or "perldoc perl".  If you have access to the
Internet, point your browser at http://www.perl.org/, the Perl Home Page.

El hecho de que esté instalado en todos los Linux (y en el Mac, que por debajo es lo mismo) lo hace útil para llevar a cabo cualquier labor relacionada con el sistema, como procesar un fichero de registro, monitorizar un proceso a ver qué está haciendo o simplemente realizar copias de seguridad periódicas. Casi ningún lenguaje (salvo el shell, pero no es un lenguaje) está disponible de esa forma en todos los sistemas operativos.

Pero es que, además, su madurez, su uso por grandes empresas como Booking o Amazon y la popularidad en ciertos campos como la Bioinformática lo hace también ideal para crear sistemas basados en web, incluyendo servicios web, procesamiento de datos masivos usando scraping (o extracción de datos semiestructurados) y, en general, cualquier cosa, hasta algoritmos evolutivos o cualquier otro tema de investigación.

El hecho de que sea interpretado hace que su velocidad de ejecución no sea óptima. Pero lo compensa con creces con la velocidad de creación de nuevas aplicaciones.

Si Perl no está instalado

O incluso si está instalado, es mejor usar Perlbrew para gestionar diferentes copias de intérprete desde el propio usuario. Así puedes trabajar con tus propias librerías (lo que no siempre es posible, si dependen de librerías del sistema) y cambiar de versión cuando lo desees. Para instalarlo:

curl -L http://install.perlbrew.pl | bash

curl debería estar instalado en el sistema, también es una utilidad básica. Si no, se puede usar wget o descargarse a mano desde el navegador y posteriormente ejecutarlo con bash nombre-de-lo-descargado.

perlbrew gestiona diferentes versiones de Perl. Las versiones pares son versiones estables, mientras que las impares son de desarrollo. Las versiones pares, tras una época un tanto inestable, suelen salir todos los meses de mayo; la próxima es la 5.22. Mientras tanto, algunas características de esa versión se prueban en la inmediato anterior, que siendo impar es inestable, la 5.21. Podemos instalarnos las que queramos, por ejemplo la última estable, con

perlbrew install perl-5.20.2

tras listar las disponibles con

perlbrew available  
  
  perl-5.20.2
i perl-5.18.4
  perl-5.16.3
  perl-5.14.4
  perl-5.12.5
  perl-5.10.1
  perl-5.8.9
  perl-5.6.2
  perl5.005_04
  perl5.004_05
  perl5.003_07

i indica la que está instalada en un momento determinado. Tras la instalación, que tarda un rato porque hay que descargar, compilar y probarla, se usa con

perlbrew use perl-5.20.2

La orden anterior no lista las versiones de desarrollo (las impares). Para verlas hay que usar

 perlbrew available --all  
   
  perl-5.6.0
  perl-5.6.1-TRIAL1
  perl-5.6.1-TRIAL2
  perl-5.6.1-TRIAL3
...
  perl-5.20.1
  perl-5.20.2-RC1
  perl-5.20.2
  perl-5.21.0
  perl-5.21.1
  perl-5.21.2
  perl-5.21.4
i perl-5.21.5
  perl-5.21.6
  perl-5.21.7

Si se quieren ir probando las nuevas características conviene tener siempre instalada alguna de las versiones nuevas, como la 5.21.5 que aparece marcada como instada en mi sistema. También por cuestiones de velocidad: las versiones nuevas (aunque no las de desarrollo) suelen ser más rápidas.

Las versiones instaladas, o la elegida, aparece en el camino de ejecución y se ejecuta directamente si los scripts llevan la línea /usr/bin/env perl al principio. Pero también podemos, desde perlbrew ejecutar directamente un programa

perlbrew exec perl -e 'print "Soy el proceso $$\n";'
perl-5.18.4
==========
Soy el proceso 30893


perl-5.20.0
==========
Soy el proceso 30894


perl-5.21.5
==========
Soy el proceso 30895

En las tres versiones que hay instaladas en mi sistema, se ejecuta el programa mostrando el número de proceso, que se puede ver en Perl desde la variable $$. Es una de las variables especiales de Perl, pero tiene la sintaxis de otras variables: comienza con un $. El ejecutar un programa desde todas las versiones puede servir para probar su compatibilidad con las mismas o su velocidad.

También se muestra cómo se puede ejecutar algo directamente desde la línea de órdenes, un one-liner de los que han hecho famoso a Perl. El argumento o switch -e ejecuta como un programa en Perl lo que se encuentra justamente detrás. Por las buenas.

Tampoco hacen falta paréntesis: Perl es expresivo y está hecho para el programador perezoso. Si hay una cadena (delimitada por comillas) detrás de una orden, pues será el argumento de esa orden. No hay que darle más vueltas.

Puede haber cierta ambigüedad. La coma es a la vez un separador de cadenas y un operador que evalúa su lado izquierdo, tira el valor resultante, evalúa el derecho e imprime el resultado. Por lo que

perl -e "print 2*2,print 3*4;"

evaluará el lado derecho, lo que tendrá como valor resultante un 4, luego evaluará el izquierdo y ejecutará print y finalmente devolverá el resultado, resultando en, obviamente, 1241. Vale, yo tampoco lo entiendo, pero lo anterior te muestra cómo la sintaxis de Perl es suficientemente flexible para que hagas lo que quieras incluso aunque no sepas lo que haces.

La documentación de Perl está bien estructurada y todo lo anterior puedes leerlo en diferentes apartados de la misma. Se accede a la documentación con perldoc, que puede, o no, estar instalado en el sistema. En algunas versiones de Ubuntu y Debian está, pero en otras no. Así que, ante la duda, se instala

sudo apt-get install perl-doc

aunque si tienes instalado perlbrew por el mismo precio tienes también perldoc y puedes consultar

  • perldoc perlvar para ver todas las variables que tiene Perl definidas, incluyendo $$.

  • perldoc perlrun sobre cómo llamar a Perl, incluyendo la opción -e que ejecuta un programa sobre la marcha.

  • perldoc -f print que te consulta una orden determinada, la única (o casi) que hemos visto hasta el momento, print.

  • perldoc perlop para saber todos los operadores que hay en Perl, incluyendo la coma, que es un operador de pleno derecho.

  • perldoc perl que, aparte de una introducción general, incluye una lista de toda la documentación que se instala y de cómo acceder al resto de las opciones.

Cuando todo falle, mira la documentación. Con Perl al menos lo tienes todo a mano.

También las bibliotecas o módulos.

Perl no fue el primero en crear un sistema universal de acceso e instalación de módulos (bibliotecas), porque fue el CTAN de LaTeX, pero sí el primero en hacerlo en un lenguaje de programación. Todos los demás lenguajes lo hicieron después y algunos (como Java) todavía están por hacerlo. CPAN, o Comprehensive Perl Archive Network

Obsérvese el juego de palabras con CTAN, en el que está inspirado.

es el lugar donde se pueden buscar la mayoría de los módulos de Perl y se pueden descargar, criticar, informar de errores o incluso hacer reseñas. Sin embargo, la verdadera utilidad de CPAN está en el cliente cpan, un programa que se instala con Perl y que descarga e instala los módulos junto con sus dependencias. De hecho, es más usado hoy en día cpanminus, que también actúa como cliente de CPAN, pero que tiene menos opciones de instalación; de hecho ninguna. Como ya estamos trabajando con perlbrew, lo instalamos con

 perlbrew install-cpanm

y, para ejecutarlo para instalar la biblioteca que usamos en nuestro "Hola mundo", Modern::Perl, la usamos así:

cpanm Modern::Perl      
--> Working on Modern::Perl
Fetching http://www.cpan.org/authors/id/C/CH/CHROMATIC/Modern-Perl-1.20150127.tar.gz ... OK
==> Found dependencies: Module::Build
...

Que, como se ve, instala el módulo Modern::Perl y todas las dependencias (la primera, Module::Build, se ve ya en esta captura). Con esto ya podemos ejecutar nuestro programa:

perl code/holakase.pl 
Hola k ase

Pero volvamos a mirarlo:

use Modern::Perl '2014';
use autodie;

say "Hola k ase";

El módulo Modern::Perl tiene :: en medio para separar sus dos partes; este símbolo se usa para crear espacios de nombres, es decir, formas de separar identificadores con el mismo nombre para que puedan usarse sin ningún problema. Perl se usa también en el módulo Acme::Very::Modern::Perl que, estando en el espacio de nombres Acme, sabemos que no tiene que tomarse muy en serio. También uni::perl. Cada uno usa un espacio de nombres diferente (o muchos); los espacios de nombres equivalen a subdirectorios en el directorio donde se instalan todos los módulos de Perl, así que Modern::Perl estaría en lib/Modern/Perl.pm, .pm es la extensión habitual de los módulos en Perl.

En Perl funciona la importación de módulos exactamente igual que en cualquier otro lenguaje, sólo que de forma totalmente diferente. Como en cualquier otro lenguaje, se importan identificadores y funciones que podemos usar directamente en nuestro programa. Pero también se pueden pasar parámetros a esa importación que cambian como se comporta la misma: pueden importarse algunas cosas y no otras, o, como en este caso, importarse cosas diferentes. En concreto, '2014' hace que Perl se comporte como las versiones que hay salido en 2014, es decir, la 5.20 (y posteriores). Los módulos en Perl son algo más que variables y funciones: son pragmas o interruptores que regulan el comportamiento del programa en tiempo de compilación. Precisamente la línea siguiente use autodie es una pragma, que indica que el programa muera automáticamente (es decir, use la orden die) si sucede algún error que impide que el programa siga adelante: no poder abrir el fichero con el que se trabaja, por ejemplo. Estas dos órdenes preceden a todos los programas en el libro Perl moderno, que, como es natural, es la inspiración para esta introducción al lenguaje.

Pero no hemos tenido que instalar autodie, no es que no recuerdes haberlo hecho, es que es una pragma que está activada por defecto. use sirve tanto para cargar bibliotecas como para activar pragmas. La verdad es que en este caso la pragma es bastante inútil, pero la librería nos permite usar la siguiente línea, que es la que realmente hace algo:

say "Hola k ase";

say es la nueva forma de decir print incluyendo un retorno de carro al final, pasando a la línea siguiente. Y esto es todo lo que hace este primer programa, que en realidad podíamos haber hecho así

perl -e "print 'Hola k ase\n'";

pero no habríamos aprendido tanto, ¿no?

##Tratando información con Perl

En Perl, siempre hay más de una forma de hacer las cosas. Como lenguaje expresivo que es, se pueden usar bucles tal como se haría en C, por ejemplo, con variable de bucle y demás. Pero hay formas de tratar la información modernas que son mucho más Perleras, como hacemos en el siguiente programa:

use LWP::Simple;
use Mojo::DOM;

my $url = "http://www.europapress.es/trafico/";

my $dom = Mojo::DOM->new( get $url );

my $estados_granada = $dom->find("table#tblTrafico tr")->grep(qr/Granada/i);

for my $estado (@$estados_granada ) {
  say "-> "
    , $estado->at("td.lugar")->text
    , " - ".$estado->find("td img")->map(attr =>'alt')->join(" | " );
}

Hemos suprimido las 5 primeras líneas, que son iguales que en el primer programa (incluyendo el shebang, `#!"), este programa que descarga una web, la de tráfico de la agencia Europa Press y extrae todas las incidencias referidas a la provincia de Granada, ocupa un total de siete líneas, bueno, 18 si las extendemos para ser más legibles. Por supuesto, esas 7 líneas resumen lo mejor y lo peor del Perl, así que iremos por partes en las mismas.

El programa usa dos bibliotecas: una para descargar la página web y otra para analizarla. La primera es LWP::Simple, un cliente web que incluye sólo funciones, como get, para descargarse un URL y meter el contenido en la variable. El segundo es Mojo::DOM, parte de Mojolicious, un marco MVC que también incluye todo tipo de utilidades, como esta, para crear aplicaciones cliente-servidor, testearlas y hacer miles de cosas con ellas; este módulo, por ejemplo, analiza un documento y permite acceder a partes del mismo usando selectores CSS tal como hace JQuery.

Por eso es tan fácil procesar ese tipo de información. Esos módulos se incluyen en las dos primeras líneas y el segundo bloque declara dos variables.

my $url = "http://www.europapress.es/trafico/";

declara el ámbito de la variable $url. Una declaración de ámbito no es una declaración de variable: la variable se puede usar sin necesidad de declarar su ámbito, pero en Perl moderno conviene declarar el ámbito de todas las variables para saber dónde están y se mueven. En este caso es el ámbito global, pero es una buena práctica que hay que usar, literalmente, en todos los ámbitos. La segunda declaración

my $dom = Mojo::DOM->new( get $url );

es de un objeto: se crea un new objeto de tipo Mojo::DOM a partir de una cadena, la que devuelve get $url. En una sola línea descargamos el URL y lo analizamos, creando una variable, $dom que lo contiene ya dividido en diferentes bloques que se pueden analizar. La flecha se usa para acceder a métodos de una clase, porque Perl también es orientado a objetos.

O algo por el estilo.

Las variables en Perl no tienen tipo, o mejor dicho, tienen tipificación dinámica: usa "duck typing" que consiste en usar una variable como el comportamiento requiera en cada momento. $url se comportará como una cadena si la usamos en el contexto de otras cadenas, pero como un número en contexto numérico.

my $uno = "1uno";
my $dos = "2dos";
say length($uno);
say $uno + $dos;

En el caso anterior, length trata la variable como una cadena, considerando sus cuatro caracteres; sin embargo, + lo tratará como un número, devolviendo 3. Duck typing: si actúa como un número, será un número.

Pero hasta ahora estamos trabajando con estructuras simples, escalares. Todos los escalares tienen un $ delante en Perl. Por lo tanto, la siguiente línea también declara el ámbito de un escalar:

my $estados_granada = $dom->find("table#tblTrafico tr")->grep(qr/Granada/i);

lo que es, efectivamente, lo más simple que se puede decir sobre ella. En realidad se trata de una referencia a un array; los arrays o vectores usan @ en Perl, pero en este caso la función a la derecha directamente devuelve una referencia, así que no aparecerá la arroba hasta más adelante.

¿Y qué hace esa función? Perl sigue el principio de la mínima sorpresa, así que podemos intentar leerla aunque no lo conozcamos (y sepamos otras cosas, claro, como CSS y utilidades básicas de Unix). Lo que hace es que, dentro del fichero analizado, busca (find) las filas de las tablas que tengan el id tblTrafico y, entre ellas, selecciona (grep) aquellas en las que aparece la expresión regular (qr) Granada. Perl es expresivo y permite hacer todo eso en una sola línea. Además, hemos usado expresiones regulares: en este caso es una expresión regular qr/Granada/i que se suele expresar entre delimitadores tal como el slash y que, tras ellos, tiene una serie de modificadores: i que es case insensitive, por lo que buscará el nombre de nuestra provincia esté en mayúsculas o no.

Las expresiones regulares son una de la aportación de Perl a los lenguajes de programación modernos. Fue el primer lenguaje que las introdujo de forma nativa

lenguaje de propósito general, claro; antes estaba el AWK

y de ahí su sintaxis se ha extendido al resto de los lenguajes de programación; que ya lo incluyen de forma más o menos habitual. Aquí las usamos en su forma más simple, una simple cadena, pero se puede incluir cualquier tipo de estructura regular; por ejemplo /\(.+\)/ incluiría todos los lugares que incluyeran un paréntesis, que podrían ser todos los que no fueran estrictamente la capital de la provincia, como La Zubia (Granada). Las \ hacen que el paréntesis se interprete de forma literal, y .+ indica uno o más caracteres, cualquiera que sea (espacio, letras, números, lo que sea).

Las expresiones regulares necesitarían cursos enteros para ser bien comprendidas. Pero quedémonos con que son muy útiles y, a este nivel, fáciles de usar.

El array lo usamos a continuación en el bucle, cuya primera línea es:

for my $estado (@$estados_granada ) {

En este caso estamos des-referenciando el array. Para desreferenciar se precede la variable con el sigilo que indica el tipo de destino, en este caso un array representado por @. En el bucle se declara una variable, $estado, que irá recorriendo uno por uno los elementos del array. Ese bucle puede usar también la forma habitual, con un índice sobre el array, pero esta forma es más moderna y se prefiere.

Pero recuerda que en Perl siempre hay muchas formas de hacerlo. Por ejemplo

while (@$estados_granada) {
	my $estado = shift @$estados_granada

iría sacando elementos del array hasta que no quedaran más. Es cuestión de probar diferentes opciones a ver cuál puede ser más rápida.

Perl tiene un excelente profiler, Devel::NYTProf, desarrollado originalmente en el New York Times. Ante la duda, usa el profiler.

Dentro del bucle volvemos a usar las funciones de Mojo::DOM para extraer información de cada una de las filas de la tabla: el sitio donde están y el título de las imágenes de la segunda fila que es donde se contiene la información sobre el estado. Una vez más, en

$estado->find("td img")->map(attr =>'alt')->join(" | " )

usamos bucles implícitos y también hashes, el otro tipo de arrays de Perl. attr =>'alt' es un hash que tiene como clave attr y como valor alt. Visto de izquierda a derecha, encuentra todas las imágenes contenidas en las celdas de la fila, de las que extrae el atributo alt y una vez extraídos todos los una usando una cadena.

¿Cuál será el resultado? Variará con el día, pero en este momento algo así:

-> GRANADA - Obra | Circulación lenta con paradas esporádicas
-> SIERRA NEVADA - Retención | Circulación lenta con paradas esporádicas
-> GRANADA - Obra | Circulación lenta con paradas esporádicas
-> TREVELEZ - Retención | Circulación lenta con paradas esporádicas
-> PUEBLA DE DON FADRIQUE - Retención | Circulación lenta con paradas esporádicas
-> JUVILES - Retención | Circulación lenta con paradas esporádicas
-> CALAHORRA (LA) - Retención | Circulación lenta con paradas esporádicas
-> ZUBIA (LA) - Obra | Circulación lenta con paradas esporádicas
-> IZBOR - Retención | Circulación lenta con paradas esporádicas
-> PINOS - Obra | Circulación lenta con paradas esporádicas
-> GUADAHORTUNA - Obra | Circulación lenta con paradas esporádicas

Usando formatos estándar.

Pero con el texto no llegamos a ningún lado. Habrá que usar algún formato estándar para que se pueda tratar de forma eficiente. Usemos, por ejemplo, JSON para sacarlo en el siguiente programa

use Modern::Perl;
use autodie;

use LWP::Simple;
use Mojo::DOM;
use JSON;

my $url = "http://www.europapress.es/trafico/";

my $dom = Mojo::DOM->new( get $url );

my $estados_granada = $dom->find("table#tblTrafico tr")->grep(qr/Granada/i);

my %estados;
for my $estado (@$estados_granada ) {
    push @{$estados{$estado->at("td.lugar")->text}}
    , [$estado->at("td.fecha_tr")->text
       , $estado->find("td img")->map(attr =>'alt')->join(" | " )->to_string];
}
say encode_json \%estados;
{

El programa tiene pequeños cambios con respecto al anterior. Pero añade otro módulo, JSON, que habría que instalar a mano. Cada vez que descarguemos el programa en un nuevo ordenador, tendremos que instalar uno a uno todos los módulos.

Para ello, cpanfile al rescate:

requires 'Modern::Perl';
requires 'LWP::Simple';
requires 'Mojo::DOM';
requires 'JSON';

cpanfile es simplemente un formato de fichero que especifica los módulos que se necesitan y, opcionales, la versión de los mismos. Por ejemplo, requires 'Mojo::DOM', ">= 5.7"; instalará Mojo::DOM en esa versión si la que hay instalada es anterior. En nuestro caso nos da igual la versión, porque usamos el interfaz más común (al menos que sepamos), así que con ese fichero y ejecutando

cpanm --installdeps .

nos instalará todos los módulos que necesitamos para ejecutar el programa. Que es muy similar al anterior, salvo que declaramos el hash %estados que usaremos para almacenar todos los datos relativos a una ciudad. El nombre de la ciudad será la clave, y como valor tendremos un array con todas las incidencias; cada una de las incidencias tendrá la fecha y de qué se trata. Para extraer el lugar se usa el mismo código que antes, pero

 [$estado->at("td.fecha_tr")->text
   , $estado->find("td img")->map(attr =>'alt')->join(" | " )->to_string]

es un array de dos componentes. El primero es el texto de la fecha, que lo extraemos tal cual de la celda de la tabla correspondiente. El segundo componente es similar al que usábamos antes: extraemos el texto de las imágenes, pero añadiendo al final to_string lo convertimos a una cadena, lo que era necesario porque previamente se trataba de un objeto raruno cuyo tipo no viene al caso.

Finalmente, lo escribimos en JSON, directamente a salida estándar (a pantalla):

say encode_json \%estados;

Como encode_json necesita una referencia, la creamos a partir del hash usando \. El resultado será:

{"GRANADA":[["18/02/2015","Obra | Circulación lenta con paradas esporádicas"],["17/02/2015","Obra | Circulación lenta con paradas esporádicas"]],"PINOS":[["05/08/2013","Obra | Circulación lenta con paradas esporádicas"]],"CALAHORRA (LA)":[["17/02/2015","Retención | Circulación lenta con paradas esporádicas"]],"IZBOR":[["07/11/2014","Retención | Circulación lenta con paradas esporádicas"]],"ZUBIA (LA)":[["30/01/2015","Obra | Circulación lenta con paradas esporádicas"]],"SIERRA NEVADA":[["17/02/2015","Retención | Circulación lenta con paradas esporádicas"]],"TREVELEZ":[["17/02/2015","Retención | Circulación lenta con paradas esporádicas"]],"GUADAHORTUNA":[["13/04/2009","Obra | Circulación lenta con paradas esporádicas"]],"JUVILES":[["17/02/2015","Retención | Circulación lenta con paradas esporádicas"]],"PUEBLA DE DON FADRIQUE":[["17/02/2015","Retención | Circulación lenta con paradas esporádicas"]]}

Ya estamos listos para crea una aplicación web con este formato. Lo que haremos a continuación.

Uso de marcos web: Dancer

Dancer2 es, como Mojolicious, un marco de aplicaciones. Podíamos haber usado Mojolicious y nos habríamos quedado tan a gusto, pero Dancer es más ligero y no requiere más que poner lo que uno necesita para crear una aplicación REST, que es lo que vamos a hacer: una aplicación que te devuelva, en formato JSON, las incidencias de un sitio determinado a partir del nombre de la ciudad. Lo hacemos en el siguiente programa

use File::Slurp::Tiny qw(read_file);
use Dancer2 qw(:syntax);

my $data_file = read_file('gr-trafico.json');

my $data = from_json $data_file;

get '/' => sub {
    my @keys = keys %$data;
    return to_json { ciudades => \@keys };
};

get '/trafico/:ciudad' => sub {
    if ( $data->{params->{'ciudad'}} ) {
	return to_json $data->{params->{'ciudad'}};
    } else {
	return 	status 404;
    }
};
 
start;

(Quitamos las líneas iniciales). En una docena de líneas creamos una aplicación web completa. Usamos dos módulos: uno para leer ficheros que lo hace de forma más rápida a la habitual, tragándoselos (Slurp) y que nos simplifica el proceso de leer el fichero JSON, y Dancer2, el marco de aplicaciones que aquí usamos en su forma más simple; sin plantillas, sino simplemente definiendo una serie de rutas que se podrán usar desde una aplicación web en jQuery, por ejemplo, o desde un cliente de cualquier tipo.

Tras leer el fichero y convertirlo a una estructura de datos interna,

lo más habitual sería que esto se hiciera desde una base de datos como Redis, CouchDB o MongoDB, pero en este caso lo vamos a dejar en el fichero. Perl, como es natural, trabaja con cualquiera de ellas.

definimos las rutas. Ojo, que es una definición, no una orden que se ejecute directamente. Por eso lo que se le pasa es una función anónima,

'/' => sub {
  my @keys = keys %$data;
  return to_json { ciudades => \@keys };
};

es un hash, con clave / y valor una función a la que se llamará cuando desde el cliente se requiera esa ruta. sub es la palabra clave que se usa para definir funciones en Perl, y normalmente lleva un nombre de función detrás (y últimamente también, los parámetros), pero en este caso no lleva nada, sino que devuelve un valor, en este caso un hash con clave ciudades y valor un array con los nombres posibles de las ciudades, convertido a JSON usando una función del propio Dancer2, to_json.

El resultado será algo así:

curl http://0.0.0.0:3000
{"ciudades":10}

Dancer, por defecto, ejecuta un servidor web en el puerto 3000; a este podemos acceder usando curl o desde el navegador (o desde un programa, claro). Es una ruta get, uno de las diversas órdenes que tiene HTTP. POST, PUT, el resto, se pueden definir de la misma forma natural, pero en nuestro caso usaremos sólo get.

La otra ruta usa un parámetro y permite acceder a los datos de la ciudad.

get '/trafico/:ciudad' => sub {
	if ( $data->{params->{'ciudad'}} ) {
	return to_json $data->{params->{'ciudad'}};
	} else {
		return status 404;
	}
};

El parámetro se le pasa con : y con lo mismo se le asigna un nombre. En realidad el funcionamiento interno es el mismo, salvo que recuperamos el valor del parámetro con params y lo usamos como clave para recuperar el valor correspondiente, definido en el fichero.

curl http://0.0.0.0:3000/trafico/GRANADA
[["18/02/2015","Obra | Circulación lenta con paradas esporádicas"],["17/02/2015","Obra | Circulación lenta con paradas esporádicas"]]

salen letras raras por conversión de conjunto de caracteres, no hay que preocuparse por lo pronto

Pero ¿qué ocurre si no hay ninguna incidencia para esa ciudad? Se devuelve un estado 404, es decir, no encontrado, con return status 404;. La última línea del fichero, start, es la que efectivamente arranca el servidor, escribiendo algo así:

>> Dancer2 v0.158000 server 13032 listening on http://0.0.0.0:3000

Este programa lo puedes desplegar en un servidor propio o en un PaaS tal como OpenShift, de forma totalmente gratuita (para un uso moderado de recursos). También se puede desplegar en heroku con algo más de complicación o, previo pago, en dotCloud. También puedes usar nubes privadas como el propio OpenShift o Stackato, creado por la misma compañía que porta Perl a Windows.

En resumen y en pocas líneas de código se puede crear una aplicación útil y rápida, que libere al programador para hacer otras cosas más interesantes como ver una temporada completa de Breaking Bad.

A donde ir desde aquí

Perl tiene una comunidad extensa y entusiasta, en castellano o en cualquier otro idioma. En Granada el Grupo de usuarios de Perl tiene básicamente una lista de correo, pero también organiza saraos importantes como la Conferencia europea de Perl. Madrid y Barcelona tienen un grupo bastante activo de usuarios y organizan reuniones periódicas (más los de Madrid que los de Barcelona).

Para cualquier duda, el canal de IRC , Perl Monks o, por supuesto, StackOverflow son lugares fundamentales. Difícil que una pregunta se quede sin contestar. Aparte del Modern Perl mencionado, hay todo tipo de libros a todos los niveles, desde uso de expresiones regulares hasta libros de hacks o de recetas. Y, por supuesto, el autor puede echar una mano en lo que haga falta.

About

Una introducción corta a Perl moderno

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages