Disposición de fuentes de datos en formato HTML

Como ya he indicado en el post anterior dos de las fuentes de datos están representados en página web en el caso de provincia en este enlace.

Para disponer de los elementos podemos hacerlo de una forma manual con el corta pega tradicional, caso de ser pocos elementos es más que suficiente, siempre y cuando no se pretenda automatizar la revisión futura de datos.

Para probar otro método he utilizado una hoja de cálculo EXCEL.

Iniciamos la obtención de datos externos como nueva consulta web, según vemos en la ilustración

datos html

Se abre un navegador, con la página web por defecto. En la dirección incluiremos la que nos interesa, en nuestra prueba http://www.ine.es/daco/daco42/codmun/cod_provincia.htm y pulsaremos el botón IR obteniendo:

provincia_htm

Donde aparecen unos pequeños iconos amarillos distinguiendo las zonas.

Deberemos, en este caso validar las zonas que nos interesan pulsando los iconos, los cuales se tornarán verdes con una muesca de validación así como las zonas a importar oscurecidas, según podemos observar en la siguiente figura:

datos html validados

Para afinar un poco más pulsaremos opciones, donde se desplegará

datos html opciones

Y activaremos la opción de importar bloques en columnas. Posteriormente pulsaremos importar y nos devolverá los datos a la hoja de cálculo:

datos html importados

Como observamos que tiene tantos encabezamientos como bloques, lo que haremos será orbenar (por código ascendente) y posicionarnos al final para eliminar las dos cabeceras repetidas, para posteriormente exportar a formato CSV

Si el resultado lo habrimos con un procesador de texto observaremos lo siguiente:

datos html csv

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*