Disposición de fuentes de datos en formato HTML
Como ya he indicado en el post anterior dos de las fuentes de datos están representados en página web en el caso de provincia en este enlace.
Para disponer de los elementos podemos hacerlo de una forma manual con el corta pega tradicional, caso de ser pocos elementos es más que suficiente, siempre y cuando no se pretenda automatizar la revisión futura de datos.
Para probar otro método he utilizado una hoja de cálculo EXCEL.
Iniciamos la obtención de datos externos como nueva consulta web, según vemos en la ilustración
Se abre un navegador, con la página web por defecto. En la dirección incluiremos la que nos interesa, en nuestra prueba http://www.ine.es/daco/daco42/codmun/cod_provincia.htm y pulsaremos el botón IR obteniendo:
Donde aparecen unos pequeños iconos amarillos distinguiendo las zonas.
Deberemos, en este caso validar las zonas que nos interesan pulsando los iconos, los cuales se tornarán verdes con una muesca de validación así como las zonas a importar oscurecidas, según podemos observar en la siguiente figura:
Para afinar un poco más pulsaremos opciones, donde se desplegará
Y activaremos la opción de importar bloques en columnas. Posteriormente pulsaremos importar y nos devolverá los datos a la hoja de cálculo:
Como observamos que tiene tantos encabezamientos como bloques, lo que haremos será orbenar (por código ascendente) y posicionarnos al final para eliminar las dos cabeceras repetidas, para posteriormente exportar a formato CSV
Si el resultado lo habrimos con un procesador de texto observaremos lo siguiente:
Deja una respuesta