Deep Learning aplicado al urbanismo o cómo analizar mejor las ciudades
• 1224 Views • No hay comentarios en Deep Learning aplicado al urbanismo o cómo analizar mejor las ciudadesAsí, como evolución de los avances promovidos desde Aprendizaje Automático, no dejan de aparecer avances y mejoras de los algoritmos más tradicionales, desde los conjuntos de clasificadores (Ensemble learning) hasta el Deep Learning, que está muy de moda en la actualidad por sus capacidad de acercarse cada vez más a la potencia perceptiva humana.
Modelo predictivo de densidades urbanas a partir de fotos aéreas
Por Alejandro Cantera
El proyecto define un modelo predictivo de clasificación de densidades urbanas a partir del análisis de ortofotografías de cualquier ciudad del mundo. Por medio de la construcción de un modelo de aprendizaje supervisado de Deep Learning, entrenado con ortofotografias etiquetadas de la ciudad de Madrid, se consigue una herramienta que es capaz de predecir la densidad urbana a partir del procesado de fotografías aéreas de una ciudad.
Predicción de distintos rangos de densidad urbana en la ciudad de Barcelona |
La aparición en los últimos tiempos de las técnicas de Deep Learning, y la sistematización de los procesos de análisis de aprendizaje automático, abren un nuevo campo de investigación en el análisis de las ciudades. El crecimiento exponencial de recogida de datos geoespaciales, tanto los tomados por sensores como por drones y satélites, y la mejora de la calidad de estos, nos permite acceder a un gran historial de tendencias y conductas urbanas que a día de hoy aún no han sido explotadas en toda su magnitud. La aplicación del Aprendizaje Profundo al territorio nos posibilita la creación de herramientas de análisis avanzado no sólo para el estudio de las ciudades, sino para optimizar la toma de decisiones y el diseño urbano.
El Aprendizaje Profundo, es un tipo de aprendizaje automático, construido a partir de un conjunto de neuronas que permiten el procesado de los datos asemejando el comportamiento de un cerebro humano. Hay distintos tipos de redes neuronales, según el tipo de neuronas que uses y su combinación ( lo que se denomina 'arquitectura de la red neuronal'). Para visión artificial y reconocimiento de imágenes se usan Redes Convolucionales ( denominadas CNN). Esta red actúa de manera similar a las neuronas de la corteza visual, descomponiendo una imagen en una matriz tridimensional y reconociendo patrones por medio de sucesivas transformaciones matriciales no lineales, lo que permite a la Red Neuronal aprender tendencias y comportamientos. El comportamiento de estos modelos predictivos quedan definidos a través de la distribución de los datos, patrones e interacciones con el conjunto de neuronas creadas.
Arquitectura de las distintas Redes Neuronales Convolucionales aplicadas |
El reconocimiento de patrones de forma y morfología de las imágenes etiquetadas que se usan en el entrenamiento del modelo, nos permite extrapolar resultados a otras ciudades, surgiendo preguntas sobre la posibilidad de predicción de comportamientos urbanos por medio de procesos computacionales.
Metodología seguida en el proyecto
La densidad residencial se calcula dividiendo la cantidad de viviendas existentes entre unidad de superficie (ha). Los datos se obtienen del registro nº15 (bienes inmuebles) de los datos alfanuméricos catastrales de la ciudad de Madrid y se ponderan sobre una retícula de 250x250m, abarcando la totalidad de la ciudad. Las imágenes ráster proceden del servicio del PNOA (Plan Nacional de Ortofotografía Aérea) del Instituto Geográfico Nacional (IGN). Los modelos predictivos se construyen por medio de Redes Neuronales Convolucionales ( de tres tipos: basic CNN, VGG16 & VGG19), creando modelos según rangos de etiquetado de densidades urbanas ( 4, 7 ,12 labels features).
Los modelos construidos son de aprendizaje supervisado, esto quiere decir que para que la Red Neuronal aprenda es necesario que se entrene con ortofotos etiquetadas con la información de la densidad de viviendas. El modelo aprende en la fase de entrenamiento con un total de 7500 imágenes etiquetadas según el rangos típico de clasificación de densidades de vivienda :Densidad Nula: 0 viv/ha; Baja Densidad: 10, 20, 40, 60 viv/ha; Densidad Media: 80, 100, 120, 160 viv/ha; Alta Densidad: 200, 240, 320, 400 viv/ha.
Proceso de extracción, limpieza y etiquetado de las ortofotos con los datos obtenidos de Catastro |
Posteriormente al proceso de entrenamiento de las distintas redes neuronales, se evalúan los resultados obtenidos con el fin de seleccionar el modelo de mayor capacidad predictiva. Para ello se evalúa la matriz de confusión, que es una herramienta muy útil para visualizar el acierto del algoritmo en un proceso de aprendizaje supervisado, ya que contrasta el número de True Positive,True Negative, False Positive y False Negative. La ponderación de estos valores nos permiten definir métricas como el Recall, la Precisión, la F2score y la Accuracy para determinar el mejor modelo.
Evaluación de las métricas de cada tipo de CNN |
Comprobación de las predicciones realizadas por cada CNN |
Una vez evaluados y seleccionados cada uno de los modelos según su rango de etiqueta, es necesario probar como funciona con ortofotos de otras ciudades. El principal objetivo es probar la capacidad de predicción de los modelos ante situaciones diversas, ya que no sólo las imágenes pueden haber sido tomadas en otro momento temporal, con otra luz, sino que la morfología urbana de una ciudad puede ser diferente que la de ciudad de entrenamiento.Para la evaluación de esta diversidad urbana se parte del análisis de dos ciudades distintas. En ambos casos, la superficie alberga un área de 80x80 teselas, lo que equivale a una superficie de 400 km2.
Las características de las ciudades elegidas son:
• Barcelona : una ciudad con características similares urbanas, cuyas imágenes son tomadas de las misma fuente de datos (PNOA) .
• Bogotá: una ciudad de una configuración distinta y cuya fuente de datos sea también distinta. El origen de esta imágenes son los servicios wms del Catastro de Bogotá.
Predicción de Densidad Urbana de Barcelona |
Predicción de Densidad Urbana de Bogotá |
Las predicciones en ambas ciudades muestran resultados coherentes, contrastables con sus datos propios. El modelo construido es un primer proyecto piloto, que pretende establecer las bases de futuros análisis urbanos de predicción de otros indicadores urbanos. Para ello, el modelo debe evolucionar a un sistema de predicción multivariable a partir de una misma fuente ráster (preferiblemente imagen satélite que ortofoto), ganando robustez en sus predicciones. Sin embargo, el proyecto no pretende conseguir la predicción de cualquier territorio por medio del aprendizaje de una única ciudad; es necesario introducir dentro del modelo distintos tipos de ciudades, con morfologías y estructuras distintas para que éste aprenda a discernir distintos patrones de construcción urbana.Pese a todas estas mejoras mencionadas, el objetivo del proyecto es el de la creación de un primer prototipo que sirva de ejemplo de cómo la combinación de datos urbanos con técnicas de aprendizaje profundo puede ayudar a construir una nueva linea de estudios territoriales avanzados usando la inteligencia artificial para el reconocimiento y la clasificación de patrones urbanos, y de esta manera actuar de una manera más consciente en las ciudades.
Comparación de predicción de densidad urbana en Barcelona de 7 y 12 categorías de etiquetado |
Alejandro es arquitecto por la Universidad Politécnica de Madrid (ETSAM) y Urban Data Scientist. Se dedica al diseño de nuevas herramientas de análisis avanzado e intervención en zonas urbanas, desde la escala territorial a la de detalle. Ha trabajado en el estudio de Ezquiaga Arquitectura, Sociedad y Territorio colaborando en proyectos como la Revisión del Plan Territorial Insular de Menorca o el Plan de Revitalización del Centro Tradicional de Managua, y actualmente desarrolla su carrera profesional en Urban Data Analytics (uDA). Su trabajo ha sido publicado en Fisuras, Displacement, Bartlebooth and The Funambulist .
Related Posts
« Automatizar procesos de marketing inmobiliario Un mapa del océano sin fin: la proyección de Spilhaus »