Aqualia
Connecting Waterpeople
BACCARA
Miya Water
AECID
NaanDanJain Ibérica
Fundación CONAMA
CALAF GRUP
Cibernos
Red Control
UNOPS
AGENDA 21500
Insituform
BELGICAST by TALIS
Isle Utilities
Almar Water Solutions
Ingeteam
Control Techniques
Cajamar Innova
Blue Gold
Xylem Water Solutions España
TEDAGUA
ISMedioambiente
Schneider Electric
Fundación We Are Water
SCRATS
ESAMUR
Saint Gobain PAM
Fundación Botín
ITC Dosing Pumps
Mancomunidad de los Canales del Taibilla
Bentley Systems
Smagua
Asociación de Ciencias Ambientales
EMALSA
Aigües Segarra Garrigues
ABB
Lama Sistemas de Filtrado
LACROIX
Aganova
Molecor
Idrica
Likitech
Prefabricados Delta
Baseform
Minsait
Kamstrup
EPG Salinas
ADECAGUA
Rädlinger primus line GmbH
Global Omnium
STF
biv Innova
DuPont Water Solutions
GS Inima Environment
Grupo Mejoras
VisualNAcert
Centro Nacional de Tecnología de Regadíos (CENTER)
Hidroconta
Kurita - Fracta
DAM-Aguas
Saleplas
Fundación Biodiversidad
TecnoConverting
Laboratorios Tecnológicos de Levante
Terranova
Elmasa Tecnología del Agua
UPM Water
ACCIONA
Danfoss
Hach
NOVAGRIC
CAF
J. Huesa Water Technology
Vector Motor Control
Regaber
Redexia network
Elliot Cloud
Grundfos
IAPsolutions
Gestagua
IIAMA
Confederación Hidrográfica del Segura
Catalan Water Partnership
Innovyze, an Autodesk company
Ulbios
Agencia Vasca del Agua
Consorcio de Aguas de Asturias
Barmatec
s::can Iberia Sistemas de Medición
AZUD
ICEX España Exportación e Inversiones
FLOVAC
HANNA instruments
FENACORE
Filtralite
Sacyr Agua
SEAS, Estudios Superiores Abiertos
Aqualia

Guía práctica para usar datos derivados de imágenes satélite en la detección del fraude

  • Guía práctica usar datos derivados imágenes satélite detección fraude

Sobre el blog

Pablo Arca
Co-fundador en Watcher Platform y Cartometrics. #Remotesensing, #GIS, #geospatialintelligence.
ABB

1. Introducción

¿Qué es la teledetección? La teledetección es el proceso de adquirir información de los objetos o fenómenos midiendo la radiación que reflejan o emiten estos, normalmente desde aviones, satélites o drones.

Existen dos tipos principales dne instrumetos que se utilizan en teledetección para medir la radiación, los pasivos y los activos. Los pasivos registran la información a partir de estímulos externos, recolectando la radiación emitida por los objetos. La radiación medida más común suele ser la del sol. En cambio los instrumentos activos utilizan estímulos internos para recopilar datos, emitiendo energía y midiendo la reflectancia de esa energía emitida con el fin de escanear objetos y áreas.

2. ¿Qué datos podemos obtener de la teledetección para detectar fraude?

En primer lugar, para detectar fraude necesitamos pensar qué datos relacionados con el consumo podemos obtener de la teledetección para así realizar estimaciones de consumo de agua y ver si se corresponden o no con el uso fraudulento del agua. Los más evidentes y factibles son los datos de piscina y de vegetación. Concretamente necesitaremos saber: 

  • Los m2 de piscina. 
  • Si la piscina ha sido llenada. 
  • Los m2 de vegetación. 
  • Los m2 de vegetación. 
  • Si esta vegetación está siendo regada o no en fechas de estrés hídrico (verano)

3. Metodología:

1- Elegimos una zona de estudio. A ser posible una zona residencial en la que abunden piscinas y césped. Yo he elegido la zona residencial Fuente del Fresno, en San Sebastián de los Reyes, Madrid. 

2- Adquirimos las imágenes de satélite de dicha zona. Concretamente necesitamos dos imágenes de satélite, una de invierno y otra de verano, de alta resolución (0.30 cm – 0.80 cm por píxel) que contengan las bandas del espectro visible (RGB) y el infrarrojo cercano (NIR). He colgado en este repositorio estas imágenes de 0.30 cm por píxel de la zona de estudio para que vosotros también podáis utilizarlas de ejemplo (06-02-2022_RGBN.tif y 30-08- 2022_RGBN.tif).

3- Los datos de tamaño de parcela y m2 de la vivienda pueden sernos útil a la hora de valorar posible fraude. Para obtener los datos de m2 de parcela total y m2 de vivienda podemos adquirirlos a partir de la información vectorial de las parcelas y viviendas desde la Sede Electrónica de Catastro. Link a la sede electrónica.

 *En el mismo repositorio encontraréis estos datos para la zona de estudio en cuestión (parcelas.geojson, viviendas.geojson) 

4- Una vez que tenemos los datos que utilizaremos, abrimos el programa SIG de escritorio que nos ayudará a hacer los análisis. Nosotros usaremos el software libre Qgis. Para los que no lo tengan instalado, podéis descargarlo desde este link.

Abrimos un nuevo proyecto en Qgis y cargamos los datos de imágenes satelitales y catastrales.

Barra de navegación > Capa > Añadir capa > Añadir capa vectorial​ 

Barra de navegación > Capa > Añadir capa > Añadir capa raster. 

5- Revisamos que las imágenes estén bien georreferenciadas en el sistema de coordenadas que estemos utilizando para el proyecto y coincidan en el espacio. Si la georreferenciación falla, puede ocurrir que estemos trasladando los m2 de césped de una parcela a la parcela contigua. Para los que estéis usando las imágenes de ejemplo que proporciono no tendréis que preocuparos ya que están corregidas, para los que no, os dejo un link explicativo para corregir rasters.

6- Realizamos un NDVI para invierno y verano. El índice de vegetación de diferencia normalizada o NDVI es un índice utilizado para estimar la cantidad, calidad y desarrollo de la vegetación en base a la radiación que emite la vegetación en las bandas roja e infrarrojo cercano del espectro electromagnético. 

"Con este método detectaremos sólo las masas vegetales de las parcelas y dejaremos de lado césped artificial y otros elementos que visualmente parezcan césped o vegetación pero que no lo sean". 

Para realizar el NDVI usamos la calculadora ráster.


Barra de navegación > Raster > Calculadora raster

La fórmula del NDVI es la siguiente: (NIR – RED)/(NIR + RED). En la práctica, la imagen satelital contendrá la banda NIR como banda 4 y la banda RED como la banda 1, por lo que la fórmula que tendremos que introducir en la calculadora ráster será (4 – 1)/ (4 + 1).


Resultado del NDVI en Agosto. El rojo más oscuro representa la vegetación más saludable.

Una vez que tenemos la capa de NDVI, hacemos una reclasificación para así quedarnos sólo con los datos de vegetación saludable y descartar todo lo demás.


Barra de navegación > Procesos > Caja de herramientas > r.reclass 

Resultado de la reclasificación. Los colores verdes representan la vegetación saludable. Gracias a este geoproceso podemos visualizar y contabilizar mejor a cuál parcela pertenece un área con césped saludable. 

El siguiente paso es realizar un histograma zonal. Con esta herramienta lo que pretendemos es poder obtener, cuantitativamente, el área de vegetación saludable que contiene una parcela concreta. La herramienta se encargará de contabilizar los píxeles que hay dentro de un área concreta.


Barra de navegación > Procesos > Caja de herramientas > Histograma zonal

El resultado será una nueva capa de parcelas con el sumatorio de la cantidad de píxeles que representan la vegetación para cada una de las parcelas. Lo que nos interesa es saber el área de esa vegetación por lo que habrá que transformar con una simple fórmula el sumatorio a m2. 

Si la resolución de la imagen de satélite que hemos utilizado es de 0.30 cm por píxel, significa que necesitaremos algo más de 9 píxeles de 0.30 cm para formar uno de 1 m por lo que tendremos que dividir el resultado del sumatorio del histograma zonal entre 9 y tendremos el área en m2.

Para obtener el área en m2:


Botón derecho a la capa de parcelas generada > Abrir tabla de atributos > Abrir calculadora de campos > Crear campo nuevo

Realizamos el mismo proceso (calculadora ráster para obtener el NDVI, Reclasificación e Histograma zonal) para invierno y así obtener una nueva columna con el área de vegetación saludable en invierno. 

Puede ser de gran ayuda un nuevo campo llamado "diferencia" que lo crearemos restando el área de vegetación de invierno a la de verano. De esta forma visualizaremos mejor las parcelas con vegetación que se han mantenido igual, que han aumentado o disminuido:

"Ahora ya sabemos qué parcelas han mantenido unos valores similares de vegetación saludable en invierno y verano. Es interesante observar y comparar, junto con los datos de consumo de esas viviendas, cómo se comportan dichas parcelas".

4. Conclusiones:

Podemos saber con una probabilidad de acierto bastante alta el cambio del césped en dos estaciones diferentes. El llenado de piscinas es una variable muy simple a incorporar a la hora de detectar fraude pero las conclusiones que saquemos cuando revisamos los resultados del césped deben tener en cuenta el área geográfica y el tiempo, concretamente las precipitaciones. 

Por poner un ejemplo, si estamos analizando zonas del Mediterráneo en las que sabemos que en verano apenas llueve, si observamos un césped y está en perfectas condiciones, lo más seguro es que haya sido hidratado de forma artificial (agua de la red, pozo o tanque, entre otras), pero si observamos un césped de una zona de montaña, tendremos que tener en cuenta que en estas áreas los veranos pueden ser lluviosos y no haya tenido que ser regado apenas.

Después de obtener los resultados y realizar observaciones concretas a distintas parcelas surgirán preguntas tales como:

  • ¿Si una parcela tiene x m2 de césped y lo ha mantenido saludable en verano, el consumo se mantiene, aumenta o disminuye? 
  • A la hora de detectar fraude, ¿el cambio del estado de la vegetación es más determinante que los m2 de vegetación de la parcela? ¿Y que los llenados de piscina? 

Para responder dichas preguntas, podemos hacerlo manualmente revisando una a una junto con datos de consumo o podemos usar técnicas de ML que nos ayudarían a automatizar y analizar grandes cantidades de datos. Pero esto lo dejamos para la guía siguiente.

Para cualquier cuestión no dudes en escribirme y si quieres leer el post completo con el análisis de llenado de piscinas escríbeme y te lo enviaré.

Muchas gracias por leer. ¡Nos vemos en la próxima!

Redacción iAgua