Satélites y ciencia de datos para detectar fraude en el consumo de agua

Aunque nos guste pensar que tomamos cada una de nuestras decisiones de forma compleja y consciente, los seres humanos somos más predecibles de lo que a simple vista parece.

Y esto ya lo saben los científicos de datos, que son capaces de aplicar los diferentes algoritmos existentes para predecir comportamientos tales como el camino que recorreremos al ir al trabajo, en qué nos vamos a gastar nuestro dinero estas navidades o el consumo esperado de agua a lo largo del año.

Hoy en día las empresas de agua suelen utilizar diferentes metodologías artesanales para detectar el fraude en el consumo de agua. Concretamente, los inspectores, para encontrar patrones de comportamiento anómalo, analizan los consumos a lo largo del año, utilizan mapas online para revisar si la parcela tiene piscina, jardín, casa pequeña o grande, la tipología del barrio en el que se encuentra la vivienda y un montón de variables más que les lleva a perder horas o días con tareas de escritorio.

¿Pero qué pasaría si unimos todas estas variables, junto con otras provenientes de diferentes fuentes de datos y se las introducimos a un algoritmo de machine learning que sea capaz de predecir los consumos para cada una de las viviendas y detectar las que se alejan de lo normal, lo predice?.

Podemos desarrollar herramientas capaces de predecir los consumos para cada una de las viviendas unifamiliares de un municipio concreto. Combinando información histórica de cada cliente con imágenes satelitales y otras fuentes de datos podemos ser capaces de analizar el llenado de piscina, el estado del césped en verano con respecto a invierno, el tamaño de la parcela y de la vivienda, entre otras variables.

Si analizamos y aprendemos del comportamiento de miles de viviendas podemos detectar aquellas que presentan un comportamiento anómalo, lejos de los normal para sus características. Por ejemplo, si detectamos un llenado de una piscina en un periodo concreto, este llenado debe reflejarse en el consumo total de ese mismo periodo. O si el estado del césped en verano goza de la misma salud que en invierno, algo casi imposible en este clima mediterráneo sin haberlo regado asiduamente, ese cuidado debe reflejarse también en ese mismo periodo de análisis.

¿Pero cómo se podría traducir el uso de estos algoritmos y análisis de datos a un lenguaje más sencillo de interpretar?

El revisor podrá visualizar, en un mapa interactivo y desde cualquier dispositivo las viviendas más sospechosas, ordenadas de mayor a menor probabilidad de estar cometiendo fraude o las que mayor retorno económico dé. Esta información puede ir acompañada de diferentes flags, tales como “sospechoso por llenado de piscina”, “sospechoso por vegetación saludable en verano que no se corresponde al consumo” o “sospechoso por consumo que no se corresponde con sus características”. Estas flags ayudarán al inspector a analizar directamente la fuente de conflicto y actuar más eficientemente en su toma de decisiones.

Pasar de una aproximación manual a una aproximación analítica y potenciada por inteligencia artificial para detectar fraude es capaz de:

Aumentar el ratio de detección de fraude.
Priorizar las inspecciones según el retorno económico esperado o según la probabilidad de fraude.
Disminuir el trabajo de oficina de los inspectores.
Ahorrar tiempo y dar versatilidad en la toma de decisiones a los managers con herramientas de planificación de campaña.

Si te ha gustado este post, me encantaría que me contactaras para seguir debatiendo sobre este u otros proyectos de digitalización, quizás de nuestra conversación pueda salir una segunda publicación.

Satélites y ciencia de datos para detectar fraude en el consumo de agua

Más opinión