Sector Inmobiliario – ¿Qué es la predicción de datos y por qué tu director/a RSE no podrá dejar de probarla?

Berta Icart
Date12 agosto 2021

El tratamiento de los datos que faltan es un tema fundamental en el análisis de datos. Quizá ya hayas escuchado hablar de predicción de datos de la carga de datos que faltan. ¿Cómo se trata la ausencia o la ambigüedad de datos en el data-sciences? Analizamos estas cuestiones fundamentales para obtener análisis previsibles fiables.

¿Por qué recurrir a la predicción de datos?

Pongamos un ejemplo sencillo: un director RSE encargado de redactar un informe sobre el consumo energético de un total de 50 lugares no puede permitirse rechazar el análisis de algunos de esos lugares sobre los que faltan ciertos datos. Ocurre lo mismo cuando los gestores de un parque inmobiliario disponen de los consumos de las partes comunes pero no de las privadas. La predicción de datos es, de alguna manera, un compromiso para evitar la pérdida de información masiva. 

Cargar datos que faltan permite obtener una visión macro más fiable y conseguir predicciones más justas. Hay muchos algoritmos que no funcionan si faltan datos: se trata, por tanto, de hacer un equilibrio entre los valores y las variables.

¿Has dicho predicción? ¿Para qué casos?

Dicho de forma sencilla, la predicción de datos consiste en suplir la falta de información en una base de datos. En algún caso concreto, puede ser necesario cargar datos que faltan:  

  • El dato existe pero no lo conocemos: si quiero hacer un análisis anual de mi consumo eléctrico antes de recibir mi factura del mes de diciembre, voy a tener que, por ejemplo, cargar temporalmente un valor a la espera de conocer el dato que nos falta. 
  • La ausencia de datos en la base es ambigua: a la pregunta « Un  equipo, está presente en el lugar », una casilla vacía podrá interpretarse de distintas maneras. Podemos pensar que el lugar no dispone del equipo pero también que no disponemos de la información. El dato que nos falta nos supone un problema ya que es origina múltiples interpretaciones.
  • La falta del dato tiene lógica, especialmente, en algunos casos interrelacionados. Por ejemplo, si un inmueble no tiene climatización, se da por hecho que no se responderá a la pregunta “¿Qué tipo de sistema de climatización tienes?”.

2 métodos importantes de predicción de datos

Para cargar los datos que faltan, utilizamos principalmente 2 métodos que se basan en la puesta en marcha de un sistema de reglas o la aplicación de algoritmos de máquina learning: 

  1. Un sistema de reglas lógicas permite suplir las ausencias o ambigüedades yendo a buscar la información fuera (por ejemplo, en los listados de consumo anteriores) o identificando un motivo por el que no se ha respondido a la pregunta. Por ejemplo, podemos suponer que si no tengo información sobre el tipo de calefacción es porque uso calefacción eléctrica. 
  2. Técnicas más complejas de máquina learning pueden actuar por deducción frente a otras situaciones conocidas y parecidas. Si les sites de même taille et situation géographique que celui étudié sont équipés d’une chaudière, on va imputer de manière déductive la donnée manquante « chaudière » au champ « mode de chauffage ». Si los lugares del mismo tamaño y situación geográfica que el estudiado están equipados con una caldera, se va a cargar el dato “caldera” en el campo “tipo de calefacción” por deducción. 

En caso de cargar datos que faltan, la elección de un método de predicción de los datos va a depender del contexto, de la lógica, del tipo de dato, etc. 

Si no se tratan, los datos que faltan van a plantear problemas en el análisis de datos: pueden distorsionar la visión global que se puede extraer del análisis, o incluso impedir el buen funcionamiento de los algoritmos de predicción. La predicción de datos permite así entender mejor lo existente y extraer las conclusiones gracias al análisis de los datos. Como resultado: la identificación de buenas decisiones en materia de gestión energética. 

New call-to-action