Datos quiero, datos tengo: Un diálogo de besugos


Últimamente vivo, y veo como viven, un diálogo de besugos entre los que tienen datos (los hospitales y los servicios de salud) y los que quieren datos (matemáticos de diferentes orígentes) que saben que pueden convertir los datos en información que puede ser relevante.

Hay quien lo califica un “mercadillo” de datos. Más bien es un atrio de templo, lleno de pordioseros mendigando limosna. (Sirva como ejemplo este link http://covid19.clapton.uca.es/#/home donde unos de la Universidad de Cádiz montan un modelo con datos que unos de Navarra han conseguido de un hospital de Galicia (creo que Santiago) a través de una universidad de La Coruña. Centenares de miles de pacientes en toda España y no hay más datos sobre la estancia en los hospitales y UCIs?????

La excusa es “la ley de protección de datos”. Nadie sabe qué dice la ley ni de qué nos protege exactamente. Pero es una gran excusa. Para pedir datos has de decir qué necesitas exactamente, como no sabes qué datos hay, no sabes qué datos puedes utilizar, ni sabes qué se puede conseguir, pero sin saber lo que quieres obtener no se puede saber qué datos hay….

De todos modos es, desde mi punto de vista, simplemente una excusa para no entrar en el fondo de la cuestión: compartir los datos.

Porque, si no existiera la LPD, el diálogo de besugos sería el siguiente:

  1. Simplicio: Necesito ayuda para tomar decisiones
  2. Salviati: Se puede construir un modelo (los modelos son representaciones explícitas y externas de parte de la realidad que ayudan a entender, gestionar, controlar o mejorar dicha parte de la realidad)
  3. Simplicio- Perfecto. ¿qué datos necesitas? Lo que haga falta
  4. Salviati – Necesito estos datos, debes tenerlos aquí y allá
  5. -una semana después- Simplicio- uff! Esos no los puedo compartir, he estado revisándolos y hay errores
  6. Salviati – Díme qué tienes
  7. Simplicio – Díme que necesitas
  8. Salviati – Podría hacerlo con estos otros datos, debes tenerlos aquí y acullá
  9. Volvemos a paso 6
  10. El bucle se interrumpe cuando ya no hace falta ayuda al cabo de uno o varios meses

Curiosamente la conversación anterior no es inocua. Al ir mejorando la calidad de los datos, el sistema va entendiendo mejor su problema, corrige algunas imperfecciones, depura responsabilidades. Y entonces el modelo ya no hace falta, el problema se ha disuelto (no se ha resuelto) pero la ayuda que hace falta es otra.

¿Por qué tanta reticencia a compartir datos?

La razón 1 es que “los datos no son correctos 100%”. Es como un cierto pudor a mostrar que no somos perfectos. Desde mi punto de vista es lógico que los datos no sean correctos 100%. Es muy caro saber todo, todo el tiempo. Por ejemplo la mayor parte de nosotros no sabemos cuanto café hay en nuestra despensa. No tiene sentido saberlo todo todo el tiempo. Pero hay que tener una cierta humildad para admitir que los datos (esos de los que presumíamos antes de tratar de utilizarlos) nunca serán 100% correctos. ¿Cuál es el coste de tener datos 100% correctos? Enorme. Un ejemplo: en la caja de una oficina bancaria sólo manejan billetes y algún otro tipo de documento. Tienen máquinas para medir, cuentan los billetes una y otra vez antes de anotar el movimiento, y (de vez en cuando) se quedan toda la tarde intentando “cuadrar” caja. Y lo hacen con menos de 20 referencias (6 tipos de billetes, 8 tipos de  monedas y otras cosas más). ¿Cual es el coste de mantener inventario cierto 100%? Y (de vez en cuando) hay errores.

La razón 2 es que “los datos no representan la realidad con suficiente detalle”. ¡¡¡Como no podía ser de otra manera!!! La realidad es muchísimo más que un conjunto de datos: 24 horas de 10 cámaras de vídeo en una habitación no representan la realidad, sólo las imágenes, para saber las temperaturas necesitaríamos cámaras infrarrojos y en cualquier caso los olores por ejemplo no están representados…

La razón 1 y la razón 2 son tan infantiles que sólo pueden ser excusas que ocultan algo más profundo.

  1. No hay datos (y si los hay no sé acceder a ellos)
  2. No me hablo con los informáticos (a lo mejor porque me cobran un dineral por cada consulta) y no puedo pedirles nada
  3. Los datos permiten intuir parte de la realidad que no queremos que se conozca (porque la conozco o peor aún porque no la conozco). Este motivo es muy habitual cuando el que solicita el modelo es el jefe del que tiene que aportar los datos y el que hace el modelo sabe suficiente para reconstruir la realidad
  4. Los datos indican que hice algo que debiera haber sido hecho de otra manera.
  5. Los datos pueden indicarnos lo que hemos de hacer (y no queremos hacer -eso en particular o nada en general)
  6. Los datos pueden indicar que no hemos de hacer algo que sí queremos hacer

Nadie aceptará que está en alguno de los puntos anteriores así que insistirán en las razones 1 y 2.

Pero entonces ¿qué se puede hacer?

Hay un modo de superar ese bloqueo.

En cada conversación con usuarios y stakeholders aprendes algo más del sistema.

En algún momento se puede generar un modelo que, sin datos, es aparentemente inútil.

Pero permite validar hipótesis, y comenzar a “opinar” sobre la realidad, teorizando sobre las cosas que están ocultas en una suerte de problema inverso.

Cuando el propietario de los datos ve que le comienzan a acusar de “cosas inciertas” comienza a aportar datos para demostrar que no es eso. Cuantos más datos aporta mejor es el modelo y más cerca se está de la solución.

Algo así como la madre que aventura que el niño está enamorado. Es una hipótesis plausible: o bien el niño está enamorado (en cuyo caso el problema está detectado) o bien permite seguir indagando a la búsqueda del problema.

 

 

 

 

 

 

0 Responses to “Datos quiero, datos tengo: Un diálogo de besugos”



  1. Dejar un comentario

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s




Para recibir las actualizaciones por correo

los blogs que leo

los blogs que leo
abril 2020
L M X J V S D
 12345
6789101112
13141516171819
20212223242526
27282930  

Blog Stats

  • 191.914 hits

El número de suscriptores ya ha llegado a….


A %d blogueros les gusta esto: