De Excel a Data Lakes: mitos del “dato único de verdad”.

La obsesión por el “dato único de verdad” no nació con los ERP ni con los Data Lakes. Su origen está en el corazón del pensamiento moderno. Auguste Comte, padre del positivismo, soñó con una ciencia social capaz de medir la realidad con la misma precisión que la física. Para él, el dato era espejo: transparente, exacto, universal. La administración heredó esa fe: registrar era controlar.


René Descartes reforzó el dogma. Su racionalismo exigía claridad y distinción. El dato debía ser como un axioma: irrefutable, puro, libre de ambigüedad. La estadística del siglo XX consolidó esta aspiración: todo fenómeno debía ser cuantificable, todo número debía representar una verdad.


Pero Michel Foucault rompió el hechizo. En los años setenta, advirtió que todo régimen de verdad está atravesado por relaciones de poder. Los datos no son neutrales: son construcciones. Lo que se mide, lo que se omite, lo que se considera válido, todo responde a estructuras de legitimación. El dato no refleja el mundo: refleja decisiones.


En el terreno técnico, Bill Inmon propuso el Data Warehouse como repositorio único, centralizado, normativo. Ralph Kimball respondió con los Data Marts: distribuidos, flexibles, adaptativos. Detrás de la disputa técnica estaba la misma tensión epistemológica: ¿verdad única o pluralidad reconciliada?


Edgar Morin llevó el debate más lejos. Desde la teoría de la complejidad, denunció la mutilación que implica reducir lo real a una cifra. La simplificación no es claridad: es pérdida. Lo complejo exige aceptar contradicciones, ambigüedades, tensiones.


Nassim Taleb introdujo la noción de antifragilidad. Los sistemas que dependen de una única fuente de verdad son frágiles: un error se propaga, una inconsistencia se convierte en colapso. La robustez no está en la pureza, sino en la capacidad de aprender del ruido.


Niklas Luhmann cerró el círculo. Desde la teoría de sistemas, afirmó que los datos no reflejan la realidad externa, sino que producen una realidad interna: lo que el sistema reconoce como válido, lo que comunica como legítimo. El dato no es ventana, es construcción.


La síntesis es incómoda: no existe el dato único de verdad. Lo que existe son representaciones parciales, contextuales, disputadas. El salto de Excel a Data Lakes no resuelve esta tensión: la amplifica. Más volumen, más velocidad, más complejidad. Pero no más verdad.


La hipótesis que se abre es clara: las organizaciones que insisten en perseguir una verdad única en los datos terminan debilitándose. Las que aceptan la pluralidad, la contradicción y la validación continua pueden volverse antifrágiles. No se trata de encontrar el dato perfecto, sino de construir sistemas que sobrevivan —y mejoren— con datos imperfectos.


En el próximo artículo veremos cómo esta tensión se encarna en la práctica: la historia de un gigante latinoamericano que casi colapsa por confiar en datos que nunca fueron ciertos.

Sign in to leave a comment
¿Para qué sirve un ERP si no puedes confiar en los datos?