¿Qué es una base de datos vertical?

Una base de datos vertical es aquella en la que el diseño físico de los datos es columna por columna en lugar de fila por fila. En lugar de organizarse en estructuras de registro horizontales y procesarse verticalmente, los datos de una base de datos vertical se organizan en estructuras verticales, conocidas como árboles de predicados o árboles P, y se procesan horizontalmente.

Procesamiento de datos

Las bases de datos horizontales son adecuadas para aplicaciones donde el resultado solicitado es un conjunto de registros horizontales, pero menos para aplicaciones como la minería de datos, donde los investigadores suelen estar interesados ​​en resultados que se pueden expresar de forma sucinta. Los árboles P, por otro lado, son muy adecuados para la minería de datos. Los árboles P generalmente se crean descomponiendo cada atributo o columna de una tabla de registros horizontales en vectores de bits separados o estructuras de datos de matriz. Los árboles P pueden ser unidimensionales, bidimensionales o multidimensionales; si los datos que se almacenarán en la base de datos tienen dimensiones naturales, por ejemplo, datos geoespaciales o información geográfica, las dimensiones del árbol P se corresponden con las de los datos.

Actuación

Los datos de una base de datos vertical se procesan a través de operadores lógicos rápidos, como Y, O, O exclusivo y complemento. Además, al organizar los datos en columnas en lugar de en filas, es posible ejecutar consultas o búsquedas en los datos sin acceder a las páginas de un disco duro que no se ven afectadas por la consulta y, por lo tanto, aumentan la velocidad de recuperación de datos. . Esta es una consideración importante cuando se extraen datos en repositorios de datos muy grandes.

Tamaño de página

Otra ventaja de las bases de datos verticales es que permiten almacenar datos en páginas grandes. Un tamaño de página grande significa que se puede recuperar una gran cantidad de elementos de datos relevantes en una sola operación de lectura. Por el contrario, una sola operación de lectura en una base de datos horizontal recupera no solo elementos de datos relevantes, sino también atributos o columnas que no son relevantes para la consulta en cuestión y favorecen los tamaños de página pequeños.

Aplicaciones científicas

Las bases de datos verticales han recibido un renovado interés por parte de la comunidad científica en los últimos años. El número de usuarios simultáneos en las aplicaciones de bases de datos científicas suele ser mucho menor que en las aplicaciones comerciales, pero los usuarios tienden a enviar consultas imprevistas más complejas. Además, las aplicaciones de bases de datos científicas normalmente deben proporcionar una respuesta más automatizada a consultas complejas debido a la ausencia de personal de soporte de bases de datos y sistemas. Los usuarios científicos generalmente prefieren trabajar con sistemas informáticos internos dedicados, por lo que las aplicaciones de bases de datos científicas deben ser portátiles entre varios modelos de computadora. Las bases de datos verticales son mejores, en todos estos aspectos, que sus contrapartes horizontales.