O que é um banco de dados vertical?

Um banco de dados vertical é aquele em que o layout físico dos dados é coluna por coluna, em vez de linha por linha. Em vez de serem organizados em estruturas de registro horizontais e processados ​​verticalmente, os dados em um banco de dados vertical são organizados em estruturas verticais, conhecidas como árvores de predicados ou árvores P, e processados ​​horizontalmente.

Mineração de dados

Os bancos de dados horizontais são adequados para aplicativos em que o resultado solicitado é um conjunto de registros horizontais, mas nem tanto para aplicativos como mineração de dados, onde os pesquisadores normalmente estão interessados ​​em resultados que podem ser expressos de forma sucinta. As árvores P, por outro lado, são adequadas para mineração de dados. As árvores P são geralmente criadas decompondo cada atributo, ou coluna, de uma tabela de registros horizontais em vetores de bits separados ou estruturas de dados de matriz. As árvores P podem ser unidimensionais, bidimensionais ou multidimensionais; se os dados a serem armazenados no banco de dados têm dimensões naturais - por exemplo, dados geoespaciais ou informações geográficas - as dimensões da árvore P correspondem às dos dados.

Desempenho

Os dados em um banco de dados vertical são processados ​​por meio de operadores lógicos rápidos, como AND, OR, OR exclusivo e complemento. Além disso, ao organizar os dados por coluna em vez de por linha, é possível executar consultas ou pesquisas nos dados sem acessar páginas em um disco rígido que não são afetadas pela consulta e, assim, aumentar a velocidade de recuperação de dados . Esta é uma consideração importante durante a mineração de dados em repositórios de dados muito grandes.

Tamanho da página

Outra vantagem dos bancos de dados verticais é que eles permitem que os dados sejam armazenados em páginas grandes. Um tamanho de página grande significa que um grande número de itens de dados relevantes podem ser recuperados em uma única operação de leitura. Por outro lado, uma única operação de leitura em um banco de dados horizontal recupera não apenas itens de dados relevantes, mas também atributos ou colunas que não são relevantes para a consulta em questão e favorecem tamanhos de página pequenos.

Aplicações Científicas

As bases de dados verticais têm recebido um interesse renovado da comunidade científica nos últimos anos. O número de usuários simultâneos em aplicativos de banco de dados científicos é normalmente muito menor do que em aplicativos comerciais, mas os usuários tendem a enviar consultas mais complexas e imprevistas. Além disso, os aplicativos de banco de dados científicos geralmente devem fornecer uma resposta mais automatizada a consultas complexas devido à ausência de banco de dados e equipe de suporte de sistemas. Os usuários científicos geralmente preferem trabalhar com sistemas de computador internos dedicados, portanto, os aplicativos de banco de dados científicos precisam ser portáteis entre vários modelos de computador. Os bancos de dados verticais são melhores, em todos esses aspectos, do que seus correspondentes horizontais.