Dia 01: Base de dados

Quando se remete ao tema base de dados, é primordial introduzir o conceito de dados em um primeiro momento. Um dado, de forma lacônica, é uma observação documentada e armazenada. Ou seja, é a partir dele que conseguimos gerar informações, que por sua vez auxiliam o processo de tomada de decisões nos negócios.

Os dados podem ser divididos em três classificações: estruturados, semiestruturados e não estruturados. O primeiro, remete-se ao conceito de um banco de dados, com dados organizados e de fácil recuperação e automatização –linhas e colunas em uma tabela – como, por exemplo, um arquivo CSV (comma-separatade values). Já os dados não estruturados não possuem nenhuma estrutura de organização, sem um padrão definido e que contém os dados na sua forma bruta. Dados do Facebook ou Instagram, por exemplo, são formados por textos, imagens e vídeos e, por isso, mais complexos. Por fim, tem-se o dado semiestruturado, que por definição, possui um pouco de cada uma das características das classificações anteriores: alguns padrões e características definidas, mas sem uma estrutura inflexível. Arquivos XML (eXtensible Markup Language) são um bom exemplo, possuindo “referências” e os dados inseridos entre as referências, podendo ser usados para elaboração de currículos, notas fiscais etc. Em resumo:

_config.yml

Isto posto, constrói-se a base conceitual para introdução ao tema de base de dados, ou databases. Também por definição sumária, uma base ou banco de dados simplesmente é um local que registra e armazena uma coleção de dados estruturados. A partir delas, é possível realizar queries, criar relatórios, automatizar processos corporativos etc. São fundamentais para o cotidiano de um ambiente corporativo e completamente inserido no dia a dia de muitas pessoas, direta ou indiretamente.

_config.yml

Todavia, base de dados são comumente confundidas com outros dois locais de armazenamento de dados: DataWarehouse e Data Lake. No próximo post, as diferenças entre os três serão elucidadas.

Obrigado!

Fontes imagens:

https://www.salesforce.com/br/blog/2020/10/data-warehouse-e-data-lake.html

https://blog.k2datascience.com/ds-fundamentals-databases-and-sql-a6ad5562abbc?gi=8f4d77c3c13b

Written on January 20, 2021