<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>Forem: Marcylene Barreto</title>
    <description>The latest articles on Forem by Marcylene Barreto (@marbarret).</description>
    <link>https://forem.com/marbarret</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1410868%2Faa56c525-282c-4cb0-9710-9b4b8d67052f.jpg</url>
      <title>Forem: Marcylene Barreto</title>
      <link>https://forem.com/marbarret</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://forem.com/feed/marbarret"/>
    <language>en</language>
    <item>
      <title>Data Warehouse, Data Mart e Data Lake: Uma Visão Abrangente</title>
      <dc:creator>Marcylene Barreto</dc:creator>
      <pubDate>Mon, 15 Apr 2024 16:33:28 +0000</pubDate>
      <link>https://forem.com/marbarret/data-warehouse-data-mart-e-data-lake-uma-visao-abrangente-4l96</link>
      <guid>https://forem.com/marbarret/data-warehouse-data-mart-e-data-lake-uma-visao-abrangente-4l96</guid>
      <description>&lt;p&gt;Conforme a humanidade ia evoluindo, viu-se a necessidade de registrar todas suas descobertas e conhecimentos, e por volta do quarto milênio a.C., foi criada na Mesopotâmia a escrita. Essa descoberta facilitou a comunicação, a transmissão de conhecimento e foi um passo maior no desenvolvimento da sociedade.&lt;/p&gt;

&lt;p&gt;A partir dessa descoberta, tivemos um crescente número de informações e registros que precisavam ser armazenadas de alguma forma. E antes da criação do computador como conhecemos hoje, as informações eram registradas em fichas de controle, como formulários, e eram armazenadas em pastas ou gavetas em grandes salas.&lt;/p&gt;

&lt;p&gt;Quando tivemos a criação do computador em meados de 1950, houve um crescimento exponencial na quantidade de dados gerados diariamente, e surgiu a necessidade de criação de uma estratégia efetiva para armazenar, gerenciar e analisar esses dados.&lt;/p&gt;

&lt;p&gt;Nesse contexto, surgiram conceitos fundamentais como Data Warehouse, Data Lake, Data Mart, e o processo de ETL (Extração, Transformação e Carga), que desempenham papéis essenciais na gestão e utilização eficaz dos dados.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fw3wd06iz7f377yks91fr.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fw3wd06iz7f377yks91fr.png" alt="description-datas" width="800" height="332"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  O que é DATA LAKE?
&lt;/h2&gt;

&lt;p&gt;Data Lake (lago de dados) é repositório central para dados altamente escalável e flexível  que permite que empresas armazenem dados estruturados, semi-estruturados e dados não estruturados, sem necessidade de estrutura de dados pré-definida. Ele oferece uma grande flexibilidade para análises, pois os dados podem ser transformados e processados conforme necessário.&lt;/p&gt;

&lt;h2&gt;
  
  
  ETL (Extração, Transformação e Carga)
&lt;/h2&gt;

&lt;p&gt;O processo de ETL tem como etapa inicial a Extração, que é responsável pela coleta de dados de diferentes fontes, como banco de dados, arquivos e sistemas externos. A próxima etapa é a Transformação, que é responsável por garanti a qualidade e consistência, fazendo a limpeza e transformação dos dados que foi recebido. E por fim temos a Carga, que faz o armazenamento dos dados transformados para o local de destino, podendo ser no Data Warehouse, Data Mart ou Data Lake.&lt;/p&gt;

&lt;p&gt;O processo de ETL é o responsável pela transferência de arquivos limpos, sem resíduos desnecessários para uma analise mais precisa. &lt;/p&gt;

&lt;h2&gt;
  
  
  O que é DATA WAREHOUSE?
&lt;/h2&gt;

&lt;p&gt;Data Warehouse (armazéns de dados) são sistemas de gerenciamento de dados projetados para armazenar grandes volumes de dados de diversas fontes em um único local, otimizados para análise e consulta. Eles servem como repositório central de dados pré processados e estruturados de forma facilitada para analise e geração de relatórios para tomada de decisões empresariais. São essenciais para aplicações de Business Intelligence (BI), permitindo que as empresas transformem seus dados em informações úteis e acionáveis.&lt;/p&gt;

&lt;h2&gt;
  
  
  O que é DATA MART?
&lt;/h2&gt;

&lt;p&gt;Um Data Mart é um Data Warehouse que atende as necessidades de uma unidade de negocio especifica ou grupo de usuários dentro da organização, como departamento financeiro, venda, etc. Ele contem dados específicos à área especificas de interesse, isso torna os Data Marts mais ágeis e focados do que um Data Warehouse completo, oferecendo uma visão mais detalhada e especializada dos dados. &lt;/p&gt;

&lt;h2&gt;
  
  
  Semelhanças
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;Armazenamento de dados: Todos são projetados para armazenar grandes volumes de dados, de diferentes fontes.&lt;/li&gt;
&lt;li&gt;Processamento: Processa dados  de forma consistente, confiável e útil, permitindo analise de dados úteis para a empresa.&lt;/li&gt;
&lt;li&gt;Preparação: Prepara os dados em formato de arquivos XML para software machine learning ou com geração de relatórios.&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  Características Gerais
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv8eef8g2ju0lf1kii1ag.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/cdn-cgi/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fv8eef8g2ju0lf1kii1ag.png" alt="description" width="800" height="413"&gt;&lt;/a&gt;&lt;/p&gt;

</description>
      <category>data</category>
      <category>datascience</category>
      <category>database</category>
      <category>datastructures</category>
    </item>
  </channel>
</rss>
