Implementação de uma arquitetura de data lakehouse utilizando pentaho data integration e hadoop
dc.contributor.advisor | Musa, Daniela Leal [UNIFESP] | |
dc.contributor.advisorLattes | http://lattes.cnpq.br/8606503911561836 | pt_BR |
dc.contributor.author | Silva, Pedro Gabriel da [UNIFESP] | |
dc.date.accessioned | 2023-08-03T11:33:52Z | |
dc.date.available | 2023-08-03T11:33:52Z | |
dc.date.issued | 2023-07-12 | |
dc.description.abstract | Perante a crescente e vertiginosa ampliação do volume de dados na era contemporânea, tornam-se imprescindíveis estruturas capazes de armazenar e manipular os dados provenientes das tecnologias de Big Data, adaptando-os para atender às demandas de Business Intelligence. Diante desse contexto, o presente trabalho almeja a concepção de uma arquitetura personalizada, fundamentada nas tecnologias Hadoop e Pentaho Data Integration, perante a adaptação do modelo lambda retratado na literatura de Data Lake para o contexto de Data Lakehouse. Tal desenvolvimento englobou a consolidação das camadas iniciais de ingestão e armazenamento de dados brutos e apurados, empregados através do fluxo de dados em lote, assim como a análise das tecnologias a serem utilizadas para extensão do desenvolvimento entre as camadas subsequentes de dados em tempo real, seguindo um modelo de código aberto de ponta a ponta para ingestão, armazenamento e visualização dos dados. Por fim, foram coligidas informações referentes ao produto desenvolvido, assim como realizadas as devidas análises para validar o êxito do projeto. | pt_BR |
dc.description.sponsorship | Não recebi financiamento | pt_BR |
dc.emailadvisor.custom | musa@unifesp.br | pt_BR |
dc.format.extent | 67 f. | pt_BR |
dc.identifier.uri | https://repositorio.unifesp.br/handle/11600/68935 | |
dc.language | por | pt_BR |
dc.publisher | Universidade Federal de São Paulo | pt_BR |
dc.rights | info:eu-repo/semantics/openAccess | pt_BR |
dc.subject | Data Lakehouse | pt_BR |
dc.subject | Hadoop | pt_BR |
dc.subject | HDFS | pt_BR |
dc.subject | Pentaho | pt_BR |
dc.subject | Arquitetura | pt_BR |
dc.subject | Dados | pt_BR |
dc.title | Implementação de uma arquitetura de data lakehouse utilizando pentaho data integration e hadoop | pt_BR |
dc.type | info:eu-repo/semantics/bachelorThesis | pt_BR |
unifesp.campus | Instituto de Ciência e Tecnologia (ICT) | pt_BR |
unifesp.graduacao | Engenharia de Computação | pt_BR |
Arquivos
Pacote Original
1 - 1 de 1
Carregando...
- Nome:
- Pedro_Gabriel_da_Silva_TCC_2023_Implementacao_de_uma_arquitetura_de_Data_Lakehouse_utilizando_Pentaho_Data_Integration_e_Hadoop.pdf
- Tamanho:
- 24.24 MB
- Formato:
- Adobe Portable Document Format
- Descrição:
Licença do Pacote
1 - 1 de 1
Carregando...
- Nome:
- license.txt
- Tamanho:
- 5.71 KB
- Formato:
- Item-specific license agreed upon to submission
- Descrição: