Implementação de uma arquitetura de data lakehouse utilizando pentaho data integration e hadoop

dc.contributor.advisorMusa, Daniela Leal [UNIFESP]
dc.contributor.advisorLatteshttp://lattes.cnpq.br/8606503911561836pt_BR
dc.contributor.authorSilva, Pedro Gabriel da [UNIFESP]
dc.date.accessioned2023-08-03T11:33:52Z
dc.date.available2023-08-03T11:33:52Z
dc.date.issued2023-07-12
dc.description.abstractPerante a crescente e vertiginosa ampliação do volume de dados na era contemporânea, tornam-se imprescindíveis estruturas capazes de armazenar e manipular os dados provenientes das tecnologias de Big Data, adaptando-os para atender às demandas de Business Intelligence. Diante desse contexto, o presente trabalho almeja a concepção de uma arquitetura personalizada, fundamentada nas tecnologias Hadoop e Pentaho Data Integration, perante a adaptação do modelo lambda retratado na literatura de Data Lake para o contexto de Data Lakehouse. Tal desenvolvimento englobou a consolidação das camadas iniciais de ingestão e armazenamento de dados brutos e apurados, empregados através do fluxo de dados em lote, assim como a análise das tecnologias a serem utilizadas para extensão do desenvolvimento entre as camadas subsequentes de dados em tempo real, seguindo um modelo de código aberto de ponta a ponta para ingestão, armazenamento e visualização dos dados. Por fim, foram coligidas informações referentes ao produto desenvolvido, assim como realizadas as devidas análises para validar o êxito do projeto.pt_BR
dc.description.sponsorshipNão recebi financiamentopt_BR
dc.emailadvisor.custommusa@unifesp.brpt_BR
dc.format.extent67 f.pt_BR
dc.identifier.urihttps://repositorio.unifesp.br/handle/11600/68935
dc.languageporpt_BR
dc.publisherUniversidade Federal de São Paulopt_BR
dc.rightsinfo:eu-repo/semantics/openAccesspt_BR
dc.subjectData Lakehousept_BR
dc.subjectHadooppt_BR
dc.subjectHDFSpt_BR
dc.subjectPentahopt_BR
dc.subjectArquiteturapt_BR
dc.subjectDadospt_BR
dc.titleImplementação de uma arquitetura de data lakehouse utilizando pentaho data integration e hadooppt_BR
dc.typeinfo:eu-repo/semantics/bachelorThesispt_BR
unifesp.campusInstituto de Ciência e Tecnologia (ICT)pt_BR
unifesp.graduacaoEngenharia de Computaçãopt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Pedro_Gabriel_da_Silva_TCC_2023_Implementacao_de_uma_arquitetura_de_Data_Lakehouse_utilizando_Pentaho_Data_Integration_e_Hadoop.pdf
Tamanho:
24.24 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
5.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: