<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-05T11:48:54Z</responseDate><request verb="GetRecord" identifier="oai:www.recercat.cat:2117/415270" metadataPrefix="rdf">https://recercat.cat/oai/request</request><GetRecord><record><header><identifier>oai:recercat.cat:2117/415270</identifier><datestamp>2025-07-23T05:47:04Z</datestamp><setSpec>com_2072_1033</setSpec><setSpec>col_2072_452951</setSpec></header><metadata><rdf:RDF xmlns:rdf="http://www.openarchives.org/OAI/2.0/rdf/" xmlns:ow="http://www.ontoweb.org/ontology/1#" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:ds="http://dspace.org/ds/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:doc="http://www.lyncode.com/xoai" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/rdf/ http://www.openarchives.org/OAI/2.0/rdf.xsd">
   <ow:Publication rdf:about="oai:recercat.cat:2117/415270">
      <dc:title>Comparació de rendiment i costos entre Delta Lake i Snowflake</dc:title>
      <dc:creator>Sánchez Alonso, Violeta</dc:creator>
      <dc:subject>Àrees temàtiques de la UPC::Informàtica::Enginyeria del software</dc:subject>
      <dc:subject>SQL (Computer program language)</dc:subject>
      <dc:subject>Cloud computing</dc:subject>
      <dc:subject>Performance</dc:subject>
      <dc:subject>Benchmarking (Management)</dc:subject>
      <dc:subject>Delta Lake</dc:subject>
      <dc:subject>Snowflake</dc:subject>
      <dc:subject>anàlisis empresarial</dc:subject>
      <dc:subject>SQL</dc:subject>
      <dc:subject>emmagatzematge de dades al núvol</dc:subject>
      <dc:subject>rendiment</dc:subject>
      <dc:subject>costos</dc:subject>
      <dc:subject>índex de referència</dc:subject>
      <dc:subject>Delta Lake</dc:subject>
      <dc:subject>Snowflake</dc:subject>
      <dc:subject>business analysis</dc:subject>
      <dc:subject>SQL</dc:subject>
      <dc:subject>cloud data storage</dc:subject>
      <dc:subject>performance</dc:subject>
      <dc:subject>costs</dc:subject>
      <dc:subject>benchmark</dc:subject>
      <dc:subject>SQL (Llenguatge de programació)</dc:subject>
      <dc:subject>Computació en núvol</dc:subject>
      <dc:subject>Rendiment</dc:subject>
      <dc:subject>Referenciació (Economia)</dc:subject>
      <dc:description>Aquest treball presenta una comparació detallada entre les tecnologies Delta Lake i Snowflake per a l'anàlisi de dades emmagatzemades al núvol. Mitjançant l'ús del benchmark TPC-DS, s'avalua el rendiment de les dues plataformes en termes de velocitat de resposta, eficiència en la gestió de dades i capacitat per satisfer les necessitats analítiques empresarials. Les dades emmagatzemades a Azure Data Lake Storage (ADLS) s'integren tant amb Snowflake com amb Databricks, utilitzant tècniques específiques per a cada plataforma. Els experiments es basen en un conjunt de mètriques clau, com la mida de còmput, el temps d'execució i el cost, per avaluar el rendiment i els costos associats amb cada operació. A més, es prenen mesures per assegurar la comparabilitat dels clústers de computació entre les dues plataformes i s'evita l'ús de memòria cau per garantir la consistència dels resultats. L'anàlisi dels resultats permetrà arribar a una conclusió informada sobre les capacitats i limitacions de cada tecnologia per a l'anàlisi de dades empresarials.</dc:description>
      <dc:description>This study provides an exhaustive comparison between Delta Lake and Snowflake technologies for cloud-based data analysis. Leveraging the TPC-DS benchmark, the performance of both platforms is evaluated across criteria such as response time, data management efficiency, and their suitability for fulfilling enterprise analytical requirements. The integration of data stored in Azure Data Lake Storage (ADLS) with Snowflake and Databricks is feasible by employing platform-specific techniques. Experiments are designed around key metrics, including compute size, execution duration, and cost, aiming to measure performance and associated expenses for each operation. Moreover, measures are applied to ensure the comparability of compute clusters between both platforms and avoid caching to guarantee result consistency. The analysis of findings will lead to a well-founded conclusion regarding the strengths and weaknesses of each technology for enterprise-grade data analysis.</dc:description>
      <dc:date>2024-06-26</dc:date>
      <dc:type>Bachelor thesis</dc:type>
      <dc:rights>Open Access</dc:rights>
      <dc:publisher>Universitat Politècnica de Catalunya</dc:publisher>
   </ow:Publication>
</rdf:RDF></metadata></record></GetRecord></OAI-PMH>