Ir al contenido principal

What is ETL? (Brief English & Spanish)

In response to the question I made a new colleague in BI.


What is ETL?
To obtain the data warehouse sequentially develop the data extraction, processing, and finally loading into the reservoir. The extraction process involves obtaining information from different sources (databases and operational files), both internally and externally, through data management tools. We must transform the data into those required for deposit. The process consists of filtering, cleaning, cleansing, standardization and integration of information. This should be done, since the operational databases are designed to support multiple production applications often differ in format, then, may be the same data elements, but names and inconsistent formats and encodings. All these inconsistencies should be resolved before taking the last step of this process that corresponds to the loading of data into the data warehouse.

Reference Book:
The Data Warehouse ETL Toolkit: Practical Techniques for Extracting, Cleanin (Paperback)






in Spanish.

Para obtener el data warehouse se desarrollan en forma secuencial la extracción de los datos, su transformación y finalmente su carga en el depósito. El proceso de extracción consiste en la obtención de la
información desde las distintas fuentes (bases de datos y archivos operacionales), tanto internas como externas, mediante herramientas de gestión de datos. Es necesario transformar los datos en los requeridos para el depósito. El proceso consiste en filtrado, limpieza, depuración, homogeneización e integración de la información. Esto debe hacerse, ya que las bases de datos operacionales, diseñadas para el soporte de varias aplicaciones de producción, frecuentemente difieren en el formato, entonces, pueden tenerse los mismos elementos de datos, pero nombres y formatos y codificaciones incoherentes.





Entradas más populares de este blog

Bi Open Source. What I choose?

Las posibilidades son: SapgoBI Vanilla OpenI Hay mas pero estas son las mejores. SpagoBI En el contexto Open Source Business Intelligence, frecuentemente nos encontramos que la gran mayoría de proveedores tienen una versión para la comunidad y otra profesional. Rápidamente podemos citar ejemplos como Pentaho, JasperSoft o Talend. No es un modelo nuevo en este ámbito. Por ejemplo, Red Hat o MySQL (ahora posesión de Oracle) también lo practican. ¿En qué consiste? Existe una versión open source comunitaria con un conjunto de funcionalidades bien definidas, acotadas y plenamente operativas. Y una versión profesional que presenta o bien más funcionalidades que la otra versión o bien una versión mejorada de las mismas funcionalidades. Por poner un ejemplo, Pentaho soporta la creación de Dashboards, pero sólo la versión profesional presenta un Dashboard Designer Ad-hoc. Dichas funcionalidades (premium) sólo pueden ser accedidas mediante la adquisición de una subscripción o de soporte....

Pentaho review - Does anyone have any experience? / Revisando Pentaho ¿Alguna experiencia?

Developing / En Desarrollo....