Arquitectura de inteligencia de negocios en la nube para las PYMES del rubro de actividades de diseño especializado en El Salvador J. De Paz, M. Ramos, M. Reyes Universidad Don Bosco, El Salvador sjdpm2@gmail.com, mramos_89@outlook.com, ivanreyes@outlook.com Abstract - Small and medium-sized enterprises (SMEs) often struggle to harness their data to make informed business decisions. Business Intelligence (BI) solutions can provide valuable insights, but the cost and complexity of implementation can be overwhelming. Fortunately, cloud technology offers a cost-effective and scalable solution for SMEs seeking to implement a BI solution. This investigation delves into the architectural design of a cloud-based BI solution for SMEs taking a real use case of an SME specialized in graphic design. By examining the latest advancements in BI and cloud technology, we aim to demonstrate how SMEs can leverage cloud-based BI to gain a competitive edge. Our execution plan focuses on practical aspects such as selecting appropriate technical components in the cloud and implementing the architecture. Finally, our conclusions offer recommendations for SMEs seeking to implement a cost-effective and efficient BI solution in the cloud. Overall, the objective is to provide valuable insights for SMEs seeking to leverage data-driven insights to drive business growth. By exploring the state of the art in BI and cloud technology, we discuss how cloud-based BI can provide SMEs with the necessary tools to make informed decisions and gain a competitive edge. Keywords – Dashboards, Data mart, Data warehouse, ETL, ELT, Business Intelligence, Inmon data model, Kimball data model, Data vault, Power BI, Tableau, Zoho Analytics, SAP Analytics Cloud, Google Drive, Google BigQuery. I. INTRODUCCIÓN En el entorno empresarial actual está en constante cambio, la capacidad de administrar y analizar de manera efectiva grandes volúmenes de datos es esencial para la toma de decisiones oportunas y eficaces. La inteligencia de negocios (BI) tradicionalmente ha sido implementado por las organizaciones por décadas [1]. A menudo se define como un concepto general. que incluye un conjunto de tecnologías y software que permite a los usuarios acceder y analizar datos para tomar mejores decisiones Otro concepto importante son los sistemas de inteligencia de negocios (BIS) se definen como un conjunto de procesos, tecnologías y arquitecturas que se utilizan en diferentes ambientes de negocio [2]. BIS ayuda a convertir información cruda en información útil para la toma de decisiones. Esta información puede ser utilizada por cualquier organización para impulsar las ganancias. BIS puede ser una sola una pieza de software o un conjunto de software más específicos que finalmente ayudan a transformar los datos en conocimiento e inteligencia procesable en beneficio de las organizaciones. Se puede utilizar para apuntar a los clientes de manera efectiva, o para ayudar en la venta de los productos o servicios de una mucho mejor manera. Sin embargo, a medida que aumenta el volumen y la complejidad de los datos, el enfoque tradicional de BI se volvió insuficiente. El surgimiento de tecnologías de big data, como las bases de datos Hadoop y NoSQL, creó nuevas oportunidades para que las organizaciones capturen y analicen grandes cantidades de datos de diversas fuentes. Esto condujo a la evolución de BI hacia un conjunto más completo de herramientas y técnicas que abarcan almacenamiento de datos, integración de datos, visualización de datos y análisis avanzado. Otra tendencia en BI es el creciente énfasis en BI de autoservicio. Las herramientas modernas de BI están diseñadas para ser intuitivas y fáciles de usar, lo que permite a los usuarios del negocio explorar y analizar datos sin depender de TI o analistas de datos. decisiones más basadas de BI tiene el potencial de impulsar una adopción más amplia de BI en todas las organizaciones y permitir una toma de decisiones más basada en datos en todos los niveles. Además, el auge de la computación en la nube ha transformado aún más la forma en que se entrega y consume BI. Las soluciones de BI basadas en la nube han hecho que sea más fácil y rentable para las organizaciones de todos los tamaños acceder y aprovechar las capacidades de BI, sin necesidad de realizar inversiones iniciales significativas en hardware y software. Si bien tradicionalmente se asocian con empresas más grandes, las soluciones de BI son cada vez más importantes para las pequeñas y medianas empresas (PYME) que buscan obtener una ventaja competitiva en sus respectivos mercados. Sin embargo, implementar una solución de BI efectiva puede ser un desafío para las PYME, ya que a menudo carecen de los recursos y la experiencia necesarios para diseñar e implementar una solución internamente. Además, la complejidad y el costo de implementar una solución de BI pueden ser abrumadores para las PYMES con presupuestos limitados. A pesar de estos desafíos, no se puede subestimar la importancia de BI para las PYMES. En los últimos años, los avances tecnológicos y la disponibilidad de soluciones basadas en la nube han hecho que BI sea más accesible para las PYMES. Como resultado, las PYMES ahora pueden aprovechar BI para obtener información sobre sus operaciones, identificar nuevas oportunidades de mercado e impulsar el crecimiento. Algunos beneficios clave que resultan de la implementación de BI son [3]: • La posibilidad de analizar data de múltiples fuentes de datos y usando varias dimensiones. • Habilitar a la parte gerencial para la toma de decisiones inteligente a través de la identificación de patrones de datos transaccionales del negocio. • Mejora en la precisión de la predictibilidad de tendencias de negocio. • Mejora en la eficiencia y la productividad a través de la identificación de problemas. II. ESTADO DEL ARTE A. Impacto de BI en las organizaciones Cualquier organización que implemente un sistema de inteligencia de negocios (BIS) puede lograr varios beneficios. BIS ha contribuido directamente a las organizaciones a convertirse en un negocio de primer nivel, especialmente en el área de toma de decisiones. También ha contribuido a las áreas gerenciales de las organizaciones para tomar decisiones basadas en conjuntos de datos pertinentes y señalar nuevas oportunidades para el desarrollo de los nuevos negocios de mejor manera en comparación con sus competidores. Diferentes tipos de usuarios hacen uso de BIS, se pueden clasificar en cuatro tipos de usuarios: analistas de datos, empleados de TI, directores y ejecutivos de alto nivel y usuarios de negocios. Los analistas utilizan principalmente la información del BIS para desarrollar estrategias de negocio basadas en las estadísticas que se han derivado de los diferentes sistemas que están presentes en la organización. Los empleados de TI también hacen uso de la infraestructura de BIS para tomar decisiones rápidas y decisiones efectivas para la organización. Los usuarios de negocio trabajan con diferentes conjuntos de datos para crear tableros y predefinidos los conjuntos de información que se utilizan en diferentes escenarios. La efectividad de BI depende de la planificación, gestión y prácticas analíticas. La habilidad de la organización para explorar y utilizar la información disponible conduce a desarrollar un BIS eficaz. Puede ser visto como un factor interno y por lo tanto tiene la capacidad para influir en el desempeño de la organización. B. Medición del impacto de BI en las organizaciones Es necesario definir los criterios que se utilizarán como medidas de éxito en este contexto. DeLone, McLean y otros autores [4] propusieron el conocido modelo D&M para medir el éxito de un sistema informático El modelo D&M, considera las dimensiones de calidad de la información, calidad del servicio, uso del sistema, satisfacción del usuario, aspectos organizacionales e individuales. El modelo D&M más actual proporciona una lista de categorías de éxito de sistemas de información en conjunto con medidas clave que se utilizarán en cada categoría; por ejemplo, categoría de calidad del sistema podría usar medidas como la facilidad de uso, flexibilidad del sistema, confiabilidad del sistema, facilidad de aprendizaje, flexibilidad y tiempo de respuesta; calidad de la información podría utilizar medidas tales como relevancia, precisión, usabilidad e integridad; calidad del servicio, medidas como capacidad de respuesta, precisión, confiabilidad y competencia técnica; uso del sistema, medidas tales como cantidad, frecuencia, naturaleza, extensión y propósito de uso; satisfacción del usuario podría medirse por un solo elemento o mediante escalas de atributos múltiples; los beneficios netos podrían medirse a través del aumento de las ventas, la reducción de costos o la mejora de la productividad. Medir la satisfacción del usuario La satisfacción del usuario es una de las medidas más utilizadas en la evaluación de SI, es ampliamente reconocido como una medida crítica del éxito de SI. La satisfacción del usuario también se considera como la suma de sentimientos o actitudes de un usuario hacia un número de factores relevantes para una situación específica. Para que se consideren exitosas, las soluciones de BI, como los informes y los tableros, deben cumplir criterios que conduzcan a una satisfacción positiva del usuario. Existe un modelo ampliamente utilizado para medir la satisfacción del usuario final (EUCS) que cubre factores clave relacionados con la perspectiva del usuario [2]. El enfoque incluye 12 atributos en forma de preguntas que cubren cinco aspectos de la satisfacción: contenido, precisión, formato, facilidad de uso y oportunidad. En el mismo estudio se propone una encuesta con interrogantes que toman en cuenta estos aspectos de satisfacción, pero enfocado a BI. • ¿El contenido informativo de los informes satisface sus necesidades? • ¿Son precisos el sistema de BI y sus informes? • ¿Está satisfecho con la precisión del sistema de BI y los informes asociados? • ¿Cree que el resultado se presentan los informes es un formato útil? • ¿El sistema de BI y los informes asociados tienen interfaces amigables? • ¿El sistema de BI y los informes asociados son fáciles de usar? • ¿Obtiene la información que necesita a tiempo? • ¿El sistema de BI y los informes asociados proporcionan información actualizada? • ¿Está satisfecho con el contenido descriptivo? • ¿Es el sistema de BI lo suficientemente flexible con respecto a la funcionalidad del contenido? • ¿La funcionalidad de contenido es lo suficientemente rápida para cumplir con los requisitos de negocio de manera oportuna? Existen otros modelos para poder evaluar el desempeño global de la organización [3], Balanced Scorecard (BSC) es el modelo uno de los modelos más utilizado, otro modelo a considerar es el European Foundation for Quality Management Excellence Model (EFQM) y el Baldrige Criteria for Performance Excellence Model. Asimismo, existen otros modelos resaltados, como las Matrices de Madurez de Capacidades (CMM), la Pirámide de Desempeño, y la Medición de Progreso y Desempeño Efectivo (EP2M). C. Marcos de trabajo En el mismo estudio [3], se propone el marco de implementación de sistema de gestión del rendimiento (PMSIF), que tiene como objetivo facilitar el análisis de un extremo a otro de la implementación de un sistema de gestión de rendimiento (PMS) en una organización. El marco propuesto es holístico y cubre todos los aspectos de la implementación de un PMS (personas, procesos y tecnología), consta de seis etapas: inicio, adopción, adaptación, aceptación, rutinización e infusión. En, se propone un marco utilizando BI e inteligencia competitiva, el objetivo de este marco es la creación de un FODA que se compone de un análisis de fortalezas, oportunidades, debilidades y amenazas, y el desarrollo de objetivos de negocio utilizando las cuatro áreas de BSC: aprendizaje y crecimiento, rendimiento del proceso interno, rendimiento del cliente y rendimiento financiero. D. Retos de la implementación Optimizar las estrategias y potenciar los procesos de toma de decisiones en las pequeñas y medianas empresas es lo que ofrece la revolución de la información a través de BI. Poco a poco las organizaciones se están abriendo paso a la evolución de los datos para generar un mejor concepto de planificación y planificación interna y externa dentro del negocio. Realizar cambios de cualquier índole genera ciertas dudas y pone a prueba la capacidad de los involucrados. Implementar una solución BI como parte de la estrategia de la empresa implica considerar y superar una serie de retos que conllevan amenazas, pero también una puerta hacia grandes oportunidades de optimización a la hora de tomar decisiones de la empresa. Las pequeñas y medianas empresas intentan diferenciarse de sus competidores a través de la innovación. La mayoría de las pequeñas y medianas empresas, están más enfocadas en reducir costos en comparación con tratar de encontrar formas de aumentar los ingresos. Es decir, que están más enfocadas en ser más eficientes en reducir los costos y así, generar más ganancias. Esto manifiesta aún más el desafío de la falta de conocimiento sobre cómo BI puede ayudar a las empresas a encontrar nuevas formas de aumentar el crecimiento de los ingresos o utilizar análisis para guiar las acciones. Se hizo un estudio en las pequeñas y medianas empresas utilizando el análisis factorial exploratorio (EFA) para identificar la percepción de los beneficios de BI [1], los desafíos al introducir BI y los factores que describen la constitución interna y el comportamiento empresarial de los sujetos de investigación. El método de recopilación de datos se realizó a través de un cuestionario en línea que cubre una amplia gama de temas relacionados con BI. Sobre la base de sus resultados, proporcionan tres factores generales de desafío de BI para las PYME. Estos retos son los siguientes: El primer factor de desafío de BI depende del uso que se le dará. Esto implica afirmaciones como que los sistemas son demasiado complicados con procesos complejos al crear informes de BI. Además, las competencias de los empleados también se plantearon como un desafío y se identificó la necesidad de capacitación. El segundo desafío dependía de la solución y la calidad de los datos. Esto implicó problemas como errores de software, soporte insuficiente, seguridad inadecuada, datos contradictorios y problemas de rendimiento. Las pequeñas y medianas empresas creen poseer datos sobre casi todas sus operaciones. En general dichos datos están bajo un sistema u otro medio. Sin embargo, al profundizar en partes más concretas de sus procesos de fabricación, las empresas comienzan a percibir áreas en las que faltaban datos por completo. El tercer factor de desafío fueron los desafíos con las interfaces. Este factor contenía problemas como funcionalidades limitadas de exportación de datos y combinación de datos. Este problema resultó en la necesidad de importar/exportar datos manualmente, lo que consume más tiempo que un proceso automático y puede provocar que los datos no estén actualizados. Se identificaron que existen otros factores que afectan la planificación de las pequeñas y medianas empresas al momento de querer adoptar o implementar soluciones BI [5]: • Las soluciones de BI suelen ser costosas; por ejemplo, una solución de BI basada en la nube suele costar al menos $500 al mes por usuario. • Si bien hay disponibles herramientas de BI listas para usar, la curva de aprendizaje de dichas herramientas para usuarios comerciales no técnicos suele ser engorrosa. • El rendimiento de los proyectos de BI es difícil de medir. Después de la implementación de BI, se necesita tiempo para ver los resultados. La falta de estandarización en el campo de BI dificulta la elección de los KPI para medir el rendimiento. Sin embargo, una empresa puede crear sus propios estándares de BI, aprendiendo y optimizando constantemente las soluciones. • Alojar una solución de BI requiere el apoyo de una infraestructura de hardware no trivial y, a menudo, costosa. • Uno de los desafíos que afrontan las pequeñas y medianas empresas es el tratar de entender cómo aprovechar la información que poseen para obtener valor comercial. Por lo general, las pequeñas y medianas empresas carecen de el patrocinio ejecutivo en muchos aspectos. Algunas empresas la junta directiva se niega al cambio y esperan que se opere como siempre se ha hecho sin poder visualizar los grandes beneficios que implicar la implementación del BI. • Si bien hay una amplia gama de soluciones de BI disponibles, las pequeñas y medianas empresas a menudo carecen de un conocimiento profundo de BI para seleccionar la solución más adecuada para abordar las necesidades del negocio. • La generación de BI es a menudo una tarea no trivial que requiere un buen conocimiento y comprensión del modelado de bases de datos y el almacenamiento de datos. Tales conocimientos técnicos a menudo no están fácilmente disponibles en la mayoría de las pequeñas y medianas empresas. E. Partes involucradas Antes de definir los roles y la interacción entre las distintas áreas interesadas, es necesario consolidar la razón de ser de la implementación de BI, cual es la demanda que tiene la empresa de esta tecnología y que aspectos serán resueltos con su implementación. En [6] se define la ingeniería de demanda como una actividad que aborda todos los requisitos, incluyendo la definición de todas las actividades del proyecto en un documento de requisitos, recopilación de información empresarial mediante el uso de tecnologías y métodos relacionados, análisis de problemas relacionados con el usuario e integración de las distintas perspectivas de los usuarios. Como en todo proyecto, la interacción entre las partes interesadas es un factor de éxito para la implementación de la inteligencia de negocios (BI), es por eso por lo que algunos escritores como Ramesh y Ramakrishna [7] plantean que debe existir un ecosistema que sustente el proyecto y reduzca la probabilidad de fallo, dicho ecosistema tiene roles definidos para las distintas áreas como se detalla a continuación: • Unidad de negocio: se refiere al área que toma las decisiones, los patrocinadores y el área administrativa. El objetivo principal de la inteligencia de negocio es facilitar la toma de decisiones y que la información provista se transforme en una mayor tasa de retorno, por lo que esta unidad será la encargada de orientar el proyecto según los objetivos estratégicos de la empresa. • Equipo de ciencia de datos: incluyendo estadistas, desarrolladores, modeladores de datos, analistas y administradores de bases de datos. Se encargará de desarrollar una arquitectura que pueda suplir las metas previamente establecidas por la unidad de negocio. • Equipo de IT: Comprendiendo a los especialistas en las configuraciones de red, servidores y seguridad informática, que brindaran soporte al equipo de ciencia de datos para sortear cualquier dificultad. • Administrador de proyecto: Una persona encargada de orquestar y verificar el progreso de la solución, planear las comunicaciones, estimar riesgos y evaluar desempeño, puede inclusive ser más de una persona y formar un equipo que realice esta función. F. Arquitecturas de BI Distintos autores han planteado arquitecturas para la implementación de la inteligencia de negocios en las empresas. Estas arquitecturas responden a un contexto en específico de implementación, herramientas disponibles, estandarizaciones o preferencias personales sobre como estructurar la solución. Los componentes clave para una arquitectura simple y funcional con orígenes de datos homogéneos o un solo origen de datos son [5]: • Data Source: Origen de datos único o uniforme. • ETL Process: Un proceso de extracción, transformación y carga sencillo. • Data warehouse o Data mart: Una base de datos o herramienta de almacenamiento de los datos transformados, no se especifican más componentes en esta etapa debido a la simplicidad del diseño. • Presentación: Herramienta para realizar los dashboards que se conecta directamente al DWH. En el siguiente modelo de arquitectura [2] se está considerado que los orígenes de datos son heterogéneos y son integrados previamente en un almacén de datos, también se utiliza la técnica de consulta y análisis para obtener más información sobre la organización y sus clientes. • Operational database: Orígenes de datos heterogéneos. • ETL: Proceso de ETL que extrae de diferentes orígenes de datos, estandariza los datos y los inserta en un almacén de datos. • Data warehouse: Almacén de datos que contiene los datos ordenados que han sido estandarizados con el ETL. • OLAP: Para permitir consultar grandes volúmenes de datos, según las necesidades del cliente. • Query & Reporting tool: Donde se realizarán consultas a los datos del DWH que ya ha sido estructurado, esta parte contiene las herramientas de visualización, que serían por ejemplo Power BI o Tableau. El modelo de arquitectura más completo y complejo [8], siempre considera que los orígenes de datos son heterogéneos, incluyen varios componentes para manejar distintas granularidades y naturaleza de los datos: • Orígenes de datos: Los datos de las diferentes áreas de la empresa pueden estar involucrados, por ejemplo, recursos humanos, distintos departamentos e inclusive datos no estructurados. • Integración de datos: Provee dos opciones, tener un real time o en su defecto un Near Real Time, que se refiere a que los datos son ingresados en el data warehouse casi al mismo tiempo que están siendo generados en los orígenes de datos, o un planteamiento tradicional donde se establece una hora y frecuencia específica para la populación del DWH. En esta integración de datos se realiza el consumo desde distintas conexiones a los orígenes de datos, la estandarización y transformación según las reglas de negocio establecidas por el cliente. • Data warehouse: la particularidad es que está formado por distintos data marts, que organizan los datos dependiendo de su naturaleza, el objetivo y la granularidad para lo que serán utilizados, inclusive los metadatos que sirven para tener un detalle desde donde provienen los datos. • Aplicaciones de consumo de datos: Al tener datos con diferentes propósitos también plantea la posibilidad que existan distintas herramientas que se conecten al DWH para generar los dashboards, esto facilita el uso en una organización que, aunque comparte sus objetivos estratégicos, tiene prioridades distintas por área. F. Herramientas de BI Las herramientas que se usan en BI han tomado mucha más relevancia. Especialmente, gracias al gran volumen de datos que existe en Internet y la amplia disponibilidad de marcas. Del mismo modo, esta tendencia también se ve influenciada por la necesidad que tienen los empresarios o emprendedores de utilizar toda esa información en relación con los procedimientos que deben llevar a cabo. Adicionalmente, del objetivo tecnológico que tiene cada empresa hoy en día: disminución de costos y afabilidad de su implementación en todos los ámbitos. Todos estos factores hacen que el proceso de selección de una adecuada herramienta de BI para las necesidades de la empresa puede ser más complicado y complejo de lo que parece. En la actualidad existen muchos softwares de BI disponibles en el mercado, de los cuales cuatro herramientas son analizadas y revisadas en este trabajo basándonos en un estudio previo [9]. Tableau Es una herramienta de visualización de datos más populares a nivel mundial, Tableau tiene muchas características deseables y exclusivas. • Velocidad de análisis: como no requiere un alto nivel de experiencia en programación, cualquier usuario con acceso a los datos puede comenzar a usarlos para obtener valor de los datos. • Fácil de utilizar: Tableau no necesita una configuración de software compleja. La versión de escritorio que utilizan la mayoría de los usuarios se instala fácilmente y contiene todas las funciones necesarias para iniciar y completar el análisis de datos. • Características interactivas visuales: el usuario explora y analiza los datos mediante el uso de herramientas visuales como colores, líneas de tendencia, tablas y gráficos. Hay muy poco guion para escribir, ya que casi todo se hace arrastrando y soltando. • Soporta diversos conjuntos de datos: Tableau le permite combinar diferentes fuentes de datos relacionales, semiestructurados y sin procesar en tiempo real, sin altos costos de integración iniciales. Los usuarios no necesitan saber los detalles de cómo se almacenan los datos. • Independiente de la arquitectura: Tableau funciona en todo tipo de dispositivos donde fluyen los datos. Por lo tanto, el usuario no debe preocuparse por los requisitos específicos de hardware o software para usar Tableau. • Colaboración en tiempo real: Tableau puede filtrar, ordenar y discutir datos sobre la marcha e incrustar un tablero en vivo en portales como el sitio de SharePoint o Salesforce. Permite guardar su vista de datos y permitir que sus colegas se suscriban a sus paneles interactivos para que vean los datos más recientes simplemente actualizando su navegador web. Microsoft Power BI Power BI es una herramienta de visualización de datos e inteligencia de negocios que convierte datos de diversas fuentes en paneles interactivos e informes de BI que ayudan a las organizaciones a tomar decisiones de negocios de manera óptima. La aplicación de escritorio de Power BI se usa para crear informes, mientras que los servicios de Power BI (software como servicio, SaaS) se usan para publicar los informes, y la aplicación móvil de Power BI se usa para ver los informes y los paneles. Algunas características que destacan en Power BI son: • Acceso a volúmenes de datos de múltiples fuentes: Power BI puede acceder a grandes volúmenes de datos de múltiples fuentes. Permite ver, analizar y visualizar grandes cantidades de datos que no se pueden abrir en Excel. Algunas de las fuentes de datos importantes disponibles para Power BI son Excel, CSV, XML, JSON, PDF, etc. Power BI utiliza potentes algoritmos de compresión para importar y almacenar en caché los datos dentro del archivo. • Características interactivas de UI/UX: Power BI hace que las cosas sean visualmente atractivas. Tiene una funcionalidad fácil de arrastrar y soltar, con funciones que le permiten copiar todo el formato en visualizaciones similares. • Acelera la preparación de Big Data con Azure: El uso de Power BI con Azure le permite analizar y compartir volúmenes masivos de datos. Con la integración de Azure se puede reducir el tiempo que lleva obtener información y aumentar la colaboración entre los analistas de negocios, los ingenieros de datos y los científicos de datos. • Convierte la información en acción: Permite obtener información de los datos y convertir esa información en acciones para tomar decisiones comerciales basadas en datos obtenidos. • Análisis de flujo en tiempo real: Permite realizar análisis de flujo en tiempo real. Lo cual ayuda a obtener datos de múltiples fuentes, haciendo que siempre la organización esté preparada para tomar decisiones comerciales. Zoho Analytics Zoho Analytics es una plataforma de análisis y BI, disponible tanto en la nube como en on-premise, que ayuda desde las organizaciones pequeñas a grandes a obtener información de sus datos comerciales. Permite a los usuarios crear y compartir fácilmente informes potentes en minutos. Puede cargar o sincronizar datos desde hojas de cálculo, web o aplicaciones tradicionales, crear informes y paneles potentes en minutos con la sencilla interfaz de arrastrar y soltar, y compartir informes y paneles con indicadores clave de rendimiento. Algunas de sus características son: • Carga cualquier tipo dato: Carga hojas de cálculo y otros datos tabulares de manera segura. Permite archivos CSV, TSV, XLS, XLSX y HTML. Los datos también se pueden agregar directamente usando la interfaz similar a una hoja de cálculo. • Extracción datos desde cualquier aplicación: Se obtiene datos desde la nube o desde aplicaciones comerciales internas y bases de datos para informes y análisis. • Preparación adecuada de datos: Conecta, modela, limpia, transforma y enriquece los datos para análisis. • Fácil configuración e implementación rápida: Con Zoho Analytics, una implementación BI es muy sencilla. Al utilizar BI en modo SaaS ahorra mucho tiempo de configuración e implementación. • Amplia variedad de componentes de informes: Puede utilizar nuestra amplia gama de gráficos, tablas dinámicas y componentes de vista tabular para crear informes y paneles detallados. • Análisis visual: Analice visualmente y cree informes y tableros detallados usted mismo, con nuestra sencilla interfaz de arrastrar y soltar. • Altamente colaborativo: El uso compartido, la colaboración y la publicación están integrados en Zoho Analytics. Los permisos de control de acceso detallados significan que tiene el mejor control sobre los datos y los informes que se comparten. SAP Analytics Cloud SAP Analytics para la nube es una herramienta de BI basada en SaaS en la nube proporcionada por la empresa SAP. Anteriormente se conocía como BusinessObjects para la nube. Proporciona todas las funcionalidades clave de una herramienta de análisis para los usuarios comerciales de SAP. • La función de análisis en la herramienta SAP depende de los algoritmos de datos, la programación y la investigación de operaciones para obtener información sobre los datos y ayudar a la empresa a encontrar información significativa a partir de datos provenientes de múltiples fuentes de datos. Esta información es utilizada por todas las empresas para realizar la planificación y previsión empresarial. • La herramienta SAP Analytics utiliza tecnología de machine learning para realizar la limpieza de datos, identificar posibles errores de datos y sugerir opciones de filtrado. La función de modelado en la nube de Analytics se puede utilizar para mejorar sus datos y crear jerarquías para una visión más profunda de los datos. • SAP Analytics Cloud centraliza BI y análisis dentro de la nube, combinando funciones escalables de descubrimiento de datos a nivel empresarial con herramientas sociales. • Una interfaz de usuario personalizable basada en tablero no requiere instalación de escritorio para crear visualizaciones, guiones gráficos y crear informes ad hoc. • Acceda a datos consolidados de SAP y que no son de SAP con conexiones confiables a la nube o fuentes locales, lo que optimiza más soluciones dispersas. • Combina planificación financiera y análisis de negocios en tiempo real con capacidades de colaboración, todo dentro de una sola aplicación SaaS. • La consola de eventos integra funciones de calendario para asignar tareas a los miembros del equipo, configurar recordatorios, alertas y compartir flujos de trabajo. III. METODOLOGÍA DE INVESTIGACIÓN A. Clasificación de la investigación Para definir el tipo de investigación se consideraron dos conceptos [10]: • Investigación básica: Se caracteriza porque parte de un marco teórico y permanece en él; la finalidad radica en formular nuevas teorías o modificar las existentes, en incrementar los conocimientos científicos o filosóficos, pero sin contrastarlos con ningún aspecto práctico. • Investigación aplicada: El proyecto o investigación busca la aplicación de la teoría en un caso práctico, de manera que, del conocimiento resultante, se obtengan beneficios prácticos. Por tanto, debido a la finalidad de la investigación de desarrollar un modelo de inteligencia de negocios adaptado a las necesidades de las PYMES en El Salvador, se determinó que la investigación es considerada aplicada. Otro aspecto importante de la clasificación de la investigación es el enfoque que se utilizará; este puede ser cuantitativo, cualitativo o mixta, dependiendo de las variables de estudio que se han definido apegadas al objetivo general. La investigación cualitativa se enfoca en comprender los fenómenos, explorándolos desde la perspectiva de los participantes en un ambiente natural y en relación con su contexto. El enfoque cualitativo se selecciona cuando el propósito es examinar la forma en que los individuos perciben y experimentan los fenómenos que los rodean, profundizando en sus puntos de vista, interpretaciones y significados [11]. Es debido a estos puntos anteriores que se concluyó que un enfoque cualitativo es el que mejor se aplica debido al tipo de variables de estudio presentes en la investigación, se necesita entender la situación actual de la organización y a través de métodos de recolección cualitativos, obtener los insumos para el desarrollo de un modelo de Inteligencia de Negocios. Asimismo, este tipo de investigación más fluido nos permitirá regresar a etapas previas de ser necesario para refinarlas cada vez más. Permite estar en constante retroalimentación en cada etapa del proceso de investigación con la literatura existente y las experiencias de proyectos similares presentes a través de publicaciones científicas. B. Técnicas de recolección de datos Para esta investigación se utilizaron tres técnicas cualitativas de recolección de datos: • Entrevista abierta o Objetivo: Conocer qué información y métricas pertinentes deben estar presente en los cuadros de mando y los procesos de la organización para la gestión de los proyectos. o Resultados esperados: Definición de métricas, información gerencial y diseños preliminares de cuadros de mando.\ • Observación o Objetivo: Observar de primera mano la carga y gestión de la información financiera y operativa de la empresa. o Resultados esperados: Documentación de procesos y claridad en el funcionamiento de la empresa. • Análisis de documentos o Objetivo: Analizar la documentación disponible de las herramientas y plataformas de BI que existen en el mercado. o Resultados esperados: Comparativa de herramientas de BI. IV. CASO DE ESTUDIO A. Acerca de la empresa La empresa estudiada, conocida en este documento como “Empresa X” debido a un acuerdo de confidencialidad firmado, es una pequeña empresa (PYME) que presta servicios de diseño gráfico tales como: • Administración de redes sociales. • Diseño digital de publicidad. • Diseño de páginas web. Registrada en El Salvador bajo el rubro de actividades de diseño especializado, cuenta con una planilla menor a 20 empleados y percibe ingresos de aproximadamente $11,000 USD mensuales. Actualmente la Empresa X no cuenta con un sistema informático para el registro de sus movimientos financieros, y todos sus datos financieros son llevados en archivos Excel, por lo que se le propuso la implementación de la inteligencia de negocio, para que los datos crudos se transformen en información útil para la toma de decisiones, y de esa manera potenciar su crecimiento para los próximos años, sin comprometer su presupuesto. B. Requerimientos de la solución Se realizaron varias entrevistas con la empresa estudiada, y con base en la información recopilada y el análisis de resultados se determinó que la solución informática debe estar orientada a tres objetivos estratégicos de la empresa: 1. Control de ingresos y gastos. 2. Manejo de pagos de planilla. 3. Control de servicios prestados. Correspondiente a cada objetivo estratégico, se ha listado los requerimientos que deberán cumplir los tres cuadros de mando. Cuadro de mando a nivel de transacción Este cuadro de mando servirá para llevar el control de los ingresos y gastos de la empresa, tomando en consideración los impuestos a pagar. Componentes 1. Gráfica lineal de gastos e ingresos por mes 2. Tabla pivote con detalle de ingresos 3. Tabla pivote con detalle de gastos 4. Filtro por fecha (día/mes/año) Métricas 1. Subtotal de gastos por concepto, con impuestos por mes. 2. Subtotal de ingreso por concepto, con impuestos por mes. Cuadro de mando a nivel de planilla Este cuadro de mando incluirá información relacionada al pago de planilla desde la perspectiva de un empleado y de la empresa. Componentes 1. Tabla pivote con detalle de pago planilla por empleado. 2. Tabla pivote con detalle de importaciones de impuestos de la empresa por mes. 3. Tabla pivote con detalle de montos de impuestos de los empleados por mes. 4. Filtro por fecha (día/mes/año). Métricas 1. Monto neto de pago de salario con impuestos por empleado por mes. 2. Monto total de pago de planilla con impuestos por mes. Cuadro de mando para control de servicios prestados Este cuadro de mando contará con la información de todos los servicios que la empresa presta y que genera ingreso, también servirá para llevar un control del desempeño de los encargados de desarrollar esos servicios. Componentes 1. Gráfica lineal con conteo de servicios completados por mes. 2. Gráfica de barras con conteo de servicios completados por empleado encargado por mes. 3. Tabla pivote con detalle de proyecto por empleado. 4. Filtro por fecha (día/mes/año). Métricas 1. Cantidad de servicios prestados por mes. 2. Cantidad de servicios prestados por mes por empleado. V. DISEÑO DE LA SOLUCIÓN A. Comparación de Herramientas Actualmente, las herramientas que se usan en BI han tomado mucha más relevancia, especialmente gracias al gran volumen de datos que existe en Internet y la amplia disponibilidad de proveedores. Del mismo modo, esta tendencia también se ve influenciada por la necesidad que tienen los empresarios o emprendedores de utilizar toda esa información para optimizar sus recursos y procesos. El proceso de la selección de herramientas inteligencia de negocios ha estado en investigación durante años. Acorde al estudio realizado por Gina y Budree [14], durante la década de los 2000, muchos estudios realizados a lo largo de los años han demostrado que la selección adecuada de herramientas de inteligencia negocios se considera compleja y es un proceso agotador para emprender como organización. A principios de la década de los 2000, la naturaleza del problema de selección de herramientas de software era el resultado de múltiples ofertas de productos en el mercado y la capacidad de los proveedores para producir productos más avanzados, lo que complicaba el procedimiento de selección. Las consecuencias de la selección inapropiada de herramientas de software de BI se pueden resumir en: pérdidas económicas organizacionales, decisiones estratégicas inadecuadas, proyectos abandonados y fallas en la implementación de sistemas de BI. Gina y Budree [14], también indagaron que la falla de los sistemas de inteligencia, como resultado de factores tecnológicos y de gestión, se encuentra entre el 70% y el 80%. Después de años de intentos por resolver significativamente el problema de la tasa de fracaso de los proyectos de BI, se requiere un análisis intenso y profundo en torno al tema. Las fallas en la implementación de proyectos de BI se adjudican a dos puntos de vista universales, a considerar; obstáculos tecnológicos y de gestión. Para frenar algunos de los problemas relacionados con la tecnología, las organizaciones deben emplear herramientas de software adecuadas para satisfacer las necesidades de la organización. Los estudios de factores críticos de éxito han demostrado que el éxito o el fracaso de la implementación de sistemas de BI también depende de la elección de la herramienta que utilice la organización, por lo que es necesario que las organizaciones implementen plataformas de datos sólidas y correctas. Según un estudio realizado por Gartner, las plataformas de análisis e inteligencia comercial (ABI) permiten a los miembros menos técnicos de un equipo a analizar, explorar, compartir y administrar datos. La plataforma también permite a los usuarios descubrir y visualizar información al tiempo que proporciona una base para la colaboración entre funciones. En la siguiente figura se muestra una lista de proveedores de herramientas de BI y plataformas tecnológicas en el mercado acorde al cuadrante mágico de Gartner realizado en el 2022 [12]. Esto ayuda a las organizaciones a determinar cómo los proveedores de servicios de tecnología están ejecutando la visión establecida y cómo se están desempeñando frente a la visión de mercado de Gartner. Power BI Tableau Zoho Analytics SAP Analytics Cloud Costos Power BI Desktop está disponible de forma gratuita, mientras que Power BI Pro comienza en $9.99 por usuario por mes. Tableau Desktop comienzan en $70 por usuario por mes, y Tableau Server comienza en $ 35 por usuario por mes. Los precios comienzan en $22 por mes para hasta 2 usuarios. Los precios comienzan en $21 por usuario por mes. Facilidad de uso Tiene una interfaz más simple, su curva de aprendizaje es menos pronunciada y ofrece una mayor flexibilidad y personalización. Tableau cuenta con una curva de aprendizaje más pronunciada y es más complejo, pero también ofrece una mayor flexibilidad y personalización. Es una herramienta fácil de usar, pero Zoho Analytics tiene una curva de aprendizaje más pronunciada debido a que su interfaz es más compleja. SAP Analytics Cloud, cuenta con una interfaz más compleja y requiere más capacitación para usarla de manera efectiva. Integración Power BI está más estrechamente integrado con otros productos de Microsoft, como Excel, SharePoint, etc. Tableau tiene conectores de datos más sólidos y admite más orígenes de datos. Si bien Zoho Analytics es compatible con una variedad de fuentes de datos, es posible que no tenga tantas integraciones con otras herramientas. SAP Analytics Cloud está diseñado para funcionar con los sistemas empresariales de SAP, como SAP HANA y SAP BW. Visualización Ofrece una amplia gama de opciones de visualizaciones interactivas con gráficos e informes que mejora la capacidad de mejorar la toma de decisiones. Tableau permite visualizaciones más avanzadas, como mapas de calor, diagramas de dispersión y diagramas de caja. Posee Use una amplia variedad de gráficos, widgets, tablas dinámicas, resúmenes y vistas tabulares para generar informes y paneles detallados. Ofrece una visualización de los datos de una forma muy completa y gráfica con la que se logra diseñar informes o configurar cuadros de mando. Análisis e interpretación Power BI tiene muchas características avanzadas con las que trabajar, por lo que es una excelente herramienta para el análisis y la interpretación de los datos. Tableau posee muchas opciones de desglose y filtrado de fácil uso. Es una potente herramienta de interpretación de datos. Sin embargo, la curva de aprendizaje para manejar estas herramientas es elevada. Posee varias herramientas analíticas, como pronósticos, análisis de tendencias y análisis de regresión, para obtener información. Captura y almacenamiento de datos Power BI es capaz de recuperar datos desde cualquier lugar y en cualquier momento. Tiene varias fuentes de datos como web, SQL en la nube, Azure, etc. Tableau es capaz de realizar buenas conexiones de orígenes de datos, probablemente a la par con Power BI. Zoho Analytics permite, modelar los datos y almacenarlos en un almacén de datos basado en la nube para su análisis e informes. Proporciona una variedad de formas de capturar y almacenar sus datos, lo que le permite conectarse a una variedad de orígenes de datos y transformar sus datos para su análisis. TABLA I COMPARACIÓN DE HERRAMIENTAS B. Arquitecturas de BI La implementación de la inteligencia de negocios tiene varios enfoques dependiendo del autor y de las necesidades del cliente, por lo que es necesario valorar las opciones para plantear un diseño optimo y funcional para una empresa del tipo PYMES. En Tabla II se realiza una comparación de distintas arquitecturas estudiadas en el estado del arte de esta investigación, los aspectos que hemos considerado evaluar son los siguientes: Origen de datos, Proceso ETL, Data warehouse y Capa de presentación. C. Técnicas de modelado Para el desarrollo del Data Warehouse es necesario considerar las diferentes técnicas de modelado disponibles (véase Tabla III), y realizar una comparativa para determinar cuál es la que más se adapta al escenario de este estudio. Para ellos se tomaron las técnicas de Inmon, Kimball y Data Vault y considerando un estudio previo [13], se compararon diferentes características como: el tipo de desarrollo, el costo, complejidad entre otras. Característica Arquitectura simple [3] Arquitectura intermedia [2] Arquitectura compleja [8] Origen de datos Un origen de datos, o datos uniformes. Orígenes de datos heterogéneos Múltiples orígenes de datos heterogéneos, que corresponden a distintas áreas de la empresa. Proceso ETL ETL que obtiene los datos, los transforma y coloca en un almacén de datos. Proceso ETL que unifica los datos, los transforma y almacena de forma estandarizada. Múltiples procesos ETL para una integración de datos a distintas granularidades y tazas de refresco. Puede que algunos orígenes de datos se procesen NRT y otros bajo un horario. Data warehouse Debido a que solo maneja un origen de datos, el almacenamiento puede realizarse en una base de datos, se almacenan los datos transformados. El data warehouse contendrá los datos bajo una misma granularidad y deberá ser una herramienta adecuada como: Google Big Query. Se tiene un data warehouse compuesto de varios data marts, que contienen los datos transformados a distintas granularidades, también se almacenan metadatos para mantener la trazabilidad de los datos. Presentación de información Los datos del almacén de datos se exponen directamente para herramientas como Excel o Power BI. Se proveen dos salidas de datos, un cubo OLAP que puede ser manipulado por el usuario final para obtener reportes personalizados, y los dashboards en una herramienta de BI. Se tienen múltiples salidas de datos, dashboards en herramientas de BI, cubos OLAP, se realiza minería de datos y reportes, esto debido a que la solución se realiza a nivel empresarial y responde a los objetivos de cada área. TABLA II COMPARACIÓN DE ARQUITECTURAS Característica Arquitectura simple [3] Arquitectura intermedia [2] Arquitectura compleja [8] Origen de datos Un origen de datos, o datos uniformes. Orígenes de datos heterogéneos Múltiples orígenes de datos heterogéneos, que corresponden a distintas áreas de la empresa. Proceso ETL ETL que obtiene los datos, los transforma y coloca en un almacén de datos. Proceso ETL que unifica los datos, los transforma y almacena de forma estandarizada. Múltiples procesos ETL para una integración de datos a distintas granularidades y tazas de refresco. Puede que algunos orígenes de datos se procesen NRT y otros bajo un horario. Data warehouse Debido a que solo maneja un origen de datos, el almacenamiento puede realizarse en una base de datos, se almacenan los datos transformados. El data warehouse contendrá los datos bajo una misma granularidad y deberá ser una herramienta adecuada como: Google Big Query. Se tiene un data warehouse compuesto de varios data marts, que contienen los datos transformados a distintas granularidades, también se almacenan metadatos para mantener la trazabilidad de los datos. Presentación de información Los datos del almacén de datos se exponen directamente para herramientas como Excel o Power BI. Se proveen dos salidas de datos, un cubo OLAP que puede ser manipulado por el usuario final para obtener reportes personalizados, y los dashboards en una herramienta de BI. Se tienen múltiples salidas de datos, dashboards en herramientas de BI, cubos OLAP, se realiza minería de datos y reportes, esto debido a que la solución se realiza a nivel empresarial y responde a los objetivos de cada área. TABLA II COMPARACIÓN DE ARQUITECTURAS D. Resultado del análisis Dados los requerimientos de la empresa en estudio se ha tomado en cuenta las siguientes características para el planteamiento de la solución. • Permitir la estandarización y transformación de los datos. • Componentes técnicos que se adapten a un presupuesto limitado. • Baja complejidad de uso y de implementación. • Solución integral, que pueda ser usada a nivel empresarial. • Escalable, considerando el crecimiento empresarial. • Desarrollo iterativo, donde se entregue valor a la empresa en un corto periodo de tiempo. Por tanto, luego de comparar las propuestas de algunos escritores para la arquitectura, la que más se adapta a estas características es la arquitectura de complejidad intermedia [2]. Esta arquitectura cuenta con unos orígenes de datos heterogéneos, tal como la empresa lo necesita, debido a que está utilizando varios tipos de herramientas para la gestión de sus datos, también cuenta con un proceso de ETL que se encarga de las transformaciones y de almacenar los datos en un data warehouse, esto ayudara a la estandarización que la empresa necesita, para empezar a obtener valor de los datos que almacena. Esta arquitectura no es tan compleja como otras, y podrá ser escalable, en especial con el modelado de datos adecuado. Respecto al modelado de datos, se evaluaron tres planteamientos: Inmon, Kimball y Data Vault, de estos tres planteamientos, el modelo de Inmon cumple en ser una solución a nivel empresarial, sin embargo, no se desarrolla iterativamente, requiere muchos más recursos, su mantenimiento y uso de datos es más complejo y no lo hace adecuado para este rubro; por otra parte, Data Vault propone mejoras a las deficiencias de los modelos de Kimball e Inmon y es de desarrollo iterativo, es una solución que representa una complejidad intermedia de implementación y de mantenimiento, y un aumento en los recursos necesarios, ya que en la bóveda de datos se almacenan los datos en su estado original, por lo que esta estrategia es menos eficiente para este escenario en específico y debido a eso se decidió implementar el modelo de Kimball. Entre las ventajas que el modelo de Kimball ofrecerá al diseño de esta solución están: • Permite el desarrollo iterativo. • Es totalmente escalable, ya que el data warehouse está compuesto de data marts que se van relacionando con dimensiones en común y se irán añadiendo según sea necesario. • En el data warehouse se almacena datos estructurados y ordenados, lo que facilitara su consulta a través de una herramienta de BI para desarrollar dashboards. E. Arquitectura propuesta Con base en las comparaciones de tecnologías, arquitecturas y técnicas de modelado de datos previamente realizadas, se plantean los siguientes componentes de la arquitectura a alto nivel. Característica Inmon Kimball Data Vault Punto de partida Proveer una solución completa de data warehouse. Basado en los requerimientos de los usuarios finales. Basado en los requerimientos de los usuarios finales. Tipo de desarrollo Metodología espiral Desarrollo iterativo Desarrollo iterativo Tiempo de desarrollo Larga duración Corta duración Corta duración Costos de desarrollo El costo inicial es alto, la implementación de mejoras tiene un costo menor. Los costos iniciales y subsecuentes son bajos debido al desarrollo iterativo. Los costos iniciales y subsecuentes son bajos debido al desarrollo iterativo. Complejidad Complejo Simple Intermedio Componentes Un data warehouse atómico alimenta los data marts departamentales. Un conjunto de data marts, constituye el data warehouse. La bóveda de datos alimenta los data marts. Procesos ETL La transformación de los datos se realiza a través de los procesos ETL. La transformación de los datos se realiza a través de los procesos ETL. Se almacenan los datos originales en la bóveda de datos y las transformaciones son realizadas después no necesariamente con un proceso ETL. TABLA III COMPARACIÓN DE TÉCNICAS DE MODELADO FIGURA I Arquitectura PropuestaTABLA III COMPARACIÓN DE TÉCNICAS DE MODELADO Origen de datos Actualmente los registros de los datos financieros son llevados en archivos Excel y son creados mes a mes, estos archivos no siempre siguen el mismo formato, por lo que se escogió un medio centralizado para que los datos sean migrados a hojas de cálculo en Google Drive, de esta forma son procesados con facilidad en Google Cloud Platform. Para facilitar el ingreso de los registros, se crearon formularios de Google que almacenarán las respuestas en las hojas de datos. ELT Se escogió un proceso de ELT, en el cual se extraen, cargan y posteriormente se transforman los datos crudos ingestados. Esta fase es realizada en Big Query, un módulo de Google Cloud Platform especializado para análisis de datos. Modelo de datos El modelo de datos esta realizado en Big Query en un set de datos separado para mantener un estándar. Se optó por el modelo de datos estrella, donde se define una tabla de hechos y tablas de dimensiones en común con otra tabla de hechos, siguiendo el planteamiento de Kimball. Presentación Para la creación de los tres cuadros de mando solicitados en los requerimientos, se escogió Power BI, conectándose al modelo de datos hecho en Big Query a través de un conector especial que se autentica con la cuenta de Google Cloud Platform. VI. IMPLEMENTACIÓN DE LA SOLUCIÓN A. Arquitectura a bajo nivel En la figura II, se detallan los orígenes de datos, los sets de datos, y los procedimientos almacenados que estarán interactuando hasta generar un modelo de datos estandarizado y limpio que será conectado con la herramienta de BI. Orígenes de datos • Ingresos y Gastos: Se crearon formularios de Google que permitirán llenar con facilidad dos hojas de cálculo respectivas a gastos e ingresos, sin embargo, estos datos solo corresponderán a los del corriente año, porque los datos históricos de los últimos tres años están almacenados en archivos separados, para evitar que se procesen cada día. • Planilla: Para el caso de los datos de planilla, no serán ingresados con un formulario, sino que serán agregados manualmente en una hoja de cálculo, debido a que son datos repetitivos. Esta hoja de cálculo solo contendrá los datos del corriente año pues al igual que los ingresos y gastos, tiene un archivo separado con los datos históricos de los últimos tres años. • Empleados: Esta hoja de cálculo contiene los datos personales de los empleados, junto con su correo electrónico que servirá como identificador único para relacionarlo con las transacciones de la empresa. • Catálogos: Esta hoja de cálculo contiene detalles de gastos e ingresos. Para el caso de los ingresos contiene el listado de servicios e impuestos a pagar por servicio, clientes y personal encargado de los proyectos. Para el caso de los gastos contiene los conceptos de gasto e impuestos a pagar. FIGURA I ARQUITECTURA PROPUESTA Raw Data Los datos generados manualmente o ingresados por los formularios de Google, que son posteriormente almacenados en hojas de cálculo estan conectados a BigQuery a través de tablas externas, esto quiere decir que cada vez que sean consultadas las tablas externas de BigQuery traerán la última versión de los datos en las hojas de cálculo, lo que permitirá una carga de datos transparente. En esta fase se cargan los datos crudos, sin ninguna transformación. Almacén de datos (DWH) Esta fase está compuesta por dos etapas con su respectivo set de datos, el primero es de procesamiento y es acá donde a través de procedimientos almacenados se transforman los datos crudos a los formatos deseados y se calculan las métricas que son necesarias para los cuadros de mando. En el segundo set de datos, se almacenan solo los campos necesarios para dar forma al modelo, compartiendo las dimensiones en común. Las tablas de ambos sets serán nativas, lo que permitirá su acceso a través del conector de Power BI para trabajar los cuadros de mando. Los procedimientos almacenados que se desarrollaron son los siguientes: • createTablasCatalogoStaging Este procedimiento es el encargado de crear las tablas staging de los catálogos, almacenando por separado los detalles de gastos e ingresos y la tabla de empleados. La ejecución de este procedimiento es diaria. • createTablasStaging Este procedimiento almacenado procesa las tablas crudas de ingresos, gastos y planilla, calcula los impuestos y estandariza los datos. Es ejecutado cada 4 horas en caso de que se agreguen datos durante el día. • createTablasHistoricasStaging Este procedimiento almacenado es el encargado de generar las tablas históricas de staging para gastos, ingresos y planilla, solo será ejecutado una vez al año cuando se agregue la información de un año recién cerrado, por ejemplo, a inicio de enero. Contiene las mismas transformaciones y formato que siguen las tablas no históricas. • createTablasDimension El objetivo de este procedimiento almacenado es generar las tres dimensiones del modelo, se ejecuta de manera diaria posterior a la generación de los catálogos staging. • createTablasDeHechos Este procedimiento almacenado crea las tablas de hechos considerando las llaves subrogadas generadas en las dimensiones, es ejecutado cada 4 horas, después del procedimiento almacenado createTablasStaging. Modelo de datos Tablas de hechos • ft_proyecto: contendrá detalles de los proyectos, tipo de servicio, encargado del proyecto. • ft_transacciones: contendrán datos de ingresos, gastos y planilla. • ft_planilla: contendrá solo datos de planilla. Dimensiones • dim_concepto: almacena tanto los servicios como los conceptos de gastos. • dim_empleado: almacena solo los datos generales del empleado, respetando la confidencialidad. • dim_cliente: almacena el catálogo de clientes. FIGURA II ARQUITECTURA DE BAJO NIVEL Para la ejecución de los procedimientos almacenados, se considerará la frecuencia y horario detallada en la figura IV. Dependencias • Las tablas históricas serán actualizadas antes que todas, pero se ejecutara solo una vez al año. • Las tablas de dimensión son dependientes de las tablas de catalogo generadas por staging. • Las tablas de hechos son dependientes de la actualización de las tablas de staging para gastos, ingresos y planilla. FIGURA IV EJECUCIÓN DE PROCEDIMIENTOS ALMACENADOS FIGURA III MODELO DE DATOS B. Diseño de cuadros de mando Cumpliendo con los requerimientos de la empresa sobre sus objetivos estratégicos se diseñaron tres cuadros de mando: Cuadro de mando de planilla Las métricas de este cuadro de mando son: Monto neto de pago de salario con impuestos por empleado por mes y monto total de pago de planilla con impuestos por mes. Ambas métricas son calculadas en las dos tablas pivote, la primera desde la perspectiva del empleado y la segunda desde la perspectiva de la empresa, ambas pueden ser filtradas por fecha. FIGURA V CUADRO DE MANDO DE PLANILLA Cuadro de mando de servicios prestados Las métricas de este cuadro de mando son: Cantidad de servicios prestados por mes y cantidad de servicios prestados por mes por empleado. Estas métricas se calculan en la gráfica de barras y lineal, se puede también filtrar por un empleado o una fecha y obtener un detalle de los servicios prestados en la tabla pivote. Cuadro de mando de transacciones Las métricas de este cuadro de mando son: Subtotal de gastos por concepto, con impuestos por mes y subtotal de ingreso por concepto, con impuestos por mes. Ambas métricas son calculadas en la tabla pivote filtrando por tipo de transacción y fecha. FIGURA VII CUADRO DE MANDO DE INGRESOS Y GASTOS C. Inversión y presupuesto de la solución Google Drive Una cuenta gratuita de Google tiene 15 GB de almacenamiento en Google, considerando que los datos actuales de la empresa tienen un peso aproximado de 20 MB, no es necesaria una expansión de almacenamiento por el momento. Al aumentar el volumen de datos en Google Drive se deberá considerar alguna de las cuentas pagadas [15]. FIGURA VIII COSTO MENSUAL DE GOOGLE DRIVE Google Cloud Platform Para la activación de Google Cloud Platform con una cuenta de Google, solo se necesita el registro de un método de pago valido y no incluye una cuota inicial. Google Cloud Platform provee de forma gratuita $300 USD de crédito en sus módulos que tiene una duración de noventa días, luego de eso se aplicaran las cuotas según el uso de los módulos. FIGURA VI CUADRO DE MANDO DE SERVICIOS PRESTADOS El principal componente del Data Warehouse es BigQuery, que contiene las tablas de datos crudos, las tablas de staging y del modelo de datos. BigQuery maneja dos tipos de tarifas, cantidad de almacenamiento a largo plazo y cantidad de bytes consumidos por ejecución de consultas [16]. Tipo de tarifa Volumen de datos Precio mensual Detalles Ejecución de consultas a demanda 1 TB $5 1 TB por mes es gratis. Almacenamiento a largo plazo 1 GB $0.01 10 GB por mes son gratis. Actualmente la solución no sobrepasa tanto la tarifa por ejecución de consultas, como la de almacenamiento al largo plazo; por lo que generaran un monto $0 USD en el cobro mensual de GCP. Microsoft Power BI Microsoft ofrece diferentes tarifas para su herramienta de Power BI, e inclusive cuenta con la herramienta gratuita Power BI Desktop, que incluye el conector de BigQuery y se pueden realizar cuadros de mando sin ningún costo, sin embargo, no se pueden publicar, ni programar la actualización de los datos, por lo que recomendamos al menos contar con una licencia de Power BI Pro, que cuenta con la plataforma online que permite inclusive descargar los cuadros de mando como archivos Excel o PDF [17]. FIGURA IX COSTO MENSUAL DE POWER BI Inversión y mantenimiento Con motivo de conocer el impacto de la implementación de este modelo de inteligencia de negocios en el presupuesto de una PYMES, se han estimado a continuación los costos de los componentes tecnológicos y recursos humanos necesarios. Tarea Horas Estimadas Encargado Reunión inicial 2 Director de proyecto Sesiones de recopilación de información 14 Arquitecto Levantamiento de requerimientos 20 Arquitecto Diseño de la solución 30 Arquitecto Seguimiento del proyecto 15 Director de proyecto Soporte al equipo de desarrollo 15 Arquitecto Desarrollo de la solución 80 Ingeniero de datos Implementación en producción 14 Ingeniero de datos Documentación 14 Ingeniero de datos Sesiones de entrenamiento 14 Ingeniero de datos Reunión final de aceptación de proyecto 2 Director de proyecto Realizando un cálculo con base en el tiempo, el rol que realiza la tarea y la tarifa de este, obtenemos la tabla siguiente: Encargado Horas Costo por hora Subtotal Director de proyecto 19 $14.00 $266.00 Arquitecto 79 $12.00 $948.00 Ingeniero de datos 122 $10.00 $1,220.00 Subtotal antes de impuestos $2,434.00 Total (IVA 13%) $2,750.42 El costo por hora ha sido calculado considerando el salario mensual estimado de cada rol dividido entre las horas hábiles. Considerando los costos de los componentes anteriormente mencionados, y que los datos de la empresa (aproximadamente 1GB) no superan los recursos gratuitos que ofrecen algunos componentes, la inversión inicial a realizarse en los recursos tecnológicos seria la siguiente: Google Drive Google BigQuery Microsoft Power BI Licencia Gratis Pago por uso Power BI Pro Detalle 15 GB disponibles 1 TB de consultas gratis y 10 GB de almacenamiento gratis Servicios en línea de Power BI Costo mensual $0.00 $0.00 $10.00 Total $10.00 TABLA V ESTIMACIÓN DE TIEMPO DE DESARROLLO TABLA V ESTIMACIÓN DE TIEMPO DE DESARROLLO TABLA VI INVERSIÓN EN RECURSOS HUMANOS TABLA VI INVERSIÓN EN RECURSOS HUMANOS TABLA VII COSTO MENSUAL DE LA PLATAFORMA TABLA VII COSTO MENSUAL DE LA PLATAFORMA TABLA IV TARIFAS DE GOOGLE BIGQUERY TABLA IV TARIFAS DE GOOGLE BIGQUERY El total de inversión en componentes tecnológicos y recursos humanos, considerando que la implementación dura un aproximado de 2 meses es de $2,770.42 USD. Para el mantenimiento de la solución mensualmente se estarían cancelando $10 USD de la licencia de Power BI, hasta que los datos superen los montos de recursos gratuitos. VIII. CONCLUSIONES Discusión Algunos autores [18], con base en diversos estudios indican que el modelo más utilizado para evaluar el desempeño organizacional es el desarrollo de un cuadro de mando integrado, siendo utilizado como un elemento clave para los marcos propuestos destacados por la revisión sistemática. Como resultado, se concluye que dicho desarrollo puede proporcionar muchos beneficios para las organizaciones, como la centralización de ingresos y gastos, la mejora de la comunicación interna, la identificación de áreas de mejora, la toma de decisiones más informadas y la mejora continua dentro de las organizaciones. En [19] también se comparte esta postura, recalcando que la inteligencia de negocios es importante desde la vista estratégica de una empresa para afrontar distintas situaciones y por tanto necesaria la centralización de los datos. El uso de una arquitectura de inteligencia de negocios basada en la nube para un modelo de BI en una PYME demostró ofrecer múltiples ventajas y beneficios. En general, permite el acceso a herramientas avanzadas de análisis y visualización de datos, sin la necesidad de grandes inversiones en infraestructura y software. De acuerdo con Kasem y Hassanein [20], la inteligencia de negocios en la nube se ha desarrollado para mejorar la flexibilidad de implementación, disponibilidad, escalabilidad y mayor rendimiento del software. En definitiva, el uso de una arquitectura de inteligencia de negocios puede ser una solución ideal para las PYMES que deseen mejorar su capacidad de análisis y visualización de datos, al mismo tiempo que reducen costos y mejoran la seguridad y protección de datos. En un mundo cada vez más digital, una arquitectura de esta índole ayudara a las PYMES a mantenerse competitivas y a seguir creciendo en el futuro. El uso de herramientas de BI en las organizaciones pertenecientes a las PYMES es generalmente más bajo comparado a las grandes corporaciones que generalmente cuentan con más recursos técnicos y económicos. A pesar de ello, según algunos autores [3], las PYMES valoran la importancia del manejo de flujos de información para que sean de insumo en la toma de decisiones. También conocen de diferentes herramientas disponibles en el mercado. Sin embargo, una de las limitantes presentes a la hora de implementar una solución de esta naturaleza es el desconocimiento técnico para elegir la combinación correcta de tecnologías y la falta de presupuesto en el área de TI para invertir tiempo y recursos económicos para adoptar estas tecnologías. Sin embargo, al tiempo de esta investigación no es imposible poder implementar una solución tecnológica de BI con las metodologías propuestas. En la implementación de la inteligencia de negocios en una PYME, hay un aspecto determinante que se debe considerar, el entrenamiento desde cero a los usuarios finales, desde la definición de los conceptos hasta aspectos técnicos que le permitan usar y brindar mantenimiento al modelo. Para esta investigación se agregó un apartado al respecto y se ha considerado en el cronograma y en el presupuesto un tiempo para las sesiones de entrenamiento del personal, alineado a lo planteado en [21], recalcando que es importante involucrar a los usuarios desde el inicio en el levantamiento de los requerimientos, y que al ser PYMES lo más probable es que desconozcan los conocimientos técnicos a los que se refiera la solución. La incorporación de los datos de los empleados, datos no sensibles, en una solución de inteligencia de negocios, permite obtener información sobre el rendimiento y el comportamiento de la organización, lo que abre la puerta a conocer oportunidades de mejora en el área de recursos humanos, tal como se menciona en [22], al plantear la incorporación de los datos de un ERP (Enterprise Resource Planning) en una solución de inteligencia de negocios, brindando una visión transparente y objetiva de las tendencias que está siguiendo la empresa en este aspecto, agregando información no solamente operacional, sino también organizacional. Conclusiones Con el desarrollo de esta investigación se concluye lo siguiente: Haciendo uso de las herramientas de recopilación se identificaron los requerimientos de una PYME del rubo de actividades de diseño especializado y se diseñó una solución que pudiera solventar esas necesidades y transformar los datos tabulares en información útil para la empresa. Dada la diversidad de tipos de organizaciones o empresas en el área de las PYMES los aspectos de negocio pueden ser diferentes, así como sus necesidades de negocio, sin embargo, existen elementos en común que comparten este tipo de empresas, las entradas y salidas de dinero, conocer los proyectos que gestionan y cuanto aportan a la empresa, conocer los gastos operativos, son métricas comunes para cualquier empresa, y forman insumos para la toma decisiones en el área gerencial. La solución diseñada representa una inversión económica que no impacta fuertemente el presupuesto de una empresa PYME y que ofrece muchos beneficios para la toma de decisiones, al ser contenida la solución en la nube, se reduce totalmente el gasto de la infraestructura y los costos de mantenimiento mensual luego de la inversión inicial son bajos. Con la información que almacenaba la empresa de manera tabular, se diseñó una solución que estandariza los datos y los transforma a un modelo de datos que alimenta a tres cuadros de mando apegados a los objetivos estratégicos de la empresa: tendencias de ingresos y egresos, desempeño a nivel de servicios prestados y personal, y pagos de planilla, sin embargo respecto a las evaluaciones de retroalimentación de los clientes sobre los servicios no aplico en el caso de estudio porque no se están almacenando esos resultados y únicamente se reciben comentarios a través de redes sociales. Uno de los componentes más críticos de una solución de inteligencia de negocios es la parte de visualización para el usuario final, ya que es la que interactúa propiamente con los usuarios de negocios y debe responder a las necesidades de la organización. La herramienta elegida permite crear cuadros de mandos personalizados, a la vez que permite consultar de diferentes fuentes de datos y operar sobre los mismos, es interactiva y cuenta con diferentes filtros para visualizar los reportes desde diferentes ángulos haciéndolo muy intuitivo. La elección de los elementos y métricas que conforman el cuadro de mando surge de la necesidad de la organización, sin embargo, también se incorporan elementos comunes que las PYMES podrían necesitar como las entradas y salidas de dinero, costo de los servicios, ganancias entre otros. Los elementos comunes y necesarios para conformar una arquitectura de inteligencia de negocios pasan por tener un repositorio de datos heterogéneos, un proceso de ETL, un Data warehouse o Data mart y una herramienta de visualización. Existen varias alternativas en el mercado para cada uno de los elementos de la arquitectura propuesta, se tomaron en cuenta las limitaciones técnicas y económicas que normalmente las PYMES enfrentan y que se consideran como una limitación para este tipo de soluciones, sin embargo se ha logrado proponer una arquitectura que no representa mayor impacto económico, y que presenta beneficios expresados en eficiencia de horas, versatilidad y aportación de insumos valiosos para la toma de decisiones basados en los datos que la empresa maneja. IX. RECOMENDACIONES Se recomienda la creación de un sistema transaccional que facilite la ingesta y el tratamiento correcto de datos, en el desarrollo del proyecto se hizo una propuesta para tener orígenes de datos heterogéneos a través de formularios y hojas de cálculo centralizados en la nube, sin embargo, no es sustitución para un sistema transaccional que permita tener un registro de los movimientos financieros de la organización, así como otros insumos necesarios. Para que la empresa pueda empezar a evaluar los resultados de los servicios prestados de cara al cliente, se necesita implementar un sistema de captura de retroalimentaciones, la manera más accesible de hacerlo es creando un Google Form que permita tabular los puntajes y comentarios. Implementar este proceso le permitirá a la empresa identificar oportunidades de mejora, que a su vez incrementará la calidad y cantidad de servicios prestados. Implementar mejores medidas de seguridad en el modelo de BI para proteger los datos confidenciales de la empresa y garantizar que solo los usuarios autorizados tengan acceso a ellos. Las PYMES pueden implementar varias medidas de seguridad, incluido el control de acceso basado en roles de usuario, encriptación de la información, el enmascaramiento de datos, autenticación de usuarios, actualizaciones constantes, registros de auditoría, entre otros. Al adoptar un enfoque proactivo de la seguridad en el modelo de BI, la empresa puede minimizar el riesgo de violaciones de datos y otras amenazas a la seguridad, generar confianza con sus clientes y partes interesadas, y proteger su negocio de posibles consecuencias legales y financieras. Una oportunidad de mejora de la solución desarrollada es la implementación de las dimensiones lentamente cambiantes o SCD por sus siglas en inglés (Slowly Changing Dimension) del tipo 2, que permitiría gestionar versiones de los registros en las dimensiones. Actualmente se ha implementado la versión 1 de SCD que reemplaza los valores de las tablas, con el SCD tipo 2 se añadiría un nuevo registro cada vez que se procese la tabla, y a través de columnas de hecha inicio y fin de validez, se podría identificar que registro se debe usar para una transacción en un día en específico, esto mejoraría la integridad de los datos históricos. Desarrollar proyectos de investigación y/o aplicación en los temas de inteligencia de negocios, Big Data e inteligencia artificial al ser áreas de tendencia en las ciencias informáticas. El desarrollo de este tipo de proyectos aporta insumos valiosos para aumentar la competitividad y desarrollo del país. REFERENCIAS [1] C. Lennerholt, J. Van Laere, and E. Söderström, “User-Related Challenges of Self-Service Business Intelligence,” Inf. Syst. Manag., vol. 38, no. 4, pp. 309–323, 2021, doi: 10.1080/10580530.2020.1814458. [2] S. Khan, M. R. Qader, T. Ka, and S. Abimannan, “Analysis of Business Intelligence Impact on Organizational Performance,” 2020 Int. Conf. Data Anal. Bus. Ind. W. Towar. a Sustain. Econ. ICDABI 2020, pp. 16–19, 2020, doi: 10.1109/ICDABI51230.2020.9325610. [3] R. Raj, S. H. S. Wong, and A. J. Beaumont, “Business intelligence solution for an SME: A case study,” IC3K 2016 - Proc. 8th Int. Jt. Conf. Knowl. Discov. Knowl. Eng. Knowl. Manag., vol. 3, no. Ic3k, pp. 41–50, 2016, doi: 10.5220/0006049500410050. [4] N. Dedić and C. Stanier, “Measuring the success of changes to Business Intelligence solutions to improve Business Intelligence reporting,” J. Manag. Anal., vol. 4, no. 2, pp. 130–144, 2017, doi: 10.1080/23270012.2017.1299048. [5] A. Milan, J. Mejia, M. Munoz, and C. Carballo, “Success factors and benefits of using business intelligence for corporate performance management,” Appl. Softw. Eng. - Proc. 9th Int. Conf. Softw. Process Improv. CIMPS 2020, pp. 19–27, 2020, doi: 10.1109/CIMPS52057.2020.9390108. [6] Feng Ni, David Arnott & Shijia Gao. (2019). The anchoring effect in business intelligence supported decision-making, Journal of Decision Systems, 28:2, 67-81, DOI: 10.1080/12460125.2019.1620573 [7] B. Ramesh and A. Ramakrishna. (2018). Unified Business Intelligence Ecosystem: A Project Management Approach to Address Business Intelligence Challenges, 2018 Portland International Conference on Management of Engineering and Technology (PICMET), pp. 1-10, doi: 10.23919/PICMET.2018.8481744. [8] Argueta, C. and Maldonado, C. " Business Intelligence como soporte de las decisiones estratégicas, tácticas y operacionales de las organizaciones". M.S. thesis, Universidad de El Salvador, San Salvador, 2016. [Online]. Available: https://ri.ues.edu.sv/id/eprint/11125/ [9] Srivastava, G., Muneeswari, S., Venkataraman, R., Kavitha, V., & Parthiban, N. (2022). A review of the state of the art in business intelligence software. Enterprise Information Systems, 16(1), 1–28. https://doi.org/10.1080/17517575.2021.1872107 [10] Enciclopedia de clasificaciones. (2016). Tipos de investigación. Marzo, 10, 2017, de Enciclopedia de clasificaciones Sitio web: http://www.tiposde.org/general/484-tipos-de-investigacion/ [11] Hernández Sampieri, R., Fernández, C., & Baptista, M. D. P. (2014, mayo 23). Metodología De La Investigación (5th ed.). McGraw-Hill Interamericana de España S.L. p. 534. [12] 2022 Gartner® Magic QuadrantTM I Microsoft Power BI. (2022). Consultado septiembre 29, 2022, de https://info.microsoft.com/ww- landing-2022-gartner-mq-report-on-bi-and-analytics- platforms.html?lcid=en-us [13] L. Yessad and A. Labiod. (2016). Comparative study of data warehouses modeling approaches: Inmon, Kimball and Data Vault, 2016 International Conference on [14] B. Gina and A. Budree. (2020). A Review of Literature on Critical Factors that Drive the Selection of Business Intelligence Tools, 2020 International Conference on Artificial Intelligence, Big Data, Computing and Data Communication Systems (icABCD), pp. 1-7, doi: 10.1109/icABCD49160.2020.9183852. [15] Compara Planes y Precios de Google. (2023). Google Workspace. Consultado 22 de abril de 2023, de https://workspace.google.com/intl/es-419/pricing.html [16] BigQuery Pricing: Cloud Data Warehouse. (2023). Google Cloud. Consultado 22 de abril de 2023, de https://cloud.google.com/bigquery/pricing [17] Pricing and Product Comparison. (2023). Microsoft Power BI. Recuperado 22 de abril de 2023, de https://powerbi.microsoft.com/en- us/pricing/ [18] A. Milán, J. Mejía, M. Muñoz and C. Carballo. (2020). Success factors and benefits of using business intelligence for corporate performance management, 2020 9th International Conference On Software Process Improvement (CIMPS), pp. 19-27, doi: 10.1109/CIMPS52057.2020.9390108. [19] M. Santos, E. João, J. Canelas, J. Bernardino and I. Pedrosa. (2021). The Incorporation of Business Intelligence with Enterprise Resource Planning in SMEs, 2021 16th Iberian Conference on Information Systems and Technologies (CISTI), pp. 1-6, doi: 10.23919/CISTI52073.2021.9476341. [20] Kasem, M., & E. Hassanein, E. (2014). Cloud Business Intelligence Survey. International journal of computer applications, 90(1), 23–28. https://doi.org/10.5120/15540-4266 [21] C. Siemen, N. Clever, B. Barann and J. Becker. (2018). Requirements Elicitation for an Inter-Organizational Business Intelligence System for Small and Medium Retail Enterprises, 2018 IEEE 20th Conference on Business Informatics (CBI), pp. 129-138, doi: 10.1109/CBI.2018.00023. [22] S. Feng. (2019). Research on Demand Control of Business Intelligence, 2019 International Conference on Machine Learning, Big Data and Business Intelligence (MLBDBI), pp. 292-295, doi: 10.1109/MLBDBI48998.2019.00065. INFORMACIÓN DE LOS AUTORES Silvia Johanna De Paz nació en San Salvador, el 25 de marzo de 1991. Se graduó del Colegio Español Padre Arrupe y estudió en la Universidad Don Bosco la carrera de Ingeniería en Ciencias de la Computación, actualmente cursa la Maestría en Arquitectura de Software en la misma universidad. Su experiencia laboral incluye la consultora de software View IT Full, la Compañía Canadiense de call- centers y SaaS, TELUS International y la consultora de software Applaudo. Sus campos de interés de especialización incluyen la gerencia de proyectos, minería de datos e inteligencia de negocios. Melvin Ivan Reyes nació en San Salvador, el 30 de diciembre de 1992. Graduado del Colegio Salesiano Santa Cecilia estudio en la Universidad de El Salvador obteniendo el título de Ingeniero de Sistemas Informáticos. Actualmente estudiante de la Maestría de Arquitectura de Software en la Universidad Don Bosco. Con experiencia laboral en proyectos internacionales como Domestic Resource Mobilization, USAID Project y como consultor en el Ministerio de Hacienda. Campos de interés son temas relacionados con Big data, Machine learning e inteligencia artificial. Moisés Antonio Ramos López nació en San Salvador departamento de El Salvador, el 15 de diciembre e 1989. Graduado del Colegio Liceo Salvadoreño y de la Universidad Centroamericana “José Simeón Cañas” con el título de Licenciado en Ciencias de la Computación. Su experiencia laboral incluye 8 años en el desarrollo web y habilidades tecnológicas. Actualmente se desempeña como desarrollador e-commerce en la empresa RSM El Salvador, Ltda de C.V., donde está a cargo de desarrollar, diseñar y gestionar varios sistemas de compra y venta de productos y servicios.