UNIVERSIDAD DON BOSCO FACULTAD DE INGENIERIA ESCUELA DE COMPUTACION “SISTEMA PARA EL DISEÑO, CAPTURA DE DATOS, CODIFICACION Y PROCESAMIENTO DE INFORMACION PARA EL DESARROLLO DE INVESTIGACIONES SOCIALES CUANTITATIVAS” TESIS DE GRADUACION PARA OPTAR AL TITULO DE INGENIERO EN CIENCIAS DE LA COMPUTACION PRESENTADO POR: DANIEL ADOLFO ARITA ASCENCIO JOSE ANTONIO AYALA MARIN CARLOS EMILIO CONSTANZA TREJO OCTUBRE 2004 SAN SALVADOR, EL SALVADOR C.A. UNIVERSIDAD DON BOSCO RECTOR Ing. FEDERICO HUGUET RIVERA VICERECTOR ACADEMICO Padre VICTOR BERMUDEZ SECRETARIO GENERAL Lic. MARIO RAFAEL OLMOS DECANO DE LA FACULTAD DE INGENIERIA Ing. ERNESTO GODOFREDO GIRON UNIVERSIDAD DON BOSCO FACULTAD DE INGENIERIA COMITÉ EVALUADOR DEL TRABAJO DE GRADUACION Ing. ALEJANDRO BARRERA Jurado Dr. JORGE LEMUS Jurado Ing. CRISTIAN RODRIGUEZ Jurado Lic. OSCAR MENDEZ Asesor Agradecimientos A Dios: Por darme fuerzas y sabiduría para poder concluir con éxito mi carrera, por escuchar mis oraciones y ayudarme en los momentos más difíciles. A mi Familia: A mi mamá Nora Alicia Ascencio por siempre apoyarme y estar presente en sus oraciones, por aguantar mi estrés y tenerme mucha paciencia y por su amor incondicional; a mi papá René Fermín Arita Mancía quien en todo momento estuvo pendiente y siempre me brindo un consejo y su apoyo; a mi hermano René Fermín Arita Ascencio quien siempre creyó en mi y me brindo su ayuda. A toda mi familia por tener la plena confianza que alcanzaría este momento. Gracias a todos. A Emilio y Marín, por el apoyo y ayuda desde el inicio de la carrera; a sus familias, en especial a sus padres por haberme brindado su apoyo y haberme recibido en sus hogares. A una persona muy especial Beatriz Hernández quien siempre tuvo palabras de ánimos y alientos en esos momentos de flaqueza y siempre me ha brindado su apoyo y cariño, muchísimas gracias. A mis amigos por todo el apoyo y ayuda que brindaron en todo momento de la carrera. Al Lic. Oscar Méndez y Lic. Miguel Bautista por brindarme una parte de su conocimiento y por haberme dado un voto de confianza en el ámbito laboral. Daniel Adolfo Arita Ascencio. Agradecimientos A DIOS: Por haberme permitido concluir con éxito mis estudios. A Mis Padres: Lic. José Antonio Ayala Zacarías por ser un ejemplo para mí y por ser un amigo que ha estado siempre dispuesto ha brindarme su ayuda y sus consejos en todo momento; y Carmen Marín de Ayala por incluirme en todas sus oraciones y tenerme paciencia; enseñándome que cuando uno cae, lo importante es levantarse y seguir adelante. A Mis Hermanas: Reina de los Ángeles, Verónica y María del Carmen por enseñarme a ser humilde y luchar por lo que uno quiere, para seguir adelante. A Mis Sobrinos: Gabriela, Eduardo y Alejandro, a quienes les dedico este triunfo, por ser una razón más de felicidad dentro de la familia. A Daniel y Emilio por todo el apoyo a lo largo de la carrera, y por la paciencia que nos tuvimos. A todas aquellas personas (amigos, compañeros, maestros, etc.) que hicieron posible de una forma u otra llevar a feliz termino mi carrera y a FEPADE: por haber depositado en mí la confianza, dándome su apoyo económico y que espero no haber defraudado. José Antonio Ayala Marín Agradecimientos En primer lugar a Dios y a toda mi familia: a mi hermano Chamba, a mis primos, tíos, sobrinos, y en especial a las dos personas que son todo para mi, mi madre Miriam Trejo y mi abuela Mamá Mila. A mis compañeros de tesis, Daniel y José, por el apoyo y ayuda desde el inicio de la carrera; a sus familias, en especial a sus padres y hermanos por habernos soportado durante todo este tiempo. A Natalia, Tania, Iris Odena, Ana Beatriz, Fah, Mercy, Nelson, Rober, Marlene, Brian, Jorge, Eliseo; al grupo de los pipiris; al Lic. Alberto Barillas por toda su colaboración y tiempo; a DADA DADA & CIA, en especial a todo el personal de la 4ª. planta; y a todas aquellas personas que de alguna u otra forma han extendido su mano para ayudarme a llegar hasta acá, a todos, muchas gracias. Carlos Emilio Constanza Trejo INDICE INTRODUCCIÓN ............................................................................................... 1 ....................................................................................................................... 1 JUSTIFICACIÓN ............................................................................................... 2 OBJETIVOS DEL PROYECTO .............................................................................. 3 OBJETIVO GENERAL ................................................................................................................................... 3 OBJETIVOS ESPECIFICOS .......................................................................................................................... 3 ALCANCES Y LIMITACIONES DEL PROYECTO .................................................... 4 ALCANCES .................................................................................................................................................... 4 LIMITACIONES ............................................................................................................................................. 6 I. GENERALIDADES .......................................................................................... 7 DENTRO DE ESTE CAPÍTULO SE TRATAN ASPECTOS GENERALES QUE DAN UNA INTRODUCCIÓN AL MUNDO DE LA TEORÍA DE ENCUESTAS; PRESENTANDO LOS DIFERENTES TIPOS DE ENCUESTAS Y LOS PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA. TAMBIÉN SE INCLUYE INFORMACIÓN SOBRE LOS DISEÑOS MUESTRALES Y LA ESTADÍSTICA DESCRIPTIVA, LA CUÁL ES UTILIZADA PARA EL ANÁLISIS DE LOS RESULTADOS OBTENIDOS A TRAVÉS DE UNA INVESTIGACIÓN POR ENCUESTAS. ............................. 7 1.1 MARCO TEORICO .................................................................................................................................. 7 1.1.1 DEFINICION DE ENCUESTA .......................................................................................................... 7 1.1.2 INVESTIGACIÓN POR ENCUESTAS .............................................................................................. 8 1.1.3 TIPOS DE ENCUESTAS ................................................................................................................... 8 1.1.4 PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA ................................................................. 9 1.1.5 CARACTERÍSTICAS DE LAS PREGUNTAS ABIERTAS Y CERRADAS ....................................... 10 1.1.6 CODIFICACIÓN DE LAS PREGUNTAS ........................................................................................ 11 1.1.7 PRESENTACIÓN Y ADMINISTRACIÓN DE UN CUESTIONARIO .............................................. 11 1.2 DISEÑOS MUESTRALES ..................................................................................................................... 12 1.2.1 CONCEPTOS BASICOS DEL MUESTREO ................................................................................... 12 1.2.2 TIPOS DE MUESTREO .................................................................................................................. 12 1.3 ESTADISTICA DESCRIPTIVA ............................................................................................................. 13 1.3.1 CONCEPTOS BASICOS DE ESTADISTICA DESCRIPTIVA ......................................................... 13 1.3.2 PRESENTACION DE LA INFORMACION ..................................................................................... 14 1.3.3 REDUCCION DE DATOS ............................................................................................................... 16 1.3.3 ANALISIS TAXONOMICO .............................................................................................................. 23 II. DEFINICIÓN DEL PROYECTO ..................................................................... 24 2.1 SITUACION ACTUAL. .......................................................................................................................... 24 2.2 PLANTEAMIENTO DEL SISTEMA ..................................................................................................... 24 2.2.1 MODULO 1: Diseño de la investigación y generación de encuestas. ............................................ 25 2.2.2 MODULO 2: Recolección y Codificación de Datos. ....................................................................... 26 2.2.3 MODULO 3: Análisis y Reportes Estadísticos. .............................................................................. 26 III. RECURSOS Y TECNOLOGIAS ................................................................... 28 3.1 JAVA ....................................................................................................................................................... 28 Cualidades principales de Java ................................................................................................................ 28 La arquitectura cliente/servidor de tipo thin client .................................................................................. 31 3.2 MICROSOFT® SQL SERVER™ 2000 ............................................................................................................. 33 Características de Microsoft® SQL Server™ 2000 ................................................................................. 33 Lenguaje de consulta estructurado ........................................................................................................... 34 Lenguaje de marcado extensible ............................................................................................................. 34 Comparación con otras tecnologías de Bases de Datos .......................................................................... 34 3.3 XML ........................................................................................................................................................ 34 Ventajas de XML sobre HTML ................................................................................................................ 35 3.4 JAVASCRIPT .......................................................................................................................................... 37 Ventajas ................................................................................................................................................... 37 Desventajas ............................................................................................................................................... 37 3.5 HERRAMIENTAS DE DISEÑO WEB .................................................................................................. 38 3.6 SERVIDOR APACHE TOMCAT ........................................................................................................... 39 Protocolo HTTP ........................................................................................................................................ 39 IV. ANALISIS DEL SISTEMA .......................................................................... 40 4.1 TIPO DE INFORMACION QUE SE MANEJA ..................................................................................... 40 4.2 USUARIOS ........................................................................................................................................... 40 4.3 BASES DE DATOS .............................................................................................................................. 41 4.4 INFORMACION TECNICA ................................................................................................................... 41 4.4.1 SERVIDOR WEB ............................................................................................................................ 42 4.4.2 SERVIDOR DE DATOS .................................................................................................................. 45 4.4.3 LIBRERÍA Cewolf ........................................................................................................................... 45 4.4.4 CONFIGURACIÓN DE ASP EN POCKET PC .............................................................................. 46 4.4.5 BASES DE DATOS PARA LOS DISPOSITIVOS DE BOLSILLO WINDOWS CE ......................... 47 4.5 INFORMACION OPERATIVA .............................................................................................................. 49 4.6DEFINICION DE PROCESOS Y DIAGRAMAS DE FLUJO DE DATOS ........................................... 50 4.6.1 MODULO DE ADMINISTRACION ................................................................................................ 50 4.6.2 MODULO 1: DISEÑO DE ENCUESTAS ........................................................................................... 52 4.6.3 MODULO 2: DESARROLLO DE ENCUESTA ................................................................................. 54 4.6.4 MODULO 3: ANALISIS DE RESULTADOS ................................................................................... 55 ..................................................................................................................... 56 V. DISEÑO ..................................................................................................... 57 5.1 DISEÑO DE LAS BASES DE DATOS ................................................................................................. 57 5.1.1 BASE DE DATOS GENERAL ......................................................................................................... 57 5.1.2 DISEÑO DE LAS BASES DE DATOS POR ENCUESTAS ............................................................ 65 TABLA PREGUNTAS ........................................................................................ 70 ALMACENA EL LISTADO DE PREGUNTAS DEFINIDAS PARA LA ENCUESTA. ..... 70 TABLA RESP_OBTENIDAS .............................................................................. 71 5.2 DISEÑO DE LA INTERFAZ DE USUARIO ....................................................................................... 75 5.2.1 INTERFAZ PARA LA ADMINISTRACION DEL SISTEMA ........................................................... 75 5.2.2 MODULO I - DISEÑO DE LA ENCUESTA .................................................................................... 77 5.2.3 MODULO II – DESARROLLO DE INVESTIGACION. ................................................................. 78 5.2.4 MODULO III – ANALISIS DE RESULTADOS ............................................................................... 79 VI. COSTOS .................................................................................................... 80 MICROSOFT SQL SERVER ................................................................................................................................ 80 MICROSOFT WINDOWS 2000 SERVER ................................................................................................................. 80 DISPOSITIVOS MÓVILES. ...................................................................................................................................... 80 VII. CONCLUSIONES ...................................................................................... 81 BIBLIOGRAFIA ............................................................................................... 82 GLOSARIO ...................................................................................................... 86 INDICE DE FIGURAS INTRODUCCIÓN ............................................................................................... 1 ....................................................................................................................... 1 JUSTIFICACIÓN ............................................................................................... 2 OBJETIVOS DEL PROYECTO .............................................................................. 3 OBJETIVO GENERAL ................................................................................................................................... 3 OBJETIVOS ESPECIFICOS .......................................................................................................................... 3 ALCANCES Y LIMITACIONES DEL PROYECTO .................................................... 4 ALCANCES .................................................................................................................................................... 4 LIMITACIONES ............................................................................................................................................. 6 I. GENERALIDADES .......................................................................................... 7 DENTRO DE ESTE CAPÍTULO SE TRATAN ASPECTOS GENERALES QUE DAN UNA INTRODUCCIÓN AL MUNDO DE LA TEORÍA DE ENCUESTAS; PRESENTANDO LOS DIFERENTES TIPOS DE ENCUESTAS Y LOS PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA. TAMBIÉN SE INCLUYE INFORMACIÓN SOBRE LOS DISEÑOS MUESTRALES Y LA ESTADÍSTICA DESCRIPTIVA, LA CUÁL ES UTILIZADA PARA EL ANÁLISIS DE LOS RESULTADOS OBTENIDOS A TRAVÉS DE UNA INVESTIGACIÓN POR ENCUESTAS. ............................. 7 1.1 MARCO TEORICO .................................................................................................................................. 7 1.1.1 DEFINICION DE ENCUESTA .......................................................................................................... 7 1.1.2 INVESTIGACIÓN POR ENCUESTAS .............................................................................................. 8 1.1.3 TIPOS DE ENCUESTAS ................................................................................................................... 8 1.1.4 PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA ................................................................. 9 1.1.5 CARACTERÍSTICAS DE LAS PREGUNTAS ABIERTAS Y CERRADAS ....................................... 10 1.1.6 CODIFICACIÓN DE LAS PREGUNTAS ........................................................................................ 11 1.1.7 PRESENTACIÓN Y ADMINISTRACIÓN DE UN CUESTIONARIO .............................................. 11 1.2 DISEÑOS MUESTRALES ..................................................................................................................... 12 1.2.1 CONCEPTOS BASICOS DEL MUESTREO ................................................................................... 12 1.2.2 TIPOS DE MUESTREO .................................................................................................................. 12 1.3 ESTADISTICA DESCRIPTIVA ............................................................................................................. 13 1.3.1 CONCEPTOS BASICOS DE ESTADISTICA DESCRIPTIVA ......................................................... 13 1.3.2 PRESENTACION DE LA INFORMACION ..................................................................................... 14 1.3.3 REDUCCION DE DATOS ............................................................................................................... 16 1.3.3 ANALISIS TAXONOMICO .............................................................................................................. 23 II. DEFINICIÓN DEL PROYECTO ..................................................................... 24 2.1 SITUACION ACTUAL. .......................................................................................................................... 24 2.2 PLANTEAMIENTO DEL SISTEMA ..................................................................................................... 24 2.2.1 MODULO 1: Diseño de la investigación y generación de encuestas. ............................................ 25 2.2.2 MODULO 2: Recolección y Codificación de Datos. ....................................................................... 26 2.2.3 MODULO 3: Análisis y Reportes Estadísticos. .............................................................................. 26 III. RECURSOS Y TECNOLOGIAS ................................................................... 28 3.1 JAVA ....................................................................................................................................................... 28 Cualidades principales de Java ................................................................................................................ 28 La arquitectura cliente/servidor de tipo thin client .................................................................................. 31 3.2 MICROSOFT® SQL SERVER™ 2000 ............................................................................................................. 33 Características de Microsoft® SQL Server™ 2000 ................................................................................. 33 Lenguaje de consulta estructurado ........................................................................................................... 34 Lenguaje de marcado extensible ............................................................................................................. 34 Comparación con otras tecnologías de Bases de Datos .......................................................................... 34 3.3 XML ........................................................................................................................................................ 34 Ventajas de XML sobre HTML ................................................................................................................ 35 3.4 JAVASCRIPT .......................................................................................................................................... 37 Ventajas ................................................................................................................................................... 37 Desventajas ............................................................................................................................................... 37 3.5 HERRAMIENTAS DE DISEÑO WEB .................................................................................................. 38 3.6 SERVIDOR APACHE TOMCAT ........................................................................................................... 39 Protocolo HTTP ........................................................................................................................................ 39 IV. ANALISIS DEL SISTEMA .......................................................................... 40 4.1 TIPO DE INFORMACION QUE SE MANEJA ..................................................................................... 40 4.2 USUARIOS ........................................................................................................................................... 40 4.3 BASES DE DATOS .............................................................................................................................. 41 4.4 INFORMACION TECNICA ................................................................................................................... 41 4.4.1 SERVIDOR WEB ............................................................................................................................ 42 4.4.2 SERVIDOR DE DATOS .................................................................................................................. 45 4.4.3 LIBRERÍA Cewolf ........................................................................................................................... 45 4.4.4 CONFIGURACIÓN DE ASP EN POCKET PC .............................................................................. 46 4.4.5 BASES DE DATOS PARA LOS DISPOSITIVOS DE BOLSILLO WINDOWS CE ......................... 47 4.5 INFORMACION OPERATIVA .............................................................................................................. 49 4.6DEFINICION DE PROCESOS Y DIAGRAMAS DE FLUJO DE DATOS ........................................... 50 4.6.1 MODULO DE ADMINISTRACION ................................................................................................ 50 4.6.2 MODULO 1: DISEÑO DE ENCUESTAS ........................................................................................... 52 4.6.3 MODULO 2: DESARROLLO DE ENCUESTA ................................................................................. 54 4.6.4 MODULO 3: ANALISIS DE RESULTADOS ................................................................................... 55 ..................................................................................................................... 56 V. DISEÑO ..................................................................................................... 57 5.1 DISEÑO DE LAS BASES DE DATOS ................................................................................................. 57 5.1.1 BASE DE DATOS GENERAL ......................................................................................................... 57 5.1.2 DISEÑO DE LAS BASES DE DATOS POR ENCUESTAS ............................................................ 65 TABLA PREGUNTAS ........................................................................................ 70 ALMACENA EL LISTADO DE PREGUNTAS DEFINIDAS PARA LA ENCUESTA. ..... 70 TABLA RESP_OBTENIDAS .............................................................................. 71 5.2 DISEÑO DE LA INTERFAZ DE USUARIO ....................................................................................... 75 5.2.1 INTERFAZ PARA LA ADMINISTRACION DEL SISTEMA ........................................................... 75 5.2.2 MODULO I - DISEÑO DE LA ENCUESTA .................................................................................... 77 5.2.3 MODULO II – DESARROLLO DE INVESTIGACION. ................................................................. 78 5.2.4 MODULO III – ANALISIS DE RESULTADOS ............................................................................... 79 VI. COSTOS .................................................................................................... 80 MICROSOFT SQL SERVER ................................................................................................................................ 80 MICROSOFT WINDOWS 2000 SERVER ................................................................................................................. 80 DISPOSITIVOS MÓVILES. ...................................................................................................................................... 80 VII. CONCLUSIONES ...................................................................................... 81 BIBLIOGRAFIA ............................................................................................... 82 GLOSARIO ...................................................................................................... 86 INDICE DE TABLAS INTRODUCCIÓN ............................................................................................... 1 ....................................................................................................................... 1 JUSTIFICACIÓN ............................................................................................... 2 OBJETIVOS DEL PROYECTO .............................................................................. 3 OBJETIVO GENERAL ................................................................................................................................... 3 OBJETIVOS ESPECIFICOS .......................................................................................................................... 3 ALCANCES Y LIMITACIONES DEL PROYECTO .................................................... 4 ALCANCES .................................................................................................................................................... 4 LIMITACIONES ............................................................................................................................................. 6 I. GENERALIDADES .......................................................................................... 7 DENTRO DE ESTE CAPÍTULO SE TRATAN ASPECTOS GENERALES QUE DAN UNA INTRODUCCIÓN AL MUNDO DE LA TEORÍA DE ENCUESTAS; PRESENTANDO LOS DIFERENTES TIPOS DE ENCUESTAS Y LOS PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA. TAMBIÉN SE INCLUYE INFORMACIÓN SOBRE LOS DISEÑOS MUESTRALES Y LA ESTADÍSTICA DESCRIPTIVA, LA CUÁL ES UTILIZADA PARA EL ANÁLISIS DE LOS RESULTADOS OBTENIDOS A TRAVÉS DE UNA INVESTIGACIÓN POR ENCUESTAS. ............................. 7 1.1 MARCO TEORICO .................................................................................................................................. 7 1.1.1 DEFINICION DE ENCUESTA .......................................................................................................... 7 1.1.2 INVESTIGACIÓN POR ENCUESTAS .............................................................................................. 8 1.1.3 TIPOS DE ENCUESTAS ................................................................................................................... 8 1.1.4 PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA ................................................................. 9 1.1.5 CARACTERÍSTICAS DE LAS PREGUNTAS ABIERTAS Y CERRADAS ....................................... 10 1.1.6 CODIFICACIÓN DE LAS PREGUNTAS ........................................................................................ 11 1.1.7 PRESENTACIÓN Y ADMINISTRACIÓN DE UN CUESTIONARIO .............................................. 11 1.2 DISEÑOS MUESTRALES ..................................................................................................................... 12 1.2.1 CONCEPTOS BASICOS DEL MUESTREO ................................................................................... 12 1.2.2 TIPOS DE MUESTREO .................................................................................................................. 12 1.3 ESTADISTICA DESCRIPTIVA ............................................................................................................. 13 1.3.1 CONCEPTOS BASICOS DE ESTADISTICA DESCRIPTIVA ......................................................... 13 1.3.2 PRESENTACION DE LA INFORMACION ..................................................................................... 14 1.3.3 REDUCCION DE DATOS ............................................................................................................... 16 1.3.3 ANALISIS TAXONOMICO .............................................................................................................. 23 II. DEFINICIÓN DEL PROYECTO ..................................................................... 24 2.1 SITUACION ACTUAL. .......................................................................................................................... 24 2.2 PLANTEAMIENTO DEL SISTEMA ..................................................................................................... 24 2.2.1 MODULO 1: Diseño de la investigación y generación de encuestas. ............................................ 25 2.2.2 MODULO 2: Recolección y Codificación de Datos. ....................................................................... 26 2.2.3 MODULO 3: Análisis y Reportes Estadísticos. .............................................................................. 26 III. RECURSOS Y TECNOLOGIAS ................................................................... 28 3.1 JAVA ....................................................................................................................................................... 28 Cualidades principales de Java ................................................................................................................ 28 La arquitectura cliente/servidor de tipo thin client .................................................................................. 31 3.2 MICROSOFT® SQL SERVER™ 2000 ............................................................................................................. 33 Características de Microsoft® SQL Server™ 2000 ................................................................................. 33 Lenguaje de consulta estructurado ........................................................................................................... 34 Lenguaje de marcado extensible ............................................................................................................. 34 Comparación con otras tecnologías de Bases de Datos .......................................................................... 34 3.3 XML ........................................................................................................................................................ 34 Ventajas de XML sobre HTML ................................................................................................................ 35 3.4 JAVASCRIPT .......................................................................................................................................... 37 Ventajas ................................................................................................................................................... 37 Desventajas ............................................................................................................................................... 37 3.5 HERRAMIENTAS DE DISEÑO WEB .................................................................................................. 38 3.6 SERVIDOR APACHE TOMCAT ........................................................................................................... 39 Protocolo HTTP ........................................................................................................................................ 39 IV. ANALISIS DEL SISTEMA .......................................................................... 40 4.1 TIPO DE INFORMACION QUE SE MANEJA ..................................................................................... 40 4.2 USUARIOS ........................................................................................................................................... 40 4.3 BASES DE DATOS .............................................................................................................................. 41 4.4 INFORMACION TECNICA ................................................................................................................... 41 4.4.1 SERVIDOR WEB ............................................................................................................................ 42 4.4.2 SERVIDOR DE DATOS .................................................................................................................. 45 4.4.3 LIBRERÍA Cewolf ........................................................................................................................... 45 4.4.4 CONFIGURACIÓN DE ASP EN POCKET PC .............................................................................. 46 4.4.5 BASES DE DATOS PARA LOS DISPOSITIVOS DE BOLSILLO WINDOWS CE ......................... 47 4.5 INFORMACION OPERATIVA .............................................................................................................. 49 4.6DEFINICION DE PROCESOS Y DIAGRAMAS DE FLUJO DE DATOS ........................................... 50 4.6.1 MODULO DE ADMINISTRACION ................................................................................................ 50 4.6.2 MODULO 1: DISEÑO DE ENCUESTAS ........................................................................................... 52 4.6.3 MODULO 2: DESARROLLO DE ENCUESTA ................................................................................. 54 4.6.4 MODULO 3: ANALISIS DE RESULTADOS ................................................................................... 55 ..................................................................................................................... 56 V. DISEÑO ..................................................................................................... 57 5.1 DISEÑO DE LAS BASES DE DATOS ................................................................................................. 57 5.1.1 BASE DE DATOS GENERAL ......................................................................................................... 57 5.1.2 DISEÑO DE LAS BASES DE DATOS POR ENCUESTAS ............................................................ 65 TABLA PREGUNTAS ........................................................................................ 70 ALMACENA EL LISTADO DE PREGUNTAS DEFINIDAS PARA LA ENCUESTA. ..... 70 TABLA RESP_OBTENIDAS .............................................................................. 71 5.2 DISEÑO DE LA INTERFAZ DE USUARIO ....................................................................................... 75 5.2.1 INTERFAZ PARA LA ADMINISTRACION DEL SISTEMA ........................................................... 75 5.2.2 MODULO I - DISEÑO DE LA ENCUESTA .................................................................................... 77 5.2.3 MODULO II – DESARROLLO DE INVESTIGACION. ................................................................. 78 5.2.4 MODULO III – ANALISIS DE RESULTADOS ............................................................................... 79 VI. COSTOS .................................................................................................... 80 MICROSOFT SQL SERVER ................................................................................................................................ 80 MICROSOFT WINDOWS 2000 SERVER ................................................................................................................. 80 DISPOSITIVOS MÓVILES. ...................................................................................................................................... 80 VII. CONCLUSIONES ...................................................................................... 81 BIBLIOGRAFIA ............................................................................................... 82 GLOSARIO ...................................................................................................... 86 INTRODUCCIÓN La investigación es una fuente importante de información, es por ello que el presente documento se desarrolla en base a la creación de un sistema de información que sirva como herramienta útil a los investigadores y que garantice la efectividad en el diseño y la estructuración de las investigaciones. Para el proyecto desarrollado se necesitó una base teórica que diera soporte a las metodologías y a las herramientas tecnológicas utilizadas. Esta base teórica está descrita en el primer capítulo de este documento, en donde se presentan aspectos generales de la teoría de encuestas, los diseños muestrales y estadística descriptiva. En forma general el sistema diseñado se divide en tres grandes módulos. El primero de éstos consiste en un módulo de diseño, en el cual se definen los aspectos básicos de la estructuración de la encuesta, como son sus objetivos, justificación, planteamiento de las preguntas, entre otros. En un segundo módulo se lleva a cabo la captura de la información, así como su codificación. Este proceso utiliza tecnologías orientadas a ambientes Web y a dispositivos móviles. Finalmente se incluye un módulo para el análisis de la información, el cual proporciona reportes gráficos y estadísticos de los resultados obtenidos. 1 JUSTIFICACIÓN Seria muy apropiado que los investigadores tuviesen la oportunidad de contar con recursos tecnológicos necesarios de tal manera que les faciliten y les ayuden a desarrollar investigaciones con un alto grado de calidad y veracidad; de tal forma que les sirva como apoyo para desarrollar una mejor metodología a la hora de desarrollar investigaciones. Generalmente los investigadores recurren a diferentes técnicas de investigación basadas en experiencias propias o basadas en literaturas dedicadas al estudio de metodologías de investigación. Pero si se combinan estas dos técnicas en un solo sistema de información, se podría alcanzar o garantizar la efectividad en el diseño y estructuración de una investigación, redundando en la fiabilidad de los resultados generados, no solo por los indicadores estadísticos (Error estándar, factor de credibilidad), sino también por su diseño. Las ventajas que presenta el sistema propuesto frente a otras herramientas comerciales existentes, tales como los son SPSS, Stats, etc., son: La integración de los procesos para el desarrollo de investigaciones por encuestas, la capacidad del sistema para trabajar bajo ambientes de redes informáticas, la facilidad de uso del sistema, el soporte para el uso de tecnologías de punta para ambientes web y dispositivos móviles. Es por ello que el desarrollo de este proyecto de graduación puede incentivar a la Universidad Don Bosco, para incursionar en el ámbito de las investigaciones sociales, mediante el uso de esta herramienta que puede servir como un pilar importante para el desarrollo de investigaciones. 2 OBJETIVOS DEL PROYECTO OBJETIVO GENERAL Diseñar y desarrollar una herramienta tecnológica que, haciendo uso de tecnologías de punta de ambiente Web y dispositivos móviles, facilite el trabajo de diseño, captura de datos, codificación y procesamiento de información a investigadores de fenómenos en el área social, generando resultados de forma estructurada y que cumplan con los estándares metodológicos en investigaciones cuantitativas. OBJETIVOS ESPECIFICOS � Crear una interfaz que realice la función de asistente para el diseño de una investigación de forma lógica, ordenada y sistemática. � Integrar el diseño de la investigación, captura de datos, codificación de información y el análisis estadístico básico en un solo sistema. � Crear una interfaz con equipos móviles para la captura de información. � Crear una interfaz en ambiente Web para captura de datos y/o publicación de resultados. � Proporcionar una estructura de almacenamiento de la información de diseño y de las variables que interactúan en la investigación. � Generar Reportes Estadísticos y Gráficos con la información recolectada. � Desarrollar una herramienta que facilite el ingreso de la información recolectada a través de encuestas, y que a la vez almacene dicha información de forma tal, que permita aplicar métodos estadísticos para su correspondiente análisis. 3 ALCANCES Y LIMITACIONES DEL PROYECTO ALCANCES � Apoyo en el diseño de investigaciones sociales cuantitativas (educación, salud, trabajo, vivienda, etc.) realizadas por medio de encuestas. � El sistema está diseñado para ser utilizado en ambiente Windows; sin embargo, puede funcionar en ambientes Linux siempre y cuando exista un servidor de datos SQL para el manejo de la base de datos propia del sistema. � Después de haber ingresado la información obtenida por medio de la encuesta, el sistema proporcionará al usuario herramientas para el análisis estadístico, y a la vez proporcionará información en forma gráfica de los resultados. � El sistema será capaz de generar reportes que incluyen los estadísticos Frecuencias, Desviación típica, Coeficiente de Variación, Desviación estándar, varianza, media y mediana. � La información recolectada por las encuestas podrá ser ingresada al sistema de forma manual; o bien, podrá ser descargada desde dispositivos móviles como Pocket PC. � El sistema integra los procesos involucrados en el desarrollo de una encuesta en forma modular, desde su diseño hasta la generación de reportes estadísticos y gráficos de resultados. � El sistema funcionará como una herramienta que facilite la codificación de las variables provenientes de preguntas abiertas para que puedan ser procesadas y; además, el sistema codificará por si solo aquellas variables que provengan de preguntas dicotómicas (Si/No), de alternativas múltiples y de selección múltiple. � Creación de una estructura de datos genérica para el almacenamiento de la información del sistema y generación dinámica de estructuras de datos para el 4 manejo de la información relacionada con cada una de las encuestas registradas en el sistema. � Diseño de una interfaz que facilita la administración del sistema; tanto para el control de usuarios y sus respectivos permisos, así como también para el manejo de las bases de datos utilizadas por el sistema. � Manejo de diferentes tipos de usuarios de acuerdo a la información a la cual tienen acceso. � El sistema proporciona herramientas necesarias para el cálculo del número de encuestados que servirá como muestra para la investigación. � Definición del flujo de la encuesta de forma grafica, permitiendo al usuario encargado del diseño crear las relaciones entre las preguntas y las respuestas de la encuesta. � Diseño de una interfaz gráfica para el ingreso de las respuestas obtenidas en las diferentes encuestas generadas en formato impreso, así como también para las encuestas generadas en formato Web. � Análisis cuantitativo de los datos obtenidos de los resultados de la investigación. 5 LIMITACIONES � El servidor de datos del sistema, tendrá que correr bajo la plataforma de Microsoft Windows. � Tanto el diseño de la encuesta como el análisis de los resultados deben ser planteados por un experto; para que, posteriormente sean definidos en el sistema, ya sea, por el mismo experto u otros usuarios. � En el análisis de los resultados, únicamente se contemplaran dos tipos de gráficos: Gráficos de barras verticales planos y gráficos de pastel plano, ya que estos son los gráficos mas utilizados para la presentación de resultados debido a su facilidad de comprensión. � Debido a su complejidad el análisis taxonómico no ha sido contemplado en el sistema. � El flujo de la encuestas es utilizado solamente para hacer las relaciones entre preguntas, no se contempla modificación ni eliminación de relaciones. 6 I. GENERALIDADES Dentro de este capítulo se tratan aspectos generales que dan una introducción al mundo de la teoría de encuestas; presentando los diferentes tipos de encuestas y los pasos para la realización de una encuesta. También se incluye información sobre los diseños muestrales y la estadística descriptiva, la cuál es utilizada para el análisis de los resultados obtenidos a través de una investigación por encuestas. 1.1 MARCO TEORICO 1.1.1 DEFINICION DE ENCUESTA La encuesta es una búsqueda sistemática de información en la que el investigador pregunta sobre los datos que desea obtener, y posteriormente reúne estos datos individuales para obtener durante la evaluación datos agregados. Con la encuesta se trata de obtener, de manera sistemática y ordenada, información sobre las variables que intervienen en una investigación, y esto sobre una población o muestra determinada. Esta información hace referencia a lo que las personas son, hacen, piensan, opinan, sienten, esperan, desean, quieren u odian, aprueban o desaprueban, o los motivos de sus actos, opiniones y actitudes. A diferencia del resto de técnicas de entrevista la particularidad de la encuesta es que realiza a todos los entrevistados las mismas preguntas, en el mismo orden, y en una situación social similar; de modo que las diferencias localizadas son atribuibles a las diferencias entre las personas entrevistadas. Un indicador de la importancia de las encuestas en la sociedad es analizar la presencia de éstas en los medios de comunicación; también la gran cantidad de disciplinas q utilizan habitualmente este instrumento de recolección de información. Todo ello se traduce en investigaciones destinadas al conocimiento de los hábitos de los consumidores, el estudio de la personalidad, las habilidades educativas, etc. El empleo de este instrumento por parte de distintas disciplinas genera una gran variedad de tipos de encuestas, definidos fundamentalmente por el distinto ámbito de actuación, por la temática empleada por cada disciplina. 7 1.1.2 INVESTIGACIÓN POR ENCUESTAS La investigación por encuestas estudia poblaciones grandes o pequeñas, seleccionando y analizando “muestras” elegidas de la población para descubrir la incidencia relativa, la distribución y la interrelación de las variables sociológicas y psicológicas. Suelen así denominarse “encuestas de muestreo”. Sus procedimientos y métodos han sido desarrollados más que nada por psicólogos, sociólogos, economistas, científicos, políticos y estadígrafos. Estos individuos han procurado imponer una rigurosa estampilla científica sobre la investigación de encuestas y en su proceso, influyendo de manera profunda en las ciencias sociales. Ellos quieren saber con mayor aproximación las características de una población o de un universo definido. Esto es así porque la mayor parte de las veces hay dificultades para estudiar poblaciones enteras. Las muestras aleatorias pueden proporcionar a menudo la misma información que un “censo” a un costo menor, con mayor eficiencia y algunas veces con mayor exactitud. Las encuestas por lo general se centran en la gente, los hechos vitales de la gente, sus creencias, opiniones, motivaciones y conductas. 1.1.3 TIPOS DE ENCUESTAS En forma general, las encuestas se pueden dividir en cuatro tipos de acuerdo a la forma en que éstas se realizan: 1. Por entrevista y contacto personal: es la que proporciona mayor abundancia en los datos. Se observa el comportamiento en forma directa y permite repreguntar. No obstante, las preguntas que son de naturaleza más personal pueden ser más difíciles de responder por el entrevistado al no percibir suficiente privacidad. También se requiere mayor tiempo para aplicarlas. 2. Escritas tipo cuestionario: los sujetos se pueden sentir más libres para responder, no obstante se requiere que las preguntas sean cuidadosamente 8 diseñadas para que todos las interpreten de igual manera. Para asegurar la espontaneidad se sugiere que sean anónimas. 3. Encuestas telefónicas: pueden ser rápidas y a bajo costo, pero son limitadas por la falta de cooperación o por la renuencia a contestar algunas preguntas que no sean sencillas ante una persona que no se conoce. 4. Por correo: la mayor parte de las encuestas por correo o a través de terceros, dan lugar a pocas contestaciones. 1.1.4 PASOS PARA LA REALIZACIÓN DE UNA ENCUESTA Como se mencionó anteriormente, en una encuesta se busca obtener información de forma sistemática y ordenada; es por ello que para llevar a cabo una encuesta se deben seguir una serie de pasos que permitirán estructurar de forma lógica el desarrollo de ésta. Estos pasos son: Diseño de la encuesta, recolección de datos y análisis de datos. 1. Diseño de la encuesta El diseño de la encuesta comprende el desarrollo de las siguientes actividades: 1. Definir los objetivos de la investigación. 2. Redactar una presentación inicial que justifique la importancia de obtener la información requerida, con el fin de estandarizar y facilitar su aplicación. 3. Redactar las preguntas en forma clara, sencilla y concreta. 4. Estudiar el plan de muestreo. En la mejor investigación de encuestas se utilizan muestreos aleatorios. 2. Recolección de datos Dependiendo del tipo de encuesta que se esté desarrollando, los métodos para la recolección de datos pueden variar; sin embargo, en forma general, la recolección de datos consiste en obtener las respuestas de la población a las preguntas planteadas en la encuesta. 9 3. Análisis de datos En la parte del análisis es donde se codifican y tabulan las respuestas. Por “codificación” se entiende el proceso de traducción de las respuestas y de la información del entrevistado a categorías específicas para propósitos de análisis. Por “tabulación” se entiende el registro o sumatoria de los tipos de respuestas en las categorías apropiadas, después de los cuales, seguiría el análisis estadístico conveniente: porcentajes, promedios, relaciones individuales y pruebas apropiadas de significancia. Los datos ya tabulados, se analizan y se interpretan para luego reportar los resultados de este proceso interpretativo. 1.1.5 CARACTERÍSTICAS DE LAS PREGUNTAS ABIERTAS Y CERRADAS Las preguntas con respuestas cerradas son fáciles de codificar y de preparar para su análisis. Requieren de un menor esfuerzo de los encuestados, ya que toma menos tiempo el contestarlas. Pero sus desventajas radican en que limitan la cantidad de respuestas posibles, en ocasiones, ninguna de las categorías describe con exactitud lo que la persona tiene en mente. Para formular buenas preguntas cerradas el investigador debe asegurarse de poder anticipar las posibles alternativas de respuestas. Las preguntas con respuestas abiertas son especialmente útiles cuando no se tiene información sobre las posibles respuestas de las personas o cuando esta información es insuficiente. También sirven en situaciones donde se desea profundizar una opinión o los motivos de un comportamiento. Su mayor desventaja es que son más difíciles de codificar, clasificar y preparar para su análisis. Además, pueden presentarse sesgos; tanto del que responde, que interpreta la pregunta a su manera y que puede tener mayor o menor facilidad para expresarse oralmente o por escrito, y sesgos del investigador, para categorizar e interpretar las respuestas. 10 1.1.6 CODIFICACIÓN DE LAS PREGUNTAS Las preguntas abiertas y cerradas son codificadas en formas diferentes; siendo estos los pasos a seguir: � Preguntas Cerradas: Se codifican con símbolos o números. a. Codificar las alternativas de respuestas. b. Elaborar un libro o matriz de datos. c. Generar archivos o carpetas para que el proceso esté listo para ser analizado. � Preguntas Abiertas a. Se deben listar y conocer todas las respuestas que los sujetos han dado a la pregunta. b. Observar la frecuencia con la que aparece cada respuesta. c. Elegir las respuestas que se presentan con mayor frecuencia, que se parecen o son semejantes. d. Clasificar estas respuestas elegidas por “temas” o “aspectos”, de manera lógica. e. Darle un nombre o título a cada tema o patrón general de respuesta. f. Asignarle un código a cada patrón de respuesta. 1.1.7 PRESENTACIÓN Y ADMINISTRACIÓN DE UN CUESTIONARIO Existen dos recomendaciones para la presentación de un cuestionario: 1. Todo cuestionario debe comenzar con una carta de presentación que ocupa generalmente la carátula o la primera página. Debe indicar claramente el propósito del cuestionario y la importancia del estudio. 2. Debe de suministrarse las instrucciones generales para responder. 11 1.2 DISEÑOS MUESTRALES 1.2.1 CONCEPTOS BASICOS DEL MUESTREO Los diseños muestrales se pueden definir como los distintos procedimientos que existen para extraer muestras de poblaciones con el objeto de conocer sus características promedio. Es interesante saber como a través del análisis de sólo una parte de la población se puede inferir lo que está ocurriendo en toda la población. Población es un agregado de unidades individuales, compuesto de personas o cosas, que se hallan en una temática determinada. Las unidades individuales se llaman unidades elementales. Definir una población es limitar el alcance de las unidades elementales de acuerdo al interés que se tiene respecto a alguna característica de la población. La muestra es una parte de la población, por ejemplo cuando se desea hacer un estudio relativo al rendimiento académico de los alumnos de cierta universidad, y se toma solo un grupo de estudiantes de esta universidad. Todos los estudiantes de ella son la población y el grupo escogido constituye la muestra. Es importante hacer notar que para hacer una investigación mediante el análisis de una parte de la población, esta parte tiene, necesariamente, que ser representativa. La representatividad de la muestra, implica que cada unidad de la población, tiene que tener iguales probabilidades de ser seleccionada. En estas condiciones se dice que la muestra es aleatoria. 1.2.2 TIPOS DE MUESTREO Los diseños de muestreo se dividen en dos grandes grupos: muestreos aleatorios y muestreos no aleatorios. El muestreo aleatorio se denomina también probabilístico, ya que se pueden emplear las leyes de la probabilidad. El muestreo no aleatorio es un proceso de selección muestral sin intervención de la aleatoriedad; es decir se selecciona de acuerdo al juicio experto del investigador. 12 El muestreo aleatorio simple es un procedimiento de selección de una muestra por el cual todos y cada uno de los elementos de la población tienen igual probabilidad de ser incluidos; entonces, si toda unidad disponible para observación (llamada unidad de muestreo) tiene la misma probabilidad de ser escogida, se sigue que, "toda muestra aleatoria de igual tamaño, tomada de una población dada, ha de tener la misma probabilidad de ser tomada". El sistema desarrollo utiliza el proceso del muestro aleatorio simple para el calculo de la muestra. 1.3 ESTADISTICA DESCRIPTIVA Es claro que al llevar a cabo una investigación a través de encuestas, la información es enorme y se hace necesario sintetizarla, para poder interpretarla más fácilmente. Este es precisamente el propósito de la disciplina matemática que se conoce con el nombre de Estadística Descriptiva. 1.3.1 CONCEPTOS BASICOS DE ESTADISTICA DESCRIPTIVA La estadística descriptiva se ocupa fundamentalmente de dos cosas: Resumir en un cuadro y luego describir, por medio de un gráfico, un conjunto de datos. Pueden distinguirse dos clases de datos: cualitativos y cuantitativos. Los datos Cualitativos son aquellos que se refieren a cualidades como : color, raza, religión, sexo, etc; mientras que, los datos cuantitativos son los que se refieren a cantidades y que por lo tanto pueden ser designados por variables numéricas, como por ejemplo: estatura en centímetros, peso en kilogramos, número de hijos por familia, sueldo mensual en dólares, etc. Las variables numéricas, a su vez, pueden ser clasificadas en dos clases: discretas y continuas. Una variable discreta solamente puede tomar valores aislados, por ejemplo el número de hijos por familia; en cambio, una variable continua es la que puede tomar cualquier valor de un intervalo. 13 1.3.2 PRESENTACION DE LA INFORMACION Existen diversas formas para presentar la información obtenida en una investigación a través de encuestas. Una de las formas más utilizadas consiste en un cuadro o tabla estadística que contiene la información resumida, el cual se denomina Tabla de Distribución de Frecuencias. La Frecuencia Absoluta o simplemente Frecuencia, se define como el número de veces que aparece repetido un determinado valor de la variable y suele ser representada por la letra f. La frecuencia relativa, que se designa por fr, se obtiene dividiendo la frecuencia f entre el tamaño n de la muestra y multiplicando luego por 100%. En otras palabras: Fr = (f / n) * 100% El total correspondiente a las frecuencias debe ser igual al número de datos, mientras que el total correspondiente a las frecuencias relativas debe ser siempre igual a 100%. Los datos que se resumen por medio de un cuadro o tabla estadística pueden ser presentados por medio de gráficas, las más utilizadas son: � Gráfico de Barras: Se utiliza para representar tanto datos cualitativos como cuantitativos; pero referidos siempre a variables discretas. 14 0 10 20 30 40 50 60 70 80 90 1er trim. 2do trim. 3er trim. 4to trim. Este Oeste Norte Figura 1.1 Gráfico de Barras verticales � Gráfico circular o de sectores: Este gráfico se conoce también con el nombre de Gráfico de Pastel y se utiliza para representar una tabla de atributos. El gráfico circular consiste en un círculo de radio arbitrario que se divide en sectores proporcionales a la frecuencia de los datos. Figura 1.2 Gráfico circular o de sectores 15 TABLA DE DISTRIBUCION DE FRECUENCIAS PARA UNA VARIABLE CONTINUA Resumir un número grande de datos de variable continua para construir una tabla de distribución de frecuencias es, en general, más difícil que resumir un conjunto de datos cualitativos o de datos cuantitativos. Esta dificultad de resumir un conjunto de datos de variable continua puede superarse agrupando los diversos valores en un número reducido de clases, llamadas intervalos de clase. Para agrupar un conjunto de datos, haciendo uso de intervalos de clase, se sigue el procedimiento siguiente: 1. Primero debe decidirse cuantos intervalos se considerarán. 2. Se encuentra el recorrido, el cual es igual a la mayor de las observaciones menos la menor de las observaciones. Recorrido = mayor valor observado- menor valor observado 3. Se divide el recorrido entre el número de intervalos de clase que se desean y este resultado es la amplitud o ancho de cada intervalo. 4. Se forman los intervalos, agregando el ancho al límite inferior de cada clase, principiando por el menor de todos los datos. 5. Se determinan de entre todas las observaciones, aquellas que pertenecen a cada clase o intervalo. Cuando se agrupe un conjunto de datos haciendo uso de intervalos de clase deberá tenerse presente el hecho de que entre menos intervalos de clase tenga la tabla de distribución de frecuencias, más fácil será la “lectura de la información”; porque los datos estarán más concentrados, ésta por supuesto será una ventaja; pero también existirá una desventaja y es la que entre menos intervalos tenga la tabla, más perdida de información habrá. 1.3.3 REDUCCION DE DATOS Los datos que caracterizan a una población se llaman parámetros. Lo datos que caracterizan a una muestra se llaman estadigráficos. Cuando la información estadística se resume por medio de una tabla de distribución de frecuencias, el 16 propósito que se persigue es el de facilitar la interpretación de los datos, puesto que en dicha tabla está contenida toda la información concerniente a una muestra. Sin embargo, existe una manera de resumir aún más una serie de datos y ésta consiste en reducir toda la información de la muestra a un pequeño número de características o estadigráficos que sustituyen a todos los datos y dan una idea clara y precisa de los aspectos fundamentales de la muestra. Existen dos tipos de estadigráficos: Estadigráficos de Posición y Estadigráficos de Dispersión. Los principales estadigráficos de posición son: Media Aritmética, Mediana y Moda. Por otro lado, los principales estadigráficos de dispersión son: Rango, Desviación Media, Varianza, desviación típica, y coeficiente de variación. ESTADIGRAFICOS DE POSICION Los estadigráficos de posición: media y mediana, reciben también el nombre de medidas de tendencia central. Esto se debe a que si todos los datos se ordenan de menor a mayor, entonces estos estadigráficos de posición tienden a ocupar las posiciones centrales. MEDIA ARITMETICA X Es la más importante de las medidas de tendencia central; por eso se acostumbra a designarla únicamente con el nombre de media. La Media Aritmética, de un conjunto de datos, se calcula sumando todos los datos y dividiendo esta suma entre el número de datos. Puede expresarse la media aritmética de la siguiente manera: X = X1 + X2+……..Xn = ∑ = n i xi 1 n n 17 MEDIA PARA DATOS AGRUPADOS Cuando se desea calcular la media para un conjunto de datos agrupados en una tabla de distribución de frecuencias, dividida en intervalos de clase, ante la imposibilidad de conocer cada uno de los valores agrupados, se toma como dato representativo de cada intervalo, su respectiva marca de clase y la frecuencia correspondiente es su ponderación. En otras palabras, si se tienen las siguientes marcas de clase: X1, X2, …….Xn, cuyas frecuencias respectivas son f1, f2,……fn Entonces la media, para los datos agrupados, se obtiene de la siguiente manera: X = f1X1 + f2X2 +f3X3 + …… + fnXn f1 + f2 + f 3,……+fn Es de observar que no interesa el hecho de que los intervalos de clase no posean igual ancho, el proceso para el cálculo de la media es el mismo, ya sea para anchos iguales o anchos diferentes. PROPIEDADES DE LA MEDIA De las medidas de tendencia central, la media aritmética es la única con la que se puede operar algebraicamente. Las principales propiedades matemáticas que posee la media aritmética son: Propiedad 1 La suma de las desviaciones de las variables respecto a la media aritmética, es siempre igual a cero. Se definen como desviaciones a las diferencias (con el correspondiente signo) entre los valores de la variable y un valor fijo. ∑ = =− n i XXi 1 0)( 18 Propiedad 2 La media aritmética de un valor constante, es la misma constante. Propiedad 3 La media de el producto de una constante por una variable es igual al producto de la constante por la media de la variable. Propiedad 4 La media de la suma de una variable más una constante es igual a la media de la variable mas la constante. Propiedad 5 Si F1 números tienen como media a X1 F2 “ “ “ X2 ………………………………………………. ………………………………………………. Fn “ “ “ Xn entonces, X = f1X1 +f2X2 + ……… fnXn F1 +f2+……..fn LA MEDIANA Cuando en una serie de datos existen valores demasiados extremos, es decir valores muy pequeños y valores muy grandes, entonces la media aritmética no es un buen promedio para dichos datos. En este caso un mejor promedio es el que se conoce con el nombre de Mediana. La mediana para un conjunto de datos X1, X2,…,Xn se representa por X y es el valor que se encuentra en el punto medio o centro, después de ordenar los datos de menor a mayor. 19 De acuerdo con la definición, la mediana es el valor que no supera a más de la mitad de los datos, pero que a su vez no es superado por más de la mitad de dichos datos. PROCEDIMIENTO PARA ENCONTRAR LA MEDIANA Si se desea encontrar la mediana de los n datos X1, X2,….Xn Entonces se procede de la siguiente manera: 1. Se ordenan los n datos de menor a mayor 2. La mediana es el dato que ocupa la posición [ n+1] /2 Si los datos están ordenados de menor a mayor entonces: a. Cuando n es impar, la mediana es el dato que aparece en el centro b. Cuando n es par, la mediana es la semi-suma de los dos datos centrales. Por otro lado, la fórmula para encontrar la mediana de datos agrupados, es la siguiente: X = li +C ( [ n+1] /2) - Fa f Donde: Li = Limite inferior del intervalo mediano C = Ancho del intervalo mediano F= Frecuencia del Intervalo mediano Fa= Frecuencia acumulada anterior al intervalo mediano N= Número de datos. 20 ESTADIGRAFICOS DE DISPERSION Es necesario también tener una medida que permita apreciar cuán dispersos están los datos alrededor de la medida de tendencia central. Al grado con que los datos numéricos tienden a extenderse alrededor de un valor medio, se le llama variación o dispersión de los datos. Los estadigráficos de dispersión se conocen también con el nombre de medidas de dispersión o de variabilidad. Y los principales son: Rango, Desviación Media, Varianza, Desviación Típica y Coeficiente de Dispersión RANGO O RECORRIDO El rango o recorrido es la diferencia que existe entre el mayor y el menor de los datos. Se utiliza más que todo para construir una tabla de distribución de frecuencias en la cual los datos se separan por medio de intervalos. DESVIACION MEDIA Dm Para los datos: X1, X2,….Xn la desviación media se obtiene de la siguiente manera: Dm = |X1 - X|+ |X2 -X|+ |X3 - X|+ ……..|Xn -X| n La desviación media es la media aritmética de los valores absolutos de las desviaciones de los datos con respecto a la media. VARIANZA Se llama varianza a la media aritmética de los cuadrados de las desviaciones de los datos con respecto a su media. 21 La varianza de los datos X1, X2,….Xn, que se denota por S2, es entonces: S2= (X1 – X)2+ (X2 –X)2+ (X3 – X)2+ ……..(Xn –X)2 n S2= ∑ = n i 1 (Xi – X)2 n la varianza muestral se denota por : S2 La varianza poblacional se denota por : σ2 Una varianza grande indica bastante variación de los datos. VARIANZA PARA DATOS AGRUPADOS Si un conjunto de datos se ha agrupado haciendo uso de intervalos de clase, entonces se toma como dato representativo de cada intervalo su respectiva marca de clase. Por lo tanto, si se tienen las siguientes marcas de clase: X1, X2,….Xn, cuyas frecuencias respectivas son: f1, f2,….fn. entonces la varianza, para los datos agrupados se obtiene de la siguiente manera: S2= f1(X1 – X)2+ f2 (X2 –X)2+ …….. fn (Xn –X)2 f1 + f2+….. fn DESVIACION TIPICA: S La desviación típica es igual a la raíz con signo positivo de la varianza. La desviación típica es la más importante de las medidas de dispersión, ya que es la que mejor mide cuanto se separan los datos con respecto a su media. La varianza como medida de variabilidad, tiene el inconveniente de que se expresa en unidades distintas a las de la variable original. De acuerdo con la definición la desviación típica de los datos : X1, X2,….Xn 22 S = ∑ = n i 1 (Xi – X)2 n 1.3.3 ANALISIS TAXONOMICO Este tipo de análisis envuelve todas aquellas formas de pensamiento que se pueden dar o de interpretaciones a los patrones de las personas y de las expresiones. Es necesario estudiar el comportamiento de una población en general donde se desea realizar una investigación. Conocer que hace la gente y que dice, para poder formar criterios o pautas que permitan estandarizar lo que se quiere dar a entender. Una misma situación o respuesta puede tener diferentes significados, dependiendo de la persona o el contexto que se analice. Es por eso que se vuelve muy complejo el proceso de análisis de este tipo, ya que se tienen que tomar en cuenta factores culturales y costumbres de las personas a las cuales se les ha entrevistado. 23 II. DEFINICIÓN DEL PROYECTO Este capítulo explica de forma detallada la estructura del sistema, presentando cada uno de los módulos en los que esta dividido y definiendo cada una de las funciones que se incluyen en ellos. Antes de entrar a la definición del proyecto se da a conocer la situación actual y las razones que justifican el desarrollo de este proyecto. 2.1 SITUACION ACTUAL. Pequeñas organizaciones y/o profesionales independientes que se dedican al desarrollo de investigaciones sociales, necesitan el apoyo de tecnologías de información para el diseño y desarrollo de investigaciones mediante encuestas. Existen aplicaciones comerciales especializadas que suplen este tipo de necesidades como lo son, entre otros, SPSS, Stats, excel; sin embargo a pesar de su especialización, estas aplicaciones no cuentan con algunos aspectos importantes que faciliten aun más el desarrollo de investigaciones, como por ejemplo: La integración de procesos, adaptación a redes de computadoras, entre otros. Es por ello que se ve la necesidad de crear una herramienta que, tomando como base las características básicas para el desarrollo de investigaciones por encuestas, proporcione las utilidades necesarias para suplir las características no encontradas en las aplicaciones existentes, y que pueda guiar paso a paso a los profesionales en el desarrollo de investigaciones siguiendo un método adecuado. 2.2 PLANTEAMIENTO DEL SISTEMA El s