UNIVERSIDAD DON BOSCO FACTULTAD DE INGENIERÍA TRABAJO DE GRADUACIÓN PARA OPTAR AL GRADO DE INGENIERO EN COMPUTACIÓN SISTEMA EXPERTO PARA LA APLICACIÓN DE PRUEBAS PSICOMÉTRICAS PRESENTADO POR: MAGDALENA BATRES CAMPOS CARLOS RAFAEL MENDOZA PACAS CARLOS ALFREDO ROBLES ARIAS ASESOR: LIC. MANUEL TURCIOS CIUDADELA DON BOSCO LUNES 26 DE FEBRERO DE 2005 Í N D I C E Contenido Pág. Introducción i CAPÍTULO I: Definición y Delimitación del Proyecto 1. Marco Teórico 3 1.1 Psicología y Psicometría 3 1.1.1 Tipos de Pruebas Psicométricas 7 1.1.2 Construcción General de Pruebas Psicométricas 10 1.1.3 Interpretación de los Resultados 14 1.1.4 Críticas hacia la Psicometría 16 1.2 Sistemas Expertos 17 1.2.1 Historia de los Sistemas Expertos 17 1.2.2 Definición de Sistemas Expertos 19 1.2.3 Descripción del Esquema 20 1.3 Redes Semánticas 22 1.3.1 Grafos Conceptuales 24 1.3.2 Infraestructura para la Descripción de Recursos 25 1.4 Términos calve 27 2. Definición del Tema 29 2.1 Componentes de un Sistema Experto 30 3. Justificación del Tema 34 4. Objetivos del Proyecto 37 5. Alcances 38 6. Limitaciones 39 7. Delimitaciones 40 8. Situación Actual 41 9. Planteamiento del problema 44 10. Plan propuesto 48 10.1 Valor Agregado 50 10.2 Información de Configuración e Instalación 55 11. Metodología de la Investigación 58 3 12. Técnicas de Diseño 59 13. Recursos para Investigación y Desarrollo 62 14. Requerimientos para la Implementación 63 15. Determinación de Requerimientos para el Desarrollo 64 15.1 Requerimientos Generales 64 15.1.1 Características del Sistema 64 15.1.2 Descripción de SEPSI con Enfoque de Sistemas 65 15.1.3 Descripción y Modo de Operación del Sistema SEPSI 70 15.2 Requerimientos Informáticos 71 15.2.1 Estándares de la Base de Datos 71 15.2.2 Requerimientos de Herramientas 72 15.3 Requerimientos Humanos 74 15.4 Requerimientos Tecnológicos 76 CAPÍTULO II: Análisis y Diseño del Sistema 1. Estructura General de las Pruebas Psicométricas 80 2. Entradas y Salidas del Sistema 82 3. Diagrama Entidad Relación 90 4. Diseño de la Base de Datos 91 5. Diagramas de Flujos de Datos 100 5.1 Diagrama de Flujo de Datos de Nivel 0 100 5.2 Diagrama de Flujo de Datos de Nivel 1 102 5.3 DFD de Instalación y Configuración del Sistema 105 5.4 DFD de Construcción de Pruebas 110 5.5 DFD de Publicación de Pruebas 114 5.6 DFD de Aplicación de Pruebas 118 5.7 DFD de Generación de Reportes 121 6. Diseño de la Base de Conocimientos y del Motor de Inferencia 124 6.1 Estructura de la Base de Conocimientos 125 6.2 Especificación de Reglas para la Evaluación de Pruebas 126 6.3 Especificación de Diagnósticos 129 6.4 Generación de Conocimiento 130 6.5 Almacenamiento y Proceso de Inferencia 131 6.6 Interacción con el Usuario 131 7. Interfaz de Usuario 133 7.1 Instalación del Sistema 133 4 7.1.1 Instalación de la Base de Datos 134 7.1.2 Instalación de la Interfaz para la Construcción de Pruebas 140 7.1.3 Instalación de la Interfaz para la Generación de Reportes 143 7.2 Construcción de Pruebas 146 7.2.1 Diseño de Pantallas para Desplegar las Pruebas 146 7.3 Especificación de Reglas para Evaluar la Prueba 152 7.4 Publicación de Pruebas 156 7.5 Aplicación de Pruebas 158 7.6 Generación de Reportes 160 7.7 Árbol de organización de Interfaz de Usuario 164 CAPÍTULO III: Manual del Usuario 1. Instalación del Sistema 167 2. Sistema SEPSI 170 2.1 Interfaz Gráfica de la Prueba 170 2.1.1 Ingreso al Sistema 170 2.1.2 Nueva Prueba 171 2.1.3 Nueva Pregunta 174 2.1.4 Cargar Pregunta 181 2.1.5 Eliminar Pregunta 182 2.1.6 Propiedades de Pregunta 183 2.1.7 Nueva Indicación 184 2.1.8 Cargar Indicación 185 2.1.9 Eliminar Indicación 186 2.1.10 Propiedades de Indicación 186 2.1.11 Cronómetro de Prueba 187 2.1.12 Guardar Prueba 188 2.1.13 Cerrar Prueba 189 2.1.14 Cargar Prueba 190 2.2 Especificación de Reglas 191 2.2.1 Adicionar una Regla 195 2.2.2 Navegación a través de Reglas 196 2.2.3 Actualizar una Regla 196 2.2.4 Eliminar una Regla 196 2.2.5 Generar el Algoritmo de Calificación de Pruebas 196 2.3 Especificación de Diagnósticos 197 2.3.1 Pasos para Agregar un Diagnóstico 198 2.3.2 Pasos para Eliminar una Diagnóstico 198 2.3.3 Pasos para Modificar una Diagnóstico 198 2.4 Publicación de Prueba 199 2.5 Calificación de Evaluaciones Tomadas 206 2.6 Generación de Reportes 207 2.7 Administración de Usuarios y Permisos 210 5 Conclusiones 213 Bibliografía 216 Anexos A. Ejemplo de Pruebas Psicométricas en Línea i B. Ejemplo de Sitio Web de Asistencia Psicológica en Línea ii C. Ejemplos de Sistemas Expertos Gratuitos iii D. Ejemplos de Pruebas Psicométricas iv E. Recomendaciones de Mejoras que podrían hacerse al sistema vi Í N D I C E D E F I G U R A S Figura Pág. 1 Ejemplo De Grafo Conceptual Sobre Animales 25 2 Diagrama de Componentes Generales de un Sistema Experto 31 3 Implementación de componentes de un sistema experto 32 4 Implementación de motor de inferencia con encadenamiento hacia adelante 33 5 Flujograma de Actividades de la Situación Actual 43 6 Diagrama de espina de pescado de la Situación Actual 47 7 Procesos Generales del sistema SEPSI 50 8 Flujograma de Actividades de la Situación Propuesta 53 9 Implementación para el Sistema de Evaluación de Pruebas según la situación propuesta 54 10 Ciclo de Vida de Desarrollo del Sistema 59 11 Flujo de información entre entidades 65 12 Estructura general de pruebas psicométricas 81 13 Perspectivas del sistema 81 14 Diagrama Entidad – Relación 90 15 Base de Datos SEPSI 92 16 Base de Datos Modelo 96 17 Diagrama de Flujo de Nivel 0 102 18 Diagrama de Flujo de Datos de Nivel 1 104 19 Diagrama de Flujo de Datos de Instalación y configuración del Sistema 107 20 Algoritmos para la instalación de la Base de Datos y Administrador de Usuarios 108 21 Algoritmos para la Instalación del Constructor de Pruebas y Generador de Reportes 109 22 Diagrama de flujo de Datos para la Construcción de Pruebas 111 23 Algoritmos para la Captura de Información General de la Prueba y Creación de la Base de Datos para la prueba 112 24 Algoritmo para Construir Preguntas en la Prueba, Determinar Reglas y Proceso de Revisión de Respuestas 113 25 Diagrama de Flujo de Datos de Publicación de Pruebas 115 26 Algoritmo para la Publicación de Pruebas 116 27 Estructura General de las Páginas ASP 117 6 28 Diagrama de Flujo de Datos de Aplicación de Pruebas 119 29 Algoritmo para la Aplicación de Pruebas 120 30 Diagrama de Flujo de Datos: Generación de Reportes 122 31 Algoritmos para la Captura de Consultas, Motor de Inferencia y Generación de Reportes 123 32 Estructura de la base de datos de conocimientos 125 33 Generación de Conocimiento 131 34 Formulario principal para la instalación de SEPSI 134 35 Inicio de instalación de SEPSI 134 36 Captura de datos necesarios para la instalación de la base de datos 135 37 Ejecución de los Scripts que crean la base de datos 136 38 Captura de datos necesarios para la conexión a la base de datos 137 39 Captura de datos necesarios sobre los Usuarios de SEPSI 138 40 Captura de permisos para usuarios de SEPSI 139 41 Ejecución de los Scripts que crean la aplicación para Administrar Usuarios 140 42 Formulario de inicio de Instalación del Constructor de Pruebas 140 43 Captura de datos necesarios para la conexión a la base de datos 141 44 Captura de datos necesarios para la conexión al servidor web 142 45 Ejecución de los Scripts que crean la aplicación para Construir Pruebas 143 46 Formulario de inicio de Instalación de Administrador de Usuarios 143 47 Captura de datos necesarios para la conexión a la base de datos 144 48 Ejecución de los Scripts que crean la aplicación para Generar Reportes 145 49 Captura de datos para la prueba 148 50 Cargar prueba existente 148 51 Cargar pregunta en pantalla 149 52 Construir / Modificar pregunta 150 53 Formulario para introducir las reglas que se usarán para evaluar las pruebas. En esta sección se crea el metalenguaje de programación 153 54 Formulario para construir los diagnósticos 155 55 Formulario para publicar las pruebas en el servidor de la base de datos 157 56 Página ASP para capturar datos del evaluando 159 57 Página ASP para capturar respuestas de una prueba 160 58 Captura de parámetros para realizar la búsqueda de información en la base de conocimientos 162 59 Formulario para desplegar detalle de la inferencia 163 60 Diagrama esquemático del sistema SEPSI 164 61 Pantalla de configuración de parámetros de MSDE 167 62 Instalación de MSDE 168 63 Configuración de parámetros de sistema SEPSI 169 64 Ingreso al sistema 170 65 Menú “Nueva Prueba” 171 66 Ingreso de nombre de la prueba 171 67 Interfaz Gráfica de la Prueba 172 68 Menú “Nueva Pregunta” 174 69 Especificación de número de pregunta 175 70 Formulario para seleccionar el color de un control 180 71 Formulario para especificar el tipo de letra 180 7 72 Formulario para especificar el origen de un archivo 181 73 Menú “Cargar Pregunta” 181 74 Selección de pregunta a cargar 182 75 Menú “eliminar Pregunta” 182 76 Confirmación de eliminación de pregunta 183 77 Menú “Propiedades de Pregunta” 183 78 Menú “Nueva Indicación” 184 79 Interfaz gráfica de la indicación 184 80 Menú “Cargar Indicación” 185 81 Selección de indicación a cargar 185 82 Menú “Eliminar Indicación” 186 83 Confirmación de indicación a eliminar 186 84 Menú “Propiedades de Indicación” 186 85 Menú “Cronómetro de Prueba” 187 86 Especificación de cronómetro para la prueba 187 87 Menú “Guardar Prueba” 188 88 Menú “Cerrar Prueba” 189 89 Confirmación para almacenar la prueba 189 90 Menú “Cargar Prueba” 190 91 Selección de prueba a cargar 190 92 Menú “Especificar Reglas” 191 93 Formulario para especificar reglas de la prueba 192 94 Formulario de diagnóstico que corresponde a la regla ingresada 194 95 Menú “Especificar Diagnósticos” 197 96 Formulario para especificar diagnósticos de la prueba 198 97 Menú “Publicar Prueba” 199 98 Selección de prueba a publicar 199 99 Progreso de la publicación de una prueba 200 100 Pantalla de inicio de evaluación 201 101 Búsqueda de usuario existente 201 102 Selección de usuario existente para tomar una prueba 202 103 Ingreso de datos de nuevo usuario 202 105 Selección de prueba a tomarse 203 106 Pantalla para ingresar respuestas 203 107 Cronómetro mostrado durante la aplicación de una prueba 204 108 Finalización de la prueba 204 109 Menú “Calificar Evaluaciones Tomadas” 204 110 Selección de prueba a calificar 205 111 Detalle de pruebas por usuario 206 112 Menú “Generador de Reportes” 207 113 Selección de Prueba para Generar Reportes 207 114 Selección de usuarios para generar reportes de una prueba 208 115 Presentación de Resultados 209 116 Menú “Usuarios y Permisos” 210 117 Selección de Usuarios del sistema para editar 210 118 Ingreso de datos de usuarios del sistema 211 119 Formulario para administrar permisos de usuarios 212 8 9 I N T R O D U C C I O N En la vida diaria se encuentran muchas situaciones complejas gobernadas por reglas deterministas: transacciones bancarias, aprobación de créditos, sistemas de seguridad, etc. Muchos profesionales también se enfrentan a situaciones en que su experiencia los orienta en las decisiones a tomar. En general, los seres humanos razonan a partir de un conjunto de deducciones lógicas y de conocimientos previos. Es así como los sistemas basados en reglas son una herramienta eficiente para tratar diferentes problemas y situaciones complejas. Los sistemas expertos son programas que reproducen el proceso intelectual de un experto humano en un campo particular, pudiendo mejorar su productividad, ahorrar tiempo y dinero, conservar sus valiosos conocimientos y difundirlos más fácilmente. Los sistemas expertos resuelven problemas que normalmente son solucionados por expertos humanos. Para ello, necesitan acceder a una base de conocimientos, la cual es alimentada por un conocedor de toda la información que el sistema es capaz de manejar. El proceso de razonamiento se lleva a cabo con un motor de inferencia que obtiene las conclusiones, aplicando cierta lógica a las reglas definidas previamente. Este es el caso del sistema experto para la aplicación de pruebas psicométricas que se describe en este documento, el cual pretende aprovechar las ventajas que presentan este tipo de sistemas para poder crear diferentes exámenes que se utilizan en psicología. Un psicólogo o experto en psicometría alimentará al sistema de las reglas y procedimientos específicos para cada prueba, para que al final puedan presentarse conclusiones que sean de utilidad, como si un humano realizara el proceso de evaluación de dichas pruebas. Este sistema se considera como un intermediario entre el experto humano (psicólogo que alimenta las prueba y que sabe de su forma de evaluación) y el usuario, que lo utiliza (evaluador) para resolver el problema de obtención de resultados en las pruebas, con la misma eficacia del especialista, utilizando para ello el conocimiento almacenado y algunos métodos de inferencia programados por los ingenieros del conocimiento. Como se ve en los próximos apartados, el sistema cuenta con una infraestructura que permite generalizar las diferentes soluciones de procesamiento a los problemas planteados por las pruebas psicométricas. El siguiente documento se inicia con una descripción teórica sobre los sistemas expertos, sus componentes y arquitectura. Luego, se plantea cuales son los problemas que se solucionan con este software y cuál fue la metodología a utilizar para construir dicha herramienta. C A P I T U L O I : D E F I N I C I Ó N Y D E L I M I T A C I Ó N D E L P R O Y E C T O 1. M A R C O T E O R I C O 1.1 P S I C O L O G Í A Y P S I C O M E T R Í A 1 La Psicología es el estudio científico de la conducta y la experiencia, de cómo los seres humanos sienten, piensan, aprenden y conocen para adaptarse al medio que les rodea. La psicología moderna se ha dedicado a recoger hechos sobre la conducta y la experiencia, y a organizarlos sistemáticamente, elaborando teorías para su comprensión. Estas teorías ayudan a conocer y explicar el comportamiento de los seres humanos y en alguna ocasión incluso a predecir sus acciones futuras, pudiendo intervenir sobre ellas. En numerosos campos de la psicología teórica y aplicada se emplean tests y otros sistemas para llevar a cabo la evaluación psicológica. Los más conocidos son los tests de inteligencia, desarrollados a partir del siglo XX, en los albores mismos de la psicología científica, que miden la capacidad de un individuo para relacionarse con su entorno. Estos tests han sido muy útiles en el ámbito educativo para seleccionar alumnos, asignarlos a cursos de formación específicos y, en general, para predecir el éxito o fracaso en la escuela. Se han desarrollado también tests especiales para conocer el futuro éxito en diferentes profesiones y asesorar qué campos o especialidades convienen más a un determinado estudiante. La evaluación psicológica, que también se utiliza en la psicoterapia, se ha ocupado de medir aspectos de la personalidad, intereses y actitudes de los individuos. Sin embargo, un problema clave en el diseño de tests es el desarrollo y aplicación de criterios comunes a la hora de su puntuación. En los tests de inteligencia, por ejemplo, el criterio más utilizado ha sido el del éxito escolar, pero han sido puestos en duda por el matiz cultural que implican (los 1 Ver referencia bibliográfica item (H) resultados podrían reflejar más que la capacidad de un niño para aprender, su aprendizaje previo, favorecido por el nivel social de su familia). Para los tests de intereses y orientación vocacional, el criterio ha sido el de la persistencia en una ocupación determinada. En los tests de personalidad hay desacuerdo entre los psicólogos sobre los criterios que deberían utilizarse. Aunque se han propuesto muchos, la mayoría de los tests sólo refieren los aspectos concretos de la personalidad que tratan de evaluar. En los tests se han desarrollado también modelos estadísticos muy sofisticados, siendo los más eficaces los que tienen una base estadística compleja y sutil. Algunos psicólogos se han convertido en verdaderos expertos en la elaboración de tests y otros instrumentos de medida para propósitos concretos, una vez acordada su finalidad. La evaluación de las habilidades intelectuales es más compleja que una simple búsqueda de una puntuación del C.I. (cociente intelectual). Requiere el uso de pruebas formales que usualmente revelan las siguientes opciones: perfil intelectual de fortalezas y necesidades, estilos únicos de aprendizaje, factores que interfieren con el aprendizaje y estrategias para mejorar el rendimiento académico. En general, la psicometría es la disciplina de la psicología matemática que participa de todas las áreas especializadas de la psicología; tiene por función medir, evaluar, observar y procesar la actividad mental de una persona o de un grupo de personas, y la elaboración de diferentes instrumentos de medida (test). Pero además de esta matematización de la psicología, el movimiento de los tests avanza en otro sentido, tal vez menos evidente, pero que será muy fructífero y es el de integrar la teoría de los tests con las teorías cognitivas. Es así como la psicología es hoy un campo con una creciente especialización, fruto de la necesidad y de las nuevas tendencias. Una importante fuente de cambios en la psicología moderna proviene de los avances recientes de la informática y la computación, que han supuesto no sólo un nuevo enfoque en el planteamiento del estudio de las funciones cognitivas, sino también la herramienta para evaluar complejas teorías sobre estos procesos. Los ordenadores son manipuladores de símbolos, esto es, reciben información codificada (simbólica), la transforman y la utilizan según sus propósitos Las evaluaciones psicológicas son medida de algunos aspectos del comportamiento humano por medio de pruebas objetivas (test) que exigen contenidos cuidadosamente seleccionados y métodos de actuación e interpretación rigurosos. Los contenidos de estas pruebas pueden hacer referencia a cualquier aspecto del funcionamiento psíquico, incluyendo los rasgos de personalidad, las actitudes, la inteligencia y otros aspectos de índole emocional. En general, el test es aplicado por un psicólogo clínico, industrial o educativo, de acuerdo a principios éticos y profesionales. La interpretación se basa en la comparación de las respuestas del individuo con los niveles previamente establecidos mediante las respuestas habituales. Su utilidad dependerá de su capacidad para predecir el comportamiento (validez externa, predictiva). Al ofrecer información sobre la conducta de una persona y sus respuestas o resultados ante determinadas situaciones, son una gran ayuda a la hora de tomar decisiones. El desarrollo de las principales pruebas de evaluación partió de la necesidad de dar respuesta a ciertas demandas sociales. El primer test de inteligencia fue elaborado en 1905 por los psicólogos franceses Alfred Binet y Théodore Simon, quienes desarrollaron una serie de pruebas para identificar qué niños de las escuelas de París necesitarían una educación especial por su menor cociente intelectual. En 1916, el psicólogo estadounidense Lewis Terman elaboró la primera revisión de la escala Binet-Simon para una población a partir de los tres años. Este test sería revisado posteriormente en 1937 y en 1960, siendo aún hoy una de las escalas más utilizadas para medir la inteligencia. Poco después, la necesidad de clasificar a los soldados en la I Guerra Mundial motivaría el desarrollo de dos grupos de tests de inteligencia, el Alfa y el Beta. Además, para ayudar a detectar a los soldados que pudieran sufrir crisis nerviosas durante el combate, el psicólogo estadounidense Robert Woodworth elaboró el Personal Data Sheet (Hoja personal de datos), antecedente de los modernos tests de personalidad. Durante la década de 1930, los debates sobre la naturaleza de la inteligencia condujeron al desarrollo de la escala de inteligencia Wechsler-Bellevue (WAIS) que, además de proporcionar una medida general de la capacidad mental, daba información sobre las áreas de mayor fuerza o debilidad intelectual. La escala de Wechsler abarca desde la etapa preescolar a la adulta y hoy tiene la misma importancia que la escala de Binet. A medida que el interés por el psicoanálisis aumentaba en esos años, se introdujeron dos técnicas de proyección para el estudio sistemático de la motivación inconsciente: el test de las manchas de tinta del psiquiatra suizo Hermann Rorschach y el TAT (Test de Apercepción Temática), test narrativo de los psicólogos estadounidenses Henry A. Murray y C. D. Morgan. Ambos son frecuentes en el estudio de la personalidad, sobre todo en el ámbito clínico. En los programas de educación, los tests de inteligencia y de evaluación de conocimientos son aplicados de forma rutinaria para asesorar las decisiones individuales y para mejorar la educación y organizar los planes de estudio. En las escuelas primarias se utilizan los tests audiovisuales para determinar la capacidad del alumno para aprender a leer y escribir. A través de ellos se detectan posibles problemas de la vista, del oído y de su desarrollo general que podrían hacer recomendable para el niño algún tipo de educación especial. Si el progreso del niño en la escuela es lento, o si aparecen signos de incapacidad para el aprendizaje o desórdenes en el comportamiento, los tests pueden aclarar si se trata de un problema neurológico o emocional. Más adelante, en la educación secundaria, muchos centros de enseñanza aplican tests de intereses y aptitudes para orientar profesionalmente al estudiante. En las clínicas y en los hospitales, los tests se realizan para completar el diagnóstico y planificar el tratamiento, ya que proporcionan información sobre el funcionamiento y estructura de la personalidad del paciente y la conveniencia de aplicar algún tipo de psicoterapia; los tests también se pueden centrar en alguna cuestión específica, como la presencia o ausencia de trastornos orgánicos cerebrales. Por regla general, se aplica una serie de tests que son interpretados en conjunto para describir los estados intelectuales y emocionales del paciente. Es obvio que las decisiones sobre el tratamiento no dependen en exclusiva de los resultados, sino del juicio del equipo clínico del que forma parte el psicólogo. Los tests también se emplean en algunas organizaciones empresariales para la selección y clasificación del personal, ofreciendo criterios para aceptar o rechazar a un candidato a un puesto de trabajo o para ubicarlo en el lugar idóneo. A los tests de inteligencia o de personalidad suelen añadirse pruebas específicas, propias de la tarea concreta que se desea cubrir. 1.1.1 Tipos de Pruebas Psicométricas 2 Normalmente se utiliza una amplia gama de pruebas, cada una de las cuales evalúa objetivos específicos. • Test de conocimientos adquiridos Se emplean por lo general para estimar el nivel que tiene el alumno en una materia académica concreta, por lo que se aplican como indicador del aprendizaje previo y como índice para predecir éxitos académicos futuros. En la educación primaria pública, lo habitual es que los alumnos realicen diferentes tests para evaluar el vocabulario, la habilidad con el lenguaje, la comprensión en la lectura, el cálculo numérico y la resolución de problemas, las ciencias naturales y las sociales. • Test de aptitudes Predicen la ejecución futura en un área en la que el individuo aún no ha sido formado. Las escuelas, compañías privadas e instituciones públicas se sirven de ellos para asignar puestos específicos a cada candidato. También son necesarios para la orientación 2Ver referencia Bibliográfica ítem (I) vocacional. Si alguien puntúa en las diferentes aptitudes (es decir, tiene un determinado ‘perfil’), como los profesionales de un campo concreto, se puede suponer que será apropiado para ocupar un determinado puesto de trabajo. Algunos cubren un amplio rango de habilidades necesarias para profesiones muy diferentes, midiendo la capacidad de razonamiento general, la percepción, la coordinación motora y la destreza manual. Otros se centran en un área profesional determinada, como el arte, la ingeniería o la capacidad para aprender idiomas. • Test de inteligencia A diferencia de los tests de habilidades y capacidades específicas, los de inteligencia miden la capacidad global de un individuo para relacionarse con su entorno. Pueden ser de distintos tipos: el de Stanford-Binet —revisión de la escala de Binet-Simon realizada por Lewis Terman—destaca las habilidades verbales, mientras que las escalas de Weschler (WAIS y WISC para niños) separan en dos subescalas la inteligencia verbal de la no verbal, cada una con su cociente intelectual específico. También hay tests infantiles específicos que no requieren el uso del lenguaje y tests de inteligencia diseñados para ser aplicados de forma colectiva. Las primeras escalas de inteligencia evaluaban la ‘edad mental’, nivel intelectual del niño según el promedio de su grupo de edad; de esta forma se podía conocer si un niño estaba situado por encima, por debajo o al mismo nivel que los demás. Dividiendo la edad mental entre la cronológica, se obtenía una cifra (el cociente intelectual) que, multiplicada por cien, daba la medida de la inteligencia, método que aún hoy se emplea. La media o promedio es 100 y casi la mitad de la población puntúa entre 90 y 110. El posible grado de error también se controla dentro de un proceso completo de evaluación, contrastando el conjunto de puntuaciones obtenidas en distintos tests. • Test de actitudes e intereses Utilizados en orientación vocacional, pueden predecir los índices de satisfacción futura en una determinada actividad. Los cuestionarios de autoaplicación son realizados por el propio individuo, que indica sus preferencias entre una serie de actividades profesionales. Estos tests no pretenden predecir el éxito en una profesión concreta, pero sí ofrecer un marco que reduzca el abanico de posibilidades para el estudiante. • Test psicométrico de personalidad Este tipo de tests miden el ajuste social y emocional, y se utilizan para identificar la necesidad de ayuda psicológica. Sus ítems describen brevemente sentimientos, actitudes y comportamientos típicos que se agrupan posteriormente en subescalas, cada una de las cuales representa un estilo o rasgo de personalidad determinado, como la extraversión o la depresión. En conjunto, estas subescalas dibujan el perfil de la personalidad del sujeto. • Técnicas proyectivas Algunos tests de personalidad se basan en el fenómeno de la proyección, proceso descrito por Sigmund Freud como la tendencia de atribuir a otros ideas o sentimientos que uno no admite tener. Debido a su relativa falta de estructuración, logran obtener las respuestas más personales y significativas que orientan sobre las motivaciones profundas del individuo. Los más conocidos son el test de Rorschach, o test de las manchas de tinta, y el TAT. Hay otros que consisten en completar frases, asociar palabras o dibujar (el de la figura humana —llamado ‘esquema corporal’—, la casa y el árbol son los más empleados). Aunque la complejidad de la interpretación y el grado de subjetividad que implican los ha hecho vulnerables a las críticas metodológicas, son difíciles de aplicar en grandes grupos, aunque son muy útiles en psicología clínica, ya que aportan información más relevante, aunque en ocasiones menos rigurosa, que las pruebas psicométricas y profundizan en el análisis individual de la personalidad. 1.1.2 Construcción General de Pruebas Psicométricas El proceso natural que se sigue en la construcción de un instrumento de medición de psicología se resume en las siguientes fases: a. Definición del constructo. b. Construcción del test provisional. c. Aplicación a una muestra. d. Análisis de ítems. e. Estudio de la fiabilidad del test. f. Estudio de la validez del test. g. Baremación. Estos pasos son previos a la alimentación de pruebas al sistema experto que se expone en este trabajo de investigación. Es decir, el sistema no se ha diseñado para construir pruebas psicométricas, sin embargo, puede utilizarse como herramienta auxiliar para construir progresivamente una prueba psicométrica, en cuanto permite establecer la forma de calificar una prueba y permite capturar respuestas de los evaluandos. Las cuatro primeras fases para constuir una prueba se refieren a ciertas estrategias lógicas (algunas con cierto fundamento estadístico) que conducen a seleccionar la forma y contenidos más apropiados del test. Las fases e. y f. resultan fundamentales, dado que se refieren a la comprobación empírica de las garantías psicométricas que la prueba manifiesta como instrumento de medición. Básicamente, estas garantías se refieren a su precisión (fiabilidad) y a la comprobación práctica del contenido auténtico que se está evaluando (validez). Una vez que se dispone de la versión definitiva del test, aplicada a una muestra representativa de la población de personas a la que va dirigido, se procede a la fase de baremación, que sirve para interpretar una puntuación concreta en relación con las que obtiene la muestra seleccionada. Mientras que la mayoría de los atributos físicos (altura, peso, etc.) resultan directamente medibles, los atributos (constructos o rasgos) psicosociales resultan ser conceptualizaciones teóricas que no son accesibles a la medición directa y para los que no existen "metros" o "balanzas" diseñados para medirlos de manera precisa. La actitud hacia el aborto, el nivel de cohesión grupal, el grado de extroversión, el cociente intelectual, la postura hacia el consumo de drogas, el grado de liderazgo, etc., todos ellos son constructos que deben medirse mediante instrumentos específicamente diseñados: los tests, cuestionarios o inventarios. Nadie dudaría de que un metro bien diseñado mide longitud y que lo hace de manera precisa, pero la bondad y la precisión de un cuestionario no se puede presuponer; más bien son una cuestión de grado y siempre susceptibles de mejora. En definitiva, un cuestionario está formado por una serie de elementos o “ítems” (elementos, reactivos, preguntas, cuestiones, situaciones análogas, etc.) a los que cada individuo debe responder. Después de cuantificar las respuestas de una persona a los elementos del cuestionario, se pretende asignar una puntuación (a veces varias) a esa persona respecto al constructo o atributo que se pretende medir con el cuestionario, una puntuación que debería indicar el grado en que la persona participa del atributo, constructo o rasgo a evaluar. El primer paso consiste en proporcionar una definición operacional del constructo o rasgo que pretendemos medir. Por ejemplo, para hablar de dogmatismo, se debe establecer los diversos componentes o manifestaciones del mismo: dogmatismo ante la política, ante la educación de los hijos, ante la religión, en las relaciones familiares, etc. Muy relacionada con esta definición operativa es la cuestión del establecimiento de los objetivos que se pretenden conseguir con el cuestionario. También es necesario especificar el tipo de población al que va a aplicarse la prueba y las decisiones que se pretenden tomar a partir de las puntuaciones que ofrezca. Resulta muy diferente, y determinará su contenido, que un test de inteligencia se vaya a aplicar a personas de la población general o a personas con problemas intelectuales. Un cuestionario de depresión puede utilizarse con fines científicos en una investigación o para decidir el ingreso en un centro psiquiátrico de personas con problemas depresivos. De la definición operacional del constructo y de la delimitación de sus componentes se debe llegar a establecer un conjunto de elementos o ítems (frases, preguntas, situaciones análogas, tareas, etc.) que representen estos componentes, o mejor, las conductas mediante las que se manifiestan los diversos componentes del constructo. Si, por ejemplo, se pretende evaluar la tolerancia hacia los grupos marginales, un ítem podría ser el siguiente: “Deberíamos facilitar la integración de los pandilleros en nuestro país” Parece razonable suponer que una persona tolerable estaría de acuerdo con esta afirmación, mientras que otra intolerable estaría en desacuerdo. En relación con la construcción de los ítems existen dos temas importantes a tener en cuenta: el formato de respuesta y las normas de redacción de los ítems. En las Ciencias clásicas (Medicina, Física, Química, etc.) existen aparatos, con márgenes de error especificados, para medir determinadas características como son la temperatura, la presión sanguínea, el peso, la concentración de determinados elementos químicos, etc. En Psicología no existen instrumentos de medición de la introversión, la actitud hacia el aborto, la aptitud espacial o la habilidad lectora, características que no son susceptibles de una medición directa. Para medir los rasgos psicológicos se han elaborado teorías matemáticas o estadísticas que permiten inferir el nivel de rasgo a partir del rendimiento observado de la persona. Si se elabora, por ejemplo, una prueba de atención, una persona obtiene una determinada puntuación X en el test. La cuestión que se plantea es si esa X representa una buena manifestación del rasgo auténtico de atención que tiene esta persona. Se puede pensar en las consecuencias que tiene para el psicólogo que un test no proporcione una buena información de los niveles de rasgo. Un psicólogo clínico que utiliza un test de depresión en su labor profesional, debe tener un alto grado de certeza de que las puntuaciones que proporciona el test resultan buenas cuantificaciones de los niveles de depresión de sus pacientes. La teoría clásica de los tests propone un modelo formal, denominado como modelo clásico o modelo lineal clásico, fundamentado en diversos supuestos a partir de los cuales se extraen determinadas consecuencias de aplicabilidad práctica para determinar el grado en que un test informa de los niveles de rasgo. A esto se le llama fiabilidad de la prueba. Una cosa es que el test mida de manera precisa o estable (esta cualidad se refiere a su fiabilidad), y otra diferente es la cuestión de qué es lo que auténticamente está evaluando. En el ámbito psicosocial, los diferentes constructos resultan difícilmente operativizables de manera indiscutible, y a veces se producen dudas razonables sobre qué mide un determinado test. Una prueba de inteligencia general tendrá un elevado grado de validez si asigna puntuaciones altas a las personas muy inteligentes, puntuaciones medias a las personas medianamente inteligentes y puntuaciones bajas a las personas de poca inteligencia. Un cuestionario para evaluar el nivel de autoestima tendrá un elevado nivel de validez si se demuestra que mide de forma exhaustiva todos los componentes en que puede manifestarse la autoestima. La validación es un proceso continuo, que incluye procedimientos diferentes para comprobar si el cuestionario mide realmente lo que dice medir. Dicho de otro modo, tiene que ver con el tipo de conclusiones o inferencias que pueden realizarse a partir de las puntuaciones obtenidas en el test. Las inferencias pueden ser de muy diverso tipo: ¿qué rasgo se esta midiendo realmente? ¿Qué se puede predecir sobre el comportamiento de un sujeto que obtiene una determinada puntuación en el test? ¿Qué consecuencias de diverso tipo tiene esa puntuación, en contextos de evaluación o selección? Aunque cada vez se tiende más a concebir la validez como un proceso unitario que tiene como objetivo aportar pruebas sobre las inferencias que podemos realizar con un test, tradicionalmente se han diferenciado varios procedimientos de validación, alguno de los cuales incluye varios métodos diferentes de comprobación. Los fundamentales procedimientos son denominados como validez de contenido, de constructo y referida al criterio. La puntuación directa de una persona en un test no es directamente interpretable si no la referimos a los contenidos incluidos en el test o al rendimiento de las restantes personas que comparten el grupo normativo. Nosotros centramos en este segundo sentido el tema de la interpretación de una puntuación directa en un cuestionario, para lo cual es necesario tratar el tema de la obtención de baremos para comparar esta puntuación con las que obtienen las personas que han formado el grupo normativo. De una u otra forma, los baremos consisten en asignar a cada posible puntuación directa un valor numérico (en una determinada escala) que informa sobre la posición que ocupa la puntuación directa (y por tanto la persona que la obtiene) en relación con los que obtienen las personas que integran el grupo normativo donde se bareman las pruebas. Entre las múltiples formas de baremar un test, destacamos las siguientes: - Baremos cronológicos: Edad Mental y Cociente Intelectual. - Centiles o percentiles. - Puntuaciones típicas: estándares, normalizadas, escalas T y D, estaninos o eneatipos. Lo más usual en las pruebas comercializadas es encontrarse baremos realizados en escala de centiles ó estaninos. 1.1.3 Interpretación de los Resultados El aspecto más importante de la evaluación psicológica es la interpretación de los resultados. • Puntuaciones La puntuación absoluta es el recuento numérico de respuestas acertadas. Presenta una utilidad muy limitada, ya que debe transformarse en una puntuación percentil (tanto por ciento de la población que queda por debajo del sujeto) o en una puntuación estándar (en desviaciones típicas por encima o por debajo de la media o promedio), puntuaciones que hacen referencia al promedio de la población. Si un sujeto tiene un percentil 50, significa que el 50% de la población puntúa por debajo de él y el otro 50% por encima. Si es 80, significa que el 20% lo sobrepasa y el 80% está por debajo. Las puntuaciones estándar dependen de la media o promedio y de la desviación típica. La media se obtiene de la suma del conjunto de las puntuaciones dividida entre el número total de individuos. La desviación típica o estándar es la raíz cuadrada de la media del cuadrado de las desviaciones. Si una puntuación absoluta se resta de la media y se divide entre la desviación típica, nos da la puntuación estándar. Las tablas de normas, que se incluyen en los manuales de evaluación psicológica, indican la escala de puntuaciones absolutas previstas a partir de estudios en los que un determinado test ya ha sido aplicado a grandes grupos representativos de población, y deben, por tanto, especificar cuáles eran las características de la muestra en cuanto a sexo, edad, ocupación y situación geográfica. Si las normas se han obtenido partiendo de un grupo de población distinto al del sujeto, no serán una buena referencia de comparación. • Validez En último término, la interpretación de las puntuaciones de un test supone hacer una predicción del comportamiento del sujeto en una situación determinada, por lo que si el test permitió realizar pronósticos acertados, se dice que tiene una gran validez (externa o predictiva). Sin embargo, antes de que la validez sea probada nos debemos enfrentar a una cuestión previa: la fiabilidad, es decir, que mida siempre lo mismo, de un modo consistente, aun si son diferentes profesionales los que lo aplican. Además de la fiabilidad, un test debe ser válido (que mida lo que debe medir) en al menos tres sentidos: Validez interna: que los ítems incluidos en el test sean una muestra suficientemente representativa de los que eventualmente se podrían haber utilizado. Por ejemplo, en un test que consista en deletrear palabras, éstas deben presentar distintos grados de complejidad. Validez externa o de criterio: se refiere a la capacidad del test para ajustarse a un hecho futuro o concurrente. Por ejemplo, un test de aptitudes artísticas tiene validez externa o predictiva si las puntuaciones más altas las obtienen quienes después tienen mayor éxito en esa actividad. La validez de criterio de un nuevo test de inteligencia puede establecerse si sus puntuaciones tienen una estrecha correlación con las de un test clásico, de validez ya contrastada. Validez de construcción: hace referencia a los rasgos o cualidades psíquicas que el test mide, demostrando que ciertas pautas del comportamiento humano son en cierto grado relevantes para puntuar en el test. Por ejemplo, un test que mida la necesidad de éxito debe demostrar que quienes puntúan más alto son los individuos que trabajan de forma más independiente, que persisten más en las tareas de resolución de problemas y que en situaciones competitivas obtienen los mejores resultados. 1.1.4. Críticas hacia la Psicometría La mayor crítica a la evaluación psicológica parte de dos aspectos interrelacionados: primero, los defectos técnicos en el diseño de los tests y los problemas éticos a la hora de interpretar sus resultados; segundo, sus aplicaciones. Todos los tests tienen defectos técnicos, por lo que es esencial que sus resultados sean considerados sólo como una parte más del complejo proceso de la evaluación psicológica. La mayor parte de las críticas han surgido por sobrevalorar sus resultados a la hora de tomar decisiones esenciales, críticas especialmente acusadas en los tests de inteligencia. Los psicólogos, por lo general, están de acuerdo en que el empleo de los tests para excluir a los jóvenes de oportunidades educativas concretas, sin una cuidadosa consideración de las motivaciones, es poco ético, ya que este tipo de tests tienden a seleccionar y destacar las habilidades generadas por la competitividad de los jóvenes de la clase media alta en detrimento de otros grupos sociales, discriminando a los menos favorecidos. Es evidente que mientras subsistan las desigualdades en la educación, éstas se seguirán reflejando en los resultados. 1.2 S I S T E M A S E X P E R T O S 3 Los primeros pasos en la inteligencia artificial se dieron en los años 50. Entre los pioneros tenemos Alan Mathinsong Turing quien publicó "Inteligencia y Funcionamiento de las Máquinas" con el fin de demostrar hasta que punto estas tienen inteligencia. 1.2.1 Historia de los Sistemas Expertos 1950 El campo de la informática recibe un gran impulso cuando Wiener desarrolla el principio de la retroalimentación. La teoría de la retroalimentación es base fundamental de los sistemas de control. 1955 Newell y Simon desarrollan la Teoría de la lógica. Este desarrollo permitió desarrollar un programa que exploraba la solución a un problema utilizando ramas y nudos, seleccionando únicamente las ramas que más parecían acercarse a la solución correcta del problema 1956 Se celebra una conferencia en Vermont (USA) de gran trascendencia en el desarrollo de la I.A. John McCarthy propone por primera vez el uso del término "Inteligencia Artificial" para denominar el estudio del tema. 1957 Aparece la primera versión de "The General Problem Solver" (GPS, Solucionador general de problemas), un programa capaz de solucionar problemas de sentido común pero no problemas del mundo real como diagnósticos médicos. El GPS utilizaba la teoría de la retroalimentación de Wiener. 1958 McCarthy anuncia su nuevo desarrollo el lenguaje LISP (LISt Procesing), el lenguaje de selección para todos aquellos desarrolladores inmersos en el estudio de la IA. 1963 El Instituto Tecnológico de Massachussets (MIT) recibe una subvención de 2,2 millones de dólares del gobierno de los Estados Unidos en concepto de investigación en el campo de la IA. De esa forma, se comprueba la importancia que el Gobierno concede a la investigación dentro de ese campo. 1965 Aparece DENDRAL, el primer sistema experto. Es en ese año cuando Feigenbaum entra a formar parte del departamento de informática de Stanford. Allí conoció a Joshua Lederberg, el cual quería averiguar cual era la estructura 3 Ver referencia bibliográfica (J) de las moléculas orgánicas completas. El objetivo de DENDRAL fue estudiar un compuesto químico. El descubrimiento de la estructura global de un compuesto exigía buscar en un árbol las posibilidades, y por esta razón su nombre es DENDRAL que significa en griego "árbol". En La realización de DENDRAL duró más de diez años (1965-1975). 1965 También se empezaron a utilizar técnicas para la resolución de problemas que se caracterizaban por la búsqueda heurística como modelo para la resolución de problemas, y con ellas comenzó la investigación y desarrollo de los sistemas expertos. 1972 En la Universidad de Standford se desarrolla MYCIN, sistema experto dentro del campo de la medicina para diagnostico de enfermedades infecciosas en la sangre. MYCIN se trataba de un sistema experto para el diagnóstico de enfermedades infecciosas. 1972 Aparece el lenguaje PROLOG basado en las teorías de Minsky. 1973 Se desarrolla el sistema experto llamado TIERESIAS. El cometido de este sistema experto era el de servir de intérprete entre MYCIN y los especialistas que lo manejaban, a la hora introducir nuevos conocimientos en su base de datos. 1979 Aparece XCON, primer programa que sale del laboratorio. Su usuario fue la Digital Equipament Corporation (DEC). El cometido de XCON sería configurar todos los ordenadores que saliesen de la DEC. El proyecto presentó resultados positivos y se empezó a trabajar en el proyecto más en serio en diciembre de 1978. En abril de 1979 el equipo de investigación que lo había diseñado pensó que ya estaba preparado para salir, y fue entonces, cuando se hizo una prueba real, esperando resolver positivamente un 95% de las configuraciones, este porcentaje tal alto se quedó en un 20% al ser contrastado con la realidad; XCON volvió al laboratorio, donde fue revisado y a finales de ese mismo año funcionó con resultados positivos en la DEC. 80-85 Se produce la revolución de los Sistemas Expertos. En estos 5 años se crearon diversos sistemas expertos como el DELTA, de General Electric Company, para la reparación de locomotoras diesel y eléctricas. "Aldo en Disco" para la reparación de calderas hidroestáticas giratorias usadas para la eliminación de bacterias. Se crearon multitud de empresas dedicadas a los sistemas expertos como Teknowledge Inc., Carnegie Group, Symbolics, Lisp Machines Inc., Thinking Machines Corporation, Cognitive Systems Inc. formando una inversión total de 300 millones de dólares. 90…. Con el desarrollo de la informática, se produce un amplio desarrollo en el campo de la IA y los sistemas expertos, pudiéndose afirmar que estos se han convertido en una herramienta habitual en determinadas empresas en la actualidad. 1.2.2 Definición de Sistemas Expertos4 Los sistemas expertos forman parte de un firme y verdadero avance en inteligencia artificial. Los sistemas expertos pueden incorporar miles de reglas y utilizan árboles de búsqueda para poder trabajar esas reglas. Este busca recorriendo las ramas más interesantes del árbol, hasta dar con la respuesta o fin al problema. Los sistemas expertos tienen la ventaja frente a otros tipos de programas de Inteligencia Artificial, de proporcionar gran flexibilidad a la hora de incorporar nuevos conocimientos. Para ello solo se debe introducir la nueva regla que deseemos hacer constar y a ésta, sin necesidad de cambiar el funcionamiento propio del programa. Los sistemas expertos son "auto explicativos", al contrario que en los programas convencionales, en los que el conocimiento como tal está encriptado junto al propio programa en forma de lenguaje de ordenador. Los expertos de I.A. dicen que los sistemas expertos tienen un conocimiento declarativo, mientras que en los demás programas es procedural. 1.2.3 Descripción Del Esquema Dos personas son fundamentales para el desarrollo de sistemas expertos: el Experto del Dominio (profesional X) y un Ingeniero de Conocimiento (programador), ya que estos van enlazar sus experiencias almacenándolos en la Base de conocimientos que mediante la interfaz va a permitir al usuario llegar a comunicarse con el motor de 4 Mas información http://www.itlp.edu.mx/publica/revistas/revista_isc/anteriores/dic00/ia.htm inferencia, el cual va a tomar la decisión de aplicar todo el conocimiento almacenado en la base de conocimientos. Los sistemas expertos son uno de los puntos que componen las investigaciones en el campo de la inteligencia artificial. Un sistema que trabaja con técnicas de inteligencia artificial debe estar en condiciones de combinar información de forma “inteligente”, alcanzar conclusiones y justificarlas. Los sistemas expertos se aplican por norma general en problemas que implican un proceso basado en el conocimiento. Un procedimiento de solución basado en el conocimiento tiene la capacidad de utilizar normas o estructuras que contengan conocimientos y experiencias de expertos especializados, deducción lógica de conclusiones y manipulación de conocimientos afectados por valores de probabilidad. Las reglas deterministas constituyen la más sencilla de las metodologías utilizadas en sistemas expertos. La base de conocimientos contiene las variables y el conjunto de reglas que definen el problema, y el motor de inferencia obtiene las conclusiones aplicando la lógica clásica a estas reglas. Por regla se entiende una proposición lógica que relaciona dos o más objetos e incluye dos partes, la premisa y el consecuente. Cada una de estas partes consiste en una expresión lógica con una o más afirmaciones objeto-valor conectadas mediante operadores lógicos. Una regla se escribe normalmente como “Si premisa, entonces consecuente”. Las personas que componen el equipo de desarrollo de los sistemas expertos son: • El experto • El ingeniero del conocimiento • El programador • El usuario En el desarrollo del Sistema Experto, el ingeniero del conocimiento y el experto trabajan muy unidos. El primer paso consiste en elaborar los problemas que deben ser resueltos por el sistema y determinar correctamente el dominio de la aplicación. Una vez delimitado el dominio, el ingeniero del conocimiento debe diseñar la infraestructura para almacenar el conocimiento y los algoritmos de inferencia para obtener soluciones. El programador se encarga de codificar el diseño. En muchas ocasiones el ingeniero del conocimiento y el programador son la misma persona. Finalmente, el usuario es la persona que hace uso del sistema experto, que en algunas ocasiones, también es el mismo experto. Las primeras investigaciones de sistemas expertos se llevaron a cabo en los años sesenta. En aquel entonces, se tenía como paradigma la idea que unas pocas leyes de razonamiento junto con potentes ordenadores serían suficientes para producir resultados y simular el razonamiento humano. Un intento en ese sentido fue llevado a cabo por los investigadores Alan Newell y Herber Simon que desarrollaron un programa denominado GPS (Solucionador General de Problemas). Este programa podía trabajar con criptoaritmética, el problema de las torres de Hanoi y otros problemas similares, pero no podía resolver problemas del mundo real. El enfoque del problema dio un giro restringiendo los problemas a un dominio específico e intentando simular el razonamiento de un experto humano. En vez de computarizar la inteligencia general, se centraron en dominios de conocimiento muy concretos. La investigación que se llevará a cabo busca determinar un modelo de inferencia general para evaluar diferentes pruebas psicométricas, a partir del conocimiento que el experto (psicólogo) almacene en la base de conocimientos. 1.3 R E D E S S E M Á N T I C A S 5 5 Ver referencia bibliográfica (K) La necesidad de una notación precisa para representar el conocimiento se hizo evidente en el ámbito de la Inteligencia Artificial casi desde el principio, sin duda debido a la experiencia acumulada en el terreno de las bases de datos. Esta notación recibe el nombre de “esquema de representación” en el entorno de las bases de conocimiento. En este sentido, resulta práctico considerar una base de conocimiento como un modelo de un mundo/empresa/sección de la realidad. Se considera el mundo/universo como una colección de individuos y una colección de relaciones que existen entre esos individuos. La colección de individuos que conforman el universo a representar y las relaciones que éstos mantienen constituye un estado, y puede haber transformaciones de estado que causan la creación o modificación de individuos o de las relaciones entre ellos. Podemos clasificar los esquemas de representación dependiendo de cuál sea el punto de partida: • Asignación de valores veritativos sobre estados: esquemas de representación lógicos. • Individuos/relaciones: esquema de representación de redes semánticas. • Transformaciones de estados: esquemas de representación procedimentales (sistemas productivos). La utilidad de un determinado esquema de representación se centra en dos aspectos: • Su capacidad o adecuación expresiva, es decir, lo que el sistema puede "entender" o "decir". • Su eficacia notacional. Los responsables de los primeros esquemas de representación formalizados fueron Quillian (1968) y Shapiro & Woddmansee (1971). Los esquemas de redes semánticas tienen una fundamentación psicológica muy sólida por lo que se han realizado numerosos esfuerzos por llevar a cabo implementaciones importantes basadas en ellas. Las redes semánticas han sido muy utilizadas en Inteligencia Artificial para representar el conocimiento y por tanto ha existido una gran diversificación de técnicas. Los elementos básicos que encontramos en todos los esquemas de redes son: • Estructuras de datos en nodos, que representan conceptos, unidas por arcos que representan las relaciones entre los conceptos. • Un conjunto de procedimientos de inferencia que operan sobre las estructuras de datos. Básicamente, podemos distinguir tres categorías de redes semánticas: • Redes IS-A, en las que los enlaces entre nodos están etiquetados. • Grafos conceptuales: en los que existen dos tipos de nodos: de conceptos y de relaciones • Redes de marcos: en los que los puntos de unión de los enlaces son parte de la etiqueta del nodo. En general, cuando se habla de "redes semánticas" se suele hacer referencia a uno de estos esquemas, normalmente a las redes IS-A (es-un) o a los esquemas basados en marcos, que comparten ciertas características fundamentales. De entre estas características compartidas se pueden destacar la herencia por defecto (default inheritance). En una red semántica, los conceptos (o estructuras, clases, marcos, dependiendo del esquema concreto) están organizados en una red en la que existe un nodo superior (top: T) al que se le asigna uno o varios nodos hijos, que a su vez tienen otros conceptos hijos y así sucesivamente hasta que se alcanza el final (bottom: ), cuyos nodos ya no son conceptos sino instancias. 1.3.1 Grafos conceptuales Los grafos conceptuales (conceptual graphs), propuestos por Sowa (1984), se diferencian de las redes IS-A en que los arcos no están etiquetados, y los nodos son de dos tipos: • Nodos de concepto, que pueden representar tanto una entidad como un estado o proceso. • Nodos de relación, que indican cómo se relacionan los nodos de concepto. Por tanto, son los nodos de relación los que hacen el papel de enlaces entre las entidades. Existen dos notaciones para los grafos conceptuales, la forma lineal (textual) y los diagramas que presentan tres tipos de elementos notacionales6: • círculos, que marcan los nodos de concepto, • rectángulos, que marcan los nodos de propiedades, • flechas direccionadas, que marcan las relaciones. Ejemplo de Forma lineal [CONCEPT1] (REL.) [CONCEPT2] Ejemplo de Diagramas Concepto Propiedad relación De este modo se pueden generar grafos bastante complejos para representar conceptos. Como ejemplo, se expone el siguiente grafo7: Figura 1: Ejemplo De Grafo Conceptual Sobre Animales 6 Si quiere información mas detallada puede encontrarla en http://elies.rediris.es/elies9/4-3.htm 7 Ver figura 1 Ejemplo De Grafo Conceptual Sobre Animales 1.3.2 Infraestructura para la Descripción de Recursos (RDF)8 En un principio la World Wide Web se construyó para el uso humano. Es muy difícil automatizar cualquier cosa en la Web, debido al volumen de información que contiene, no es posible gestionarla manualmente. Los metadatos son "datos sobre los datos" (por ejemplo, un catálogo de biblioteca es un registro de metadatos, en el sentido de que describen publicaciones) o concretamente en el contexto de esta especificación "datos que describen recursos Web". La distinción entre "datos" y "metadatos" no es incuestionable; es una diferencia creada en primera instancia por una aplicación particular, y muchas veces el mismo recurso se interpretará de ambas formas (como dato y como metadato) simultáneamente. Resource Description Framework (RDF) [Infraestructura para la Descripción de Recursos] es una base para procesar metadatos. RDF puede utilizarse en distintas áreas de aplicación; por ejemplo: en recuperación de recursos para proporcionar mejores prestaciones a los motores de búsqueda, en catalogación para describir el contenido y las relaciones de contenido disponibles en un sitio Web, una página Web, o una biblioteca digital particular, por los agentes de software inteligentes para facilitar el intercambio y para compartir conocimiento; en la calificación de contenido, en la descripción de colecciones de páginas que representan un "documento" lógico individual, para describir los derechos de propiedad intelectual de las páginas web, y para expresar las preferencias de privacidad de un usuario, así como las políticas de privacidad de un sitio Web. La sintaxis de RDF utiliza el Extensible Markup Language (Lenguaje de Marcado Extensible, XML): uno de los objetivos de RDF es hacer posible especificar la semántica para las bases de datos en XML de una forma normalizada e interoperable. RDF y XML son complementarios: RDF es un modelo de metadatos y sólo dirige por referencia muchos de los aspectos de codificación que requiere el almacenamiento y transferencia de archivos (tales como internacionalización, conjuntos de caracteres, etc.). Para estos aspectos, RDF cuenta con el soporte de XML. Es importante también entender que esta sintaxis XML es 8 Ver referencia biliográfica (L) sólo una sintaxis posible para RDF y que pueden surgir formas alternativas para representar el mismo modelo de datos RDF. El objetivo general de RDF es definir un mecanismo para describir recursos que no cree ninguna asunción sobre un dominio de aplicación particular, ni defina (a priori) la semántica de algún dominio de aplicación. La definición del mecanismo debe ser neutral con respecto al dominio, sin embargo el mecanismo debe ser adecuado para describir información sobre cualquier dominio. Sobre todo, para facilitar la definición de metadatos, RDF contará con un sistema de clasificación muy parecido a los sistemas de programación y modelado orientado a objetos. Una colección de categorías (producida normalmente para un propósito o dominio específico) denominada schema. Las categorías se organizan en una jerarquía, y proporcionan extensibilidad a través de un refinamiento de subcategorías. Así, para crear un esquema ligeramente diferente de uno existente no es necesario "reinventar la rueda" pero se pueden facilitar modificaciones incrementales al esquema base. A través de la compartición del esquema RDF soportará la reutilización de definiciones de metadatos. Como resultado de la reunión de distintas comunidades que están de acuerdo en los principios básicos de la representación y transposición de metadatos, RDF está influido de varias fuentes diferentes. Las principales influencias provienen de la propia Comunidad de Normalización de la Web en forma de metadatos HTML y PICS, la comunidad bibliotecaria, la comunidad de los documentos estructurados en forma de SGML y sobre todo XML, y también de la comunidad de representación del conocimiento (KR). También han contribuido al diseño de RDF otras áreas de la tecnología; incluidos los lenguajes de modelado y programación orientada a objetos, así como las bases de datos. Mientras RDF surge de la comunidad KR [de la representación del conocimiento], advierte que RDF no especifica un mecanismo para el razonamiento. RDF puede definirse como un sistema simple. Un mecanismo de razonamiento debe construirse sobre este sistema de referencia. 1.4 T E R M I N O S C L A V E Dominio: es un entorno específico del problema para el cual el conocimiento se utiliza para afrontar una situación. Sistema basado en conocimientos: un sistema que almacena conocimientos para resolver problemas en un dominio específico del conocimiento. Sistema experto: es un tipo de aplicación que hace decisiones o resuelve un problema dentro de un campo de conocimiento en particular, utilizando conocimientos y análisis de reglas definidas por expertos en ese campo. Ingeniería del conocimiento: es el proceso de codificar el conocimiento de un experto en una forma que pueda ser accesada por una aplicación (Sistema Experto). Adquisición del conocimiento: es la recolección de conocimientos (reglas) de un humano experto que se almacena en la base de conocimientos de un Sistema Experto. Representación del conocimiento: es la notación o formalismo usado para codificar el conocimiento y almacenarlo en un sistema basado en conocimientos. Un ejemplo es la lógica de predicados de primer orden. Base de conocimientos: es la codificación para un sistema experto. En un sistema basado en reglas, una base de conocimientos típicamente está compuesta por las definiciones de atributos y reglas junto con información de control. El formato de la base de conocimientos especifica a la implementación del componente de adquisición de conocimiento. Inferencia: nuevo conocimiento que se deduce del ya existente. Motor de inferencia: es el módulo de procesamiento de un sistema experto con información de la base de conocimientos. El motor de inferencia provee la habilidad de razonamiento que deriva de inferencias (conclusiones) sobre las que actúa el sistema experto. Regla: una expresión de la forma: SI (x) ENTONCES (y) SINO (z), donde (x) se conoce como premisa y (y) es el consecuente. (z) se conoce como el consecuente opcional. Se dice que una regla se dispara cuando la premisa es verdadera o falsa. 2. D E F I N I C I Ó N D E L T E M A La psicometría es la disciplina implicada directamente en la medición psicológica, con una doble vertiente: práctica y teórica. La vertiente teórica supone la fundamentación de las medidas; la práctica supone la construcción, evaluación y aplicación de instrumentos de medida para evaluar o medir las características psicológicas de interés. La investigación a realizar se orientará a explorar esta última vertiente. Las pruebas psicométricas consisten en una serie de preguntas o problemas para las cuales existe un conjunto limitado de respuestas con valores escalares asignados, que permiten evaluar y medir una característica psicológica en particular. Las respuestas se evalúan de acuerdo a un dominio de reglas ya establecidas. Las reglas que se utilizan para analizar las pruebas psicométricas pueden ser tan sencillas como totalizar las respuestas correctas y compararlas contra tablas de resultados (baremos), o bien, pueden ser tan complejas que impliquen combinar respuestas y calcular resultados con fórmulas específicas. El objetivo es arribar a un diagnóstico sobre la característica psicológica que se desea medir. Dependiendo del tipo de prueba que se aplique, el diagnóstico puede consistir en una clasificación de tal característica dentro de un rango de valores (como es el caso de pruebas de coeficiente intelectual) o puede ser más completo de brindar una lectura explicativa (como sucede en las pruebas de personalidad). Es importante hacer notar que tanto las preguntas y respuestas, así como las reglas de evaluación y los análisis de resultados son deterministas, y ya están estandarizadas de acuerdo a la latitud del evaluando al momento de crear el instrumento de medición. Existen formas definidas de cómo deben estructurarse las preguntas y plantillas para tabular los resultados9. En algunos casos también se cuenta con tablas de estadísticas. Después de finalizar el proceso de evaluación de respuestas en la prueba 9 Ver Anexo D. Ejemplos de Pruebas Psicométricas sigue un proceso de análisis de los resultados, consultando manuales que acompañan las pruebas para obtener un diagnóstico o conclusión. Como puede observarse, las pruebas psicométricas poseen las características necesarias para poder construir un sistema experto que sirva como herramienta que facilite realizar estas pruebas. Un sistema experto es un tipo de software que imita el comportamiento de un experto humano en la solución de un problema. Pueden almacenar conocimiento de un experto para un campo determinado y solucionar un problema mediante la deducción lógica de conclusiones. Los sistemas expertos se caracterizan por ser capaces de razonar a partir de información simbólica y numérica dentro de un dominio específico del conocimiento. Además, usan métodos y procedimientos heurísticos y algoritmos propios del dominio específico. Por otra parte, explican qué “caminos” toman para llegar a una conclusión. 2.1 C O M P O N E N T E S D E U N S I S T E M A E X P E R T O 10 a) Base de conocimientos: contiene el conocimiento de los hechos y las reglas similares a las de un experto, importantes para la solución de un problema. b) Motor de inferencia: es la unidad lógica con la que se extraen conclusiones de la base de conocimientos, según el método fijo de solución de problemas, imitando el procedimiento humano de los expertos. c) Componente explicativo: explica la estrategia de solución. d) La interfaz de usuario: cómo se le presenta al usuario final la información. e) El componente de adquisición: interfaz de usuario en la que el experto trasmite su conocimiento. 10 Ver Figura 2. Diagrama de Componentes Generales de un Sistema Experto. MODULO DE ADQUISICIÓN DE CONOCIMIENTOS MOTOR DE INFERENCIA BASE DE DATOS (HECHOS) BASE DE CONOCIMIENTOS (REGLAS) MODULO DE EXPLICACION INTERFAZ DE USUARIO EXPERTO USUARIO Figura 2. Diagrama de Componentes Generales de un Sistema Experto La implementación de estos componentes para el desarrollo del sistema experto para la construcción y aplicación de pruebas psicométricas tiene las siguientes particularidades11: 1) El componente de adquisición consiste en una interfaz gráfica que permite al experto (un psicólogo o psicometrista) ir estructurando la prueba en una forma electrónica, crear las reglas para evaluar la prueba y establecer los diagnósticos o conclusiones a las que debe arribar el sistema. 2) La interfaz de usuario es el modulo en el cual las personas pueden tomar, las pruebas, los datos de estas pruebas son almacenados en la base de datos. 3) El motor de inferencia consulta la base de datos de respuestas y hace la valuación contra las reglas especificadas en la base de datos de conocimientos, utilizando un algoritmo de encadenamiento hacia adelante12. 4) La base de datos de conocimientos almacena tanto la estructura de las pruebas como las reglas para evaluarlas al igual que los diagnósticos. 5) Finalmente, el componente explicativo son los reportes que muestran la evaluación de la prueba y del diagnóstico encontrado. 11 Ver Figura 3: Implementación de Componentes para un sistema experto 12 Ver Figura 4: Implementación de Motor de Inferencia con encadenamiento hacia delante. Diagrama de Componentes del Sistema Experto para la Construcción y Aplicación de Pruebas Psicométricas Componente de Adquisición de Conocimientos Interfaz de Usuario de Experto Interfaz de Usuario para Evaluandos Componente Generador de Pruebas BDD de Despliegue Base de Conocimientos BDD de Trabajo Servidor de Paginas Web Interfaz de Usuario para Evaluador Componente Explicativo Motor de Inferencia Constructor de Pruebas Personas a evaluar EXPERTO EVALUADOR Figura 3. Implementación de componentes de un sistema experto R1 R7 R11 R18 C4 COMPONENTE EXPLICATIVO MOTOR DE INFERENCIA IMPLEMENTANDO ENCADENAMIENTO HACIA ADELANTE H E C H O S R1 R6 R3 R4 R2 R5 R7 R8 R9 R10 R12 R13 R11 R14 R15 R17 R18 R16 R19 C1 C2 C3 C4 C5 R E S U L T A D O S BASE DE CONOCIMIENTOS R1 R2 R3 R4 R5 R6 ... Rn C1 REGLAS C3 C2 C4 C5 …. Cn CONCLUSIONES Figura 4. Implementación de motor de inferencia con encadenamiento hacia adelante 3. J U S T I F I C A C I Ó N D E L T E M A Con la creación de un sistema experto para la construcción y aplicación de pruebas psicométricas se busco hacer una aplicación que permitiera realizar diferentes tipos de pruebas, y que éste sirviera de herramienta a un experto (en este caso un psicólogo) para poder interpretar los datos resultantes de todas las respuestas ingresadas por la persona que se está evaluando. Aquí es donde se aprovechan las ventajas que presentan los sistemas expertos, ya que una vez ingresada la información necesaria para el funcionamiento del sistema (proceso de enseñanza), no es indispensable que se vuelva a alimentar el sistema para que este pueda procesar nuevas evaluaciones de la misma prueba. Así, la persona que ha alimentado la base de conocimientos puede delegar la responsabilidad de aplicar las pruebas sin necesidad de estar presente de ahí en adelante, ya que la aplicación es capaz de resolver los problemas en base a la información recibida (reglas). En cuanto al proceso de evaluación de los datos que se generan al aplicar una prueba, con la implementación de un aplicativo que permite evaluar y sacar conclusiones de las respuestas en base a reglas definidas por un experto, se disminuye el tiempo para obtener los resultados, ya que no es necesario ir puntuando examen por examen, sino que las conclusiones se generan de una manera automatizada, sin necesidad de que quien genera la información conozca del método de evaluación de las pruebas, ni mucho menos del proceso que se sigue para evaluar los datos y obtener conclusiones en base a parámetros exclusivos de una prueba determinada. La forma de evaluación de pruebas psicométricas a través de un sistema computarizado (evaluación en línea y almacenamiento en base de datos), así como la generación de reportes en pantalla hace que se ahorren costos por el uso de materiales de oficina y horas laborales. Actualmente, en la mayoría de instituciones en donde se hace uso de evaluaciones psicométricas se utiliza papel para recoger las respuestas y se procede a ingresar los datos en una computadora si se quiere tener un respaldo de la información. Además, el hecho de que las reglas para obtener resultados en una evaluación ya estén ingresadas, permite al experto psicólogo realizar otras actividades, ya que el sistema brindará conclusiones de las pruebas automáticamente, y solo bastará que lo compare contra la información recogida en la entrevista. Un punto importante que se debe destacar con la implementación de un sistema de este tipo, es que los resultados que brinda para una determinada prueba son constantes, eliminando así la posibilidad de que existan errores a la hora de evaluar los datos, debido a una mala percepción humana (cansancio, distracción, etc.), lo cual hace que las ponderaciones puedan variar. Al crearse una evaluación que permita a un psicólogo sistematizar nuevas evaluaciones psicométricas de acuerdo a sus necesidades, no será necesario la intervención de programadores para desarrollar una aplicación para un tipo de pruebas, como ocurre con diferentes proveedores de software, que ofrecen crear aplicaciones que permiten evaluar solamente un determinado examen. Este sistema pretende innovar la forma de cómo se realizan las tareas tradicionalmente. Al sistematizar las pruebas, se pueden empezar a automatizar procesos que antes se realizan manualmente, sobre todo aquellos que son repetitivos y hasta cierto punto tediosos. Además, poco a poco “las oficinas sin papel” se están volviendo más comunes en las empresas. El sistema experto para la aplicación de pruebas psicométricas permite aplicar las pruebas sin necesidad de tener que estar fotocopiando las pruebas, paginas de respuestas y manuales de preguntas. Así las pruebas se aplican en línea y los datos éstan almacenados en bases de datos que se pueden consultar en cualquier instante. El impacto inmediato de esta aseveración es la reducción de costos. La inversión que se realiza para implementar el sistema se compensa con los ahorros en insumos de oficina y materiales necesarios para la evaluación. Por otro lado, se está contribuyendo a la sociedad a mejorar los procesos actuales, incorporando herramientas informáticas que permitan orientar a las personas hacia la nueva cultura de informática. Además, se pueden hablar de otros beneficios de carácter social, como son la orientación vocacional de los estudiantes en las instituciones educativas, el apoyo psicológico a personas en ambientes empresariales y detección de aptitudes que pueden explotarse, ya que al mejorar las pruebas constituyen una técnica para detectar rasgos y características de personalidad que puedan potenciarse o mejorarse, pues al facilitar el proceso de aplicación y evaluación de pruebas psicométricas, se pueden atender mas casos, facilitando el acceso a las personas poniendo a su disposición éstas pruebas. 4. O B J E T I V O S D E L P R O Y E C T O Objetivo General Crear una herramienta informática para la alimentación y aplicación de pruebas psicométricas orientadas a la medición de características psicológicas específicas en las personas, utilizando el concepto de sistema experto basado en reglas. Objetivos Específicos • Innovar el actual esquema de trabajo para la aplicación de pruebas psicométricas, con la sistematización de las mismas. • Elaborar una herramienta para facilitar el proceso de aplicación de pruebas psicométricas, contribuyendo a minorizar los problemas que se presentan a las personas y en las instituciones que utilizan este tipo de pruebas en sus labores. • Elaborar una interfaz gráfica de usuario para la adquisición de conocimientos. • Desarrollar un ambiente para la construcción de pruebas, alimentación de reglas (conocimientos) y definición de resultados. • Crear la estructura necesaria para el almacenamiento de los conocimientos de reglas y definición de resultados. • Desarrollar la interfaz web para la presentación de las pruebas y la correspondiente captura de respuestas, según el diseño elaborado por el experto en la fase de construcción. • Implementar un motor de inferencia para la evaluación de pruebas según las reglas especificadas en la fase de adquisición de conocimientos. • Construir un módulo para la generación de reportes, a partir de los resultados obtenidos, junto con la explicación de la estrategia seguida para llegar a esa conclusión. 5. A L C A N C E S El sistema funciona como un “shell” para alimentar diferentes tipos de pruebas psicométricas, las cuales quedan almacenadas para ser aplicadas posteriormente. Estas pruebas son independientes unas de otras, pues miden diferentes características psicológicas y tienen diferentes métodos de calificación. El sistema experto desarrollado es capaz de “aprender” a obtener los resultados de las pruebas psicométricas deterministas, mediante la implementación de un motor de inferencia que evalúe todas aquellas reglas que el experto ha determinado para calificar las respuestas. Se dice que es un sistema experto determinista porque los mismos datos de entrada producirán las mismas conclusiones. El modelo utilizado para implementar el motor de inferencia fue el de encadenamiento hacia delante, simulando el razonamiento deductivo de un humano. El dominio de información de la aplicación, son todas las respuestas de la persona examinada las que se utiliza para deducir un diagnóstico. Para que los resultados de la evaluación sean útiles para el experto, el sistema debe ser capaz de explicar la estrategia que siguió (el conjunto de reglas aplicadas) para arribar a la solución, por lo que el sistema incorpora dentro de los reportes, un detalle de tal estrategia. 6. L I M I T A C I O N E S El sistema adquiere sus conocimientos a través de la transferencia directa de información que brinda el experto humano, lo cual le permite sacar conclusiones de acuerdo a reglas preestablecidas; sin embargo, de la interacción directa con el usuario que se toma el examen, no se obtiene un aprendizaje, es decir, el sistema no aprende a resolver nuevas situaciones como resultado de una experiencia, más bien, sus conocimientos ya éstan dados. Existen diferentes pruebas psicométricas que pueden ser sistematizadas, y que reúnen ciertas características comunes, las cuales pueden generalizarse para poder alimentar un determinado número de reglas que un experto considere necesarias para el correcto funcionamiento y análisis del sistema a partir de los datos obtenidos de la interacción con el usuario. Es precisamente hacia este tipo de pruebas que el sistema se orienta, no incluyendo otros tipos de evaluaciones que examinen aspectos como las habilidades motrices, lingüísticas, etc., las cuales necesitan de otros métodos para poder capturar los datos. Para la generación de evaluaciones, las preguntas que se incluyan deben ser del tipo deterministas, las cuales tienen un rango limitado de posibles respuestas. No se deben incluir preguntas en las que para poder obtener conclusiones a partir de sus respuestas dependan de la opinión o punto de vista del evaluador, como podría ser el caso de preguntas abiertas o entrevistas. El sistema solo puede ser utilizado para la construcción de pruebas psicométricas que tienen puntuaciones exactas o de lógica matemática de primer orden El sistema a desarrollado solo es una herramienta que permite sistematizar las pruebas psicométricas. Aquellas personas e instituciones que quieran utilizar el sistema debe resolver cualquier problema de licenciamiento de las pruebas psicométricas que se alimenten al sistema, para evitar caer en ilegalidades. Además, es responsabilidad del usuario final de la herramienta (experto psicólogo) respetar las normas y propiciar el ambiente en que se van a aplicar las pruebas según exija el autor de la de las misma. 7. D E L I M I T A C I O N E S La investigación se ha respaldado en información proporcionada por expertos psicólogos involucrados en la toma de decisión para el reclutamiento de personal y orientación vocacional. No se ha indagado en el ámbito clínico, pues hay menos estandarización en la selección y aplicación de pruebas psicométricas. Por ello, el diseño de la aplicación se ha orientado a satisfacer los requerimientos y necesidades de aquellas instituciones que utilizan pruebas psicométricas en el proceso de selección de personal y de aptitudes vocacionales. Se ha tomado como modelo un número limitado de pruebas psicométricas, procurando que éstas sean las más comunes entre las instituciones, pero a la vez que reflejen diferentes métodos de evaluación y áreas de conocimiento de la psicometría. Por tanto, el sistema final no tiene ninguna prueba ingresada, solamente para efectos de demostración se ha ingresado la prueba DISC. Como se mencionó en las limitaciones, se a dejado a decisión de la persona o instituciones finales la selección de las pruebas que se deseen ingresar al sistema y será su responsabilidad el problema de licenciamiento que éstas impliquen. 8. S I T U A C I Ó N A C T U A L Los psicólogos emplean una variedad de pruebas que son utilizadas en el diagnóstico de cualidades personales, basadas en normas o criterios de evaluación. En general los tipos de pruebas psicológicas más comunes son: • Pruebas de inteligencia • Pruebas de aptitudes o habilidades • Pruebas de comportamiento • Pruebas de personalidad • Pruebas de intereses Instituciones donde son Aplicadas Estas Pruebas • Instituciones educativas Generalmente las instituciones educativas utilizan pruebas de orientación vocacional profesional para poder definir cuales son las aptitudes de los estudiantes y de esta manera poder orientarlo en la elección de una carrera profesional. También son utilizadas para realizar estudios exploratorios y definir áreas específicas en las cuales el alumno puede presentar deficiencias. De igual manera se utilizan para poder definir rasgos de personalidad y encontrar cuales son sus capacidades de adaptación y respuesta ante problemas. • Instituciones empresariales Se utilizan para la selección de personal y ubicación del mismo en el área en el cual más se ajuste a su perfil. Se evalúan habilidades para áreas especificas: su capacidad de adaptación, su inteligencia emocional, ya que estas pruebas sirven como instrumento de diagnóstico que mide el éxito profesional. • Clínicas psicológicas Son utilizadas por los psicólogos para diagnosticar patologías de un paciente para recomendar un tratamiento. También le sirven al psicólogo para verificar el progreso del mismo a medida que avanza con el tratamiento. Formas en las que se Aplican las Evaluaciones • Pruebas haciendo uso de papel En una institución donde se evalúa de esta forma, se emiten cuantas copias de las evaluaciones sean necesarias. Haciendo uso de este recurso se generan gastos y está sujeta a errores de distorsión de imágenes (copias borrosas), tanto para la captura de los datos, como en el cálculo de resultado. • Evaluaciones a través de software Estas evaluaciones son un poco más eficientes que las desarrolladas en papel, ya que se evita costos de evaluador y se cuentan con procesos de ponderación sistematizados, lo que ahorra tiempo en la obtención de resultados. El inconveniente en ellas es que solamente fueron desarrolladas para un método definido y una prueba determinada. En el momento que se necesite hacer otro tipo de examen debe valerse nuevamente de evaluaciones mediante papel o de contratar a un programador para que le sistematice esa nueva evaluación. • Consultas directas con experto psicólogo En este caso las evaluaciones son mediante entrevistas, donde el paciente responde preguntas hechas por el psicólogo o experto. El diagnóstico no se obtiene a partir de comparaciones con tablas o plantillas13, sino de la percepción del experto y su experiencia en el campo (Entrevistas, pruebas de apercepción temática). 13 Ver Anexo D: Ejemplos de Pruebas Psicométricas INCIO REALIZACIÓN DE LAS PRUEBAS ACTIVIDADES DEL EXPERTO PAPELETAS MANUAL DE EVALUACION PLANTILLA EVALUACION DE LAS PRUEBAS GENERACIÓN DE REPORTES FIN Figura 5. Flujograma de Actividades de la Situación Actual 9. P L A N T E A M I E N T O D E L P R O B L E M A En este apartado se hace un análisis de los diferentes problemas que se presentan cuando se desarrollan evaluaciones psicométricas. 1) Cambios en las pruebas A menudo, en las diferentes instituciones donde se aplican pruebas psicométricas se ven en la necesidad de cambiar de tipos de pruebas que evalúen otras características de personas que se someterán a las mismas. a) Adquisición de nuevas pruebas. b) Automatización. En algunas instituciones se dan la tarea de automatizar pruebas para agilizar el trabajo de los evaluadores, lo que implica que cada vez que se adquiere una nueva evaluación tendría que sistematizarse e incurrir en costos de desarrollo de dicha aplicación. En otras ocasiones, se compra el software de la aplicación sistematizada, si es que existe. c) Adaptación al cambio. Una vez que en una institución se adquiere una prueba nueva es necesario adaptarse a la forma de calificación de la misma. 2) Costos a) Materiales En la evaluación de pruebas psicométricas se ven involucrados diferentes materiales como se desglosa a continuación. i) Fotocopias: cuando se emiten pruebas psicométricas es necesario hacer copia de la misma. ii) Útiles: es necesario que la institución que realiza las pruebas posea los útiles necesarios para la emisión de la misma: lápiz, lapicero, borrador, etc. iii) Insumos: entre otros materiales utilizados se tienen acetatos, marcadores, calculadoras, proyectores y otros. 3) RR-HH a) Expertos: con frecuencia es necesaria la presencia de un psicólogo para emitir la pruebas o para hacer entrevistas en caso de que no se cuente con pruebas psicométricas. b) Evaluadores: en ocasiones en necesaria la presencia de muchas personas que cooperen con el proceso de emisión y evaluación de pruebas, debido a la cantidad de trabajo que esto conlleva. 4) Disponibilidad de expertos a) Tiempo dedicado El desarrollo de las pruebas psicométricas y el tiempo de evaluación se ve sujeto a la disponibilidad de los expertos. b) Costos Generalmente la contratación de expertos en el área conlleva al aumento de costos en emisión de pruebas. c) Difícil de reemplazar A falta de pruebas psicométricas los expertos psicólogos se vuelven esenciales dentro de la institución. 5) Errores en evolución Generalmente cuando se evalúan las pruebas para obtener un resultado existe la posibilidad de que éstas posean un margen de error, debido a los siguientes factores: a) Cansancio físico b) Cansancio mental c) Error de percepción 6) Tiempo de respuesta El tiempo de respuesta de las evaluaciones depende mucho de la habilidad de las personas para calcular los resultados; por otra parte, también se tiene que tomar en cuenta los siguientes factores: a) Volumen de pruebas b) Evaluación comparativa En muchas instituciones, en el proceso de selección de personal es necesario el desarrollo de evaluaciones para comparar y elegir aquella que más se aproxime al perfil establecido. c) Método de evaluación de trabajo En algunos casos el método que se ha establecido para la obtención de resultados es tedioso, lo que hace que se demore más en obtener un resultado grupal o individual de las evaluaciones. En la Figura 6 se hace un análisis de la situación actual del problema mediante el método de Espina de Pescado. Figura 6. Diagrama de espina de pescado de la Situación Actual. ANALISIS DE LOS PROBLEMAS QUE SE PRESENTA EN LA EVALUACION DE PRUEBAS PSICOMETRICAS Evaluaciones psicometricas Costos Cambios en pruebas sistematizadas Errores en evaluación Materiales Fotocopias Utiles Evaluadores Adaptación al cambio Adquisición de nuevos cambios en las pruebas Volumen de pruebas Evaluaciones comparativas Metodo de eval. de trabajo Cansancio fisico Cansancio mental Error de percepción Dificil de reemplazar Tiempo de respuestas Disponibilidad Expertos Costos Tiempo dedicado 10. P L A N P R O P U E S T O El objetivo principal del proyecto es desarrollar un sistema experto que pueda “aprender” a obtener los resultados de las pruebas psicométricas que le sean alimentadas. Para iniciar, un experto (psicólogo o psicometrista) debe crear la estructura de cada prueba a través de una interfaz gráfica, en donde se deben especificar los textos e imágenes que acompañan a cada pregunta, así como la forma en que se capturarán las respuestas (mediante botones de radio, cajas de texto, cuadros de selección, etc.) Estas estructura quedan almacenada en una base de datos llamada “base de datos de despliegue” para futura utilización en la presentación de cada prueba, como se explicará más adelante. Una vez han sido introducidas todas las preguntas, el experto debe especificar todas las reglas que se han aplicar para poder evaluar las pruebas. Estas reglas constituyen la base de conocimientos. Adicional, se deben agregar las posibles conclusiones a las que debe arribar el sistema. Al terminar estas dos fases, la prueba estará lista para utilizarse en un ambiente WEB. Las personas que vayan a examinarse utilizarán un navegador para accesar la prueba. Cada pregunta se construye dinámicamente según la información almacenada en la base de datos de despliegue. Las respuestas se almacenan en una base de datos de conocimientos junto con el perfil de la persona examinada, que luego sirven como entradas en el motor de inferencia. El motor de inferencia aplican todas las reglas pertinentes, según se hayan especificado en la base de conocimientos, y lanza un diagnóstico o resultado (según el tipo de prueba). Adicional, se generan reportes con estos resultados y una explicación de cómo se llegó a determinar ese resultado en caso de que el examinador así lo desee. Así, el sistema experto es lo suficientemente abierto y adaptable a diferentes tipos de pruebas en que el psicólogo pueda transmitir sus conocimientos en el área de psicometría. Sin embargo, el proceso de alimentación de pruebas no solo requiere del conocimiento del experto en el tema de psicología, sino que también requiere de aprender a usar bien la herramienta para alimentar las pruebas. Se han desarrollado un manual de usuario que contiene una explicación detallada del uso de la herramienta. El modulo para la construcción de pruebas no es difícil de manejar pero probablemente requiere de un refuerzo para que la persona que tenga la responsabilidad de alimentar la prueba no cometa errores y el proceso sea más fácil de llevar a cabo. El área que requiere más trabajo es la especificación de reglas, pues el proceso es más minucioso. Es vital que las pruebas se construyan adecuadamente de forma legible para el usuario, para asegurarse que el evaluando comprenda como debe contestar la prueba y no cometa errores que alteren los resultados. A su vez, es importante que las reglas que se especifiquen se estructuren de forma muy precisa, pues de éstas dependerá la correcta interpretación de una evaluación. Por otro lado, el proceso de generación de reportes no es tan complicado, pues basta con que el usuario aprenda el metalenguaje que se ha especificado, y su uso es similar a las búsquedas avanzadas en los navegadores web. De ser necesario, una capacitación ahondaría en estos dos temas, la alimentación de pruebas y la especificación de reglas, pues los procesos de publicación de pruebas y de generación de reportes no requieren mayor refuerzo. Procesos generales del sistemas SEPSI ActividadActividad Evaluador finalEvaluador finalExperto PsicologoExperto Psicologo EvaluandoEvaluandoAdministradorAdministrador Instalación del sistema Inicio Este módulo instalará y permitirá al usuario configurar cada una de las heramientas necesarias para el funcionamiento del sistema . Entre ellos tenemos , MSDE, JAVA,Base de datos SEPSI , IIS y módulos del Sistema SEPSI 1 2 La administración del sistema comprenderá la administracion de usuarios , y configuración del mismo Administación del sistema Este módulo permitirá al experto configurar las diferentes preguntas correspondientes a la prueba , forma de evaluación , posibles respuestas y conclusiones a esas posibles repuestas 3 4 Mediante este módulo se crearán las diferentes reglas con las cuales se evaluará la prueba que se esté construyendo . Una vez emitidas las pruebas , se correrá el proceso y este generará nuevo conocimiento Las pruebas psicométricas contienen una o varias conclusiones para las posibles combinaciones de respuestas de los evaluandos . Mediante este módulo se almacenarán todos los diagnósticos que generará la prueba. Esta información también constituirá base de conocimientos 5 Generador de páginas ASP Búsqueda de reportes Mediante este proceso se cargará la configuración con la cual se almacena la prueba psicométrica , y convertirá la prueba a formato ASP 6 Pruebas Psicométricas formato ASP7 Las pruebas psicométricas con formato ASP se motarán sobre un servidor al cual podrán tener acceso los diferentes evaluandos de la aplicación El sistema permitirá la búsqueda del perfil del evaluando , emitiendo un reporte de las personas que posean esas características 8 FIN Reportes según elección Constructor de pruebas Almacenamiento de la configuración 1 Almacenando base de conocimientos Ingreso de base de conocimientos Reglas de evaluación Figura 7. Procesos Generales del sistema SEPSI 10.1 V A L O R A G R E G A D O Actualmente existen muchas formas de representación de pruebas psicométricas, las cuales son capaces de capturar datos introducidos por los usuarios y presentar resultados que se obtienen a partir de fórmulas definidas previamente. Sin embargo, estas evaluaciones han sido creadas específicamente para examinar sólo ciertas pruebas, sin la posibilidad de cambiar la información generada, a menos que se invierta en la creación de una nueva aplicación a la medida, lo cual involucra la presencia de programadores para desarrollarla o realizar los cambios solicitados. Con la existencia de un sistema capaz de ser alimentado con parámetros de evaluación y presentación de pruebas no se esta limitado a evaluar solo ciertos exámenes que estén incluidos en una aplicación, sino que se tiene la posibilidad de enseñar a la máquina la forma en que se capturarán los datos para una nueva prueba psicométrica que se automatiza, así como los procedimientos para generar los resultados a partir de los mismos. De esta forma, se simplifica el hecho de tener que adquirir nuevo software o invertir en horas de programación para obtener nuevas pruebas, bastando con que un experto alimente la base de conocimientos que el motor de inferencia usa para generar las evaluaciones. Las aplicaciones que existen actualmente brindan resultados que se han especificado previamente, de acuerdo a parámetros de coincidencias de un determinado número de preguntas, preguntas buenas y malas, etc. Sin embargo, en éstas no se puede saber la causa por la que se llegó a un determinado resultado, solo el diagnóstico final o en algunos casos, el detalle de lo que se respondió en cada pregunta. El Sistema Experto para la construcción de pruebas psicométricas permite conocer una explicación de la forma en que se llegó a los resultados obtenidos (componente explicativo), de acuerdo a las especificaciones determinadas por el experto para cada paso de la evaluación. El sistema experto sirve como una herramienta para apoyar el proceso de toma de decisiones en los casos en los que las pruebas psicométricas son utilizadas como indicadores que determinan una acción a tomar, como puede ser el caso de los procesos de selección de personal en instituciones educativas, empresariales y otras. Para ello, el sistema incorpora entre sus partes un módulo explicativo, el cual detalla cuáles fueron los pasos seguidos por el motor de inferencia para llegar a una determinada conclusión. Dentro de la información que se almacena en la base de datos que utiliza el motor de inferencia se encontrarán los perfiles de los usuarios que se toman las pruebas, lo cual permite realizar consultas que usen como parámetros los datos de los mismos, pudiéndose generar reportes con información de un usuario en particular y resultados de evaluaciones grupales. INCIO CREACION DE LA ESTRUCTURA DE LA PRUEBA EN FORMATO ELECTRÓNICO ALIMENTACIÓN DE LAS REGLAS PARA EVALUAR LA PREUBA ALIMENTACIÓN DE LAS CONCLUSIONES O DIAGNÓSTICOS BDD DE DESPLIEGUE BASE DE CONOCIMIENTOS ACTIVIDADES DEL EXPERTO REALIZACIÓN DE PRUEBAS EN LINEA BASE DE DATOS DE TRABAJO EVALUACIÓN DE LAS PRUEBAS GENERACIÓN DE REPORTES ACTIVIDADES DEL EVALUADOR FIN Figura 8. Flujograma de Actividades de la Situación Propuesta DIAGRAMA DE IMPLEMENTACIÓN DEL SISTEMA EXPERTO PARA LA CONSTRUCCIÓN Y APLICACIÓN DE PRUEBAS PSICOMÉTRICAS INTERFAZ DE USUARIO PARA EXPERTO INTERFAZ DE USUARIO PARA EVALUADOR EXPERTO SERVIDOR EVALUADOR Personas a evaluar Navegador Navegador Navegador Figura 9. Implementación para el Sistema de Evaluación de Pruebas según la situación propuesta 10.2 I N F O R M A C I Ó N D E C O N F I G UR A C I Ó N E I N S T A L A C I Ó N La implementación sugerida es la ideal para el mejor rendimiento del sistema, sin embargo, este puede instalarse en una sola estación de trabajo. Para el caso en que se implemente el sistema sin una red, la base de conocimientos y despliegue, así como módulo de construcción y aplicación de pruebas, residen en la misma computadora. Las personas que se desean evaluar, completan las pruebas en esta misma estación de trabajo, y ahí mismo se generan los reportes. La implementación en red supone que en el servidor central residen la base de conocimientos y la base de despliegue. A la vez, éste funciona como un servidor de páginas web, a través del Internet Information Server. Todas las estaciones de trabajos deben poseer