ArtículosNúmero 7

El ser humano como instrumento de medida

0

Leslie Pendrill
SP, Instituto de Investigación Técnica de Suecia
Instituto Nacional de Metrología Suecia

Resumen:
La demanda de mediciones con calidad garantizada está aumentando, no sólo en sectores como la asistencia sanitaria, los servicios o la seguridad, en los que el factor humano es obvio, sino que son cada vez más los fabricantes de productos técnicos tradicionales de todo tipo que se están dando cuenta de la necesidad de garantizar la calidad de sus productos tal como la perciben los usuarios. Sin embargo, la metrología de observaciones basadas en el ser humano está todavía en pañales. Este artículo estudia cómo abordar el tema mediante una aproximación basada en el análisis de un sistema de medida, particularmente cuando es el ser humano quien actúa como instrumento de medida. Relacionar el riesgo en la toma decisiones, cuando se manejan observaciones cualitativas, con la teoría de la información, la elección perceptiva y los modelos lineales generalizados — mediante el enfoque de la medida invariante de Rasch — permite un tratamiento adecuado de los datos ordinales y una clara separación entre las estimaciones de los atributos de la persona y del objeto. Todo ello permite establecer referencias de medición y garantizar la calidad metrológica exigida en muchas aplicaciones actuales.1

Abstract:

Demands for quality assured measurement are increasing, not only from sectors, such as health care, services and safety, where the human factor is obvious, but also from increasing numbers of manufacturers of traditional technical products of all kinds who realise the need to assure the quality of their products as perceived by the user. The metrology of human-based observations is however in its infancy. This article reviews how this can be tackled with a measurement system analysis approach, particularly where Man acts a measurement instrument. Connecting decision risks when handling qualitative observations with information theory, perceptive choice and generalised linear modelling – through the Rasch invariant measure approach – enables a proper treatment of ordinal data and a clear separation of person and item attribute estimates. This leads in turn to opportunities of establishing measurement references and the metrological quality assurance urgently needed in many contemporary applications.

1 Artículo original en inglés, traducido al español por Aina Cendra y Emilio Prieto, del Centro Español de Metrología

1. Evolución actual de la metrología para considerar los seres humanos

Todos damos por hecho que los instrumentos son generalmente más fiables para comprobar un objeto que nuestros “cinco sentidos”. Sin embargo, aunque la tecnología avanza, rara vez se elimina por completo el factor humano de las aplicaciones más importantes. Por este motivo, existe una clara necesidad de considerar al ser humano que interviene en los sistemas de medida, no sólo como operador pasivo, sino también bajo dos formas activas y radicalmente diferentes (véase la figura 1):

  • Como objeto de medición: la persona es el propio objeto de medida.
  • Como instrumento de medida: en lugar de utilizar equipamiento de medida, utilizar los sentidos y el conocimiento del ser humano para medir objetos [Pendrill et al. 2010].

Figura 1. Diferentes intervenciones humanas en los sistemas de medida

Este cambio actual en la metrología para incluir la medición basada en el ser humano es muy amplio y tiene como objetivo satisfacer las exigencias, no sólo de sectores como la sanidad, los servicios y la seguridad, en los que el factor humano es obvio, sino también de un número creciente de fabricantes de productos técnicos tradicionales de todo tipo, que se han dado cuenta de la necesidad de garantizar la calidad de sus productos tal como los percibe el usuario.

Tabla 1. Relación entre los atributos del objeto y las características de las personas, en respuestas a distintas aplicaciones
2 Ouden et al. [2008]
3 Klöcker et al. [2008]
4 Handa and Massof [2004], Farbrot et al. [2013]
5 De Battisti et al. [2005]
6 Weller et al. [2013], Zhang et al. [2011]
7 Rasch [1961]
8 Sijtsma [2011], Wilson [2013]
9Fisher [1997]
10 Ben-Akiva, Bierlaire [1984]
11 McFadden [2000], Kahneman [2002]

La caracterización fiable del instrumento de medida humano [Berglund et al. 2011], ya sea con los cinco sentidos o con toda la riqueza fisiológica, mental, cognitiva y conductual de la percepción humana, es esencial en muchas y distintas aplicaciones [tabla 1]. Hace unos diez años, un fabricante del sector de la electrónica de consumo a gran escala informó de que los casos en los que clientes insatisfechos devolvían productos “sin defectos encontrados” habían aumentado más del 50 % [Ouden et al. 2008]. A una persona discapacitada, enferma o anciana se le puede ayudar a realizar mejor sus tareas diarias, mediante una mejor medición de sus capacidades, de los niveles de dificultad a los que se enfrenta y de las prestaciones de los productos de apoyo [Handa y Massof 2004, Farbrot et al. 2013]. Ciertas funciones humanas se pueden mejorar, por ejemplo con máquinas que aprendan [Zhang et al. 2011], para que exploten las crecientes cantidades de información disponibles en la sociedad. Los ciudadanos de hoy necesitan un nivel de comprensión sobre números y habilidades matemáticas básicas que les permita utilizar la información numérica que políticos, compañías de seguros, asesores financieros o vendedores, emplean y les presentan en textos, tablas o gráficos [Weller et al. 2013]. No obstante, los consumidores difieren considerablemente entre sí en su capacidad de entender y usar dicha información. En muchas de estas aplicaciones, los temas de preocupación no son solamente técnicos sino también humanos y de valoración, como la comodidad, el placer, la belleza, la ansiedad [Schmidhuber 2009, Klöcker et al. 2012] y otras medidas del “capital” humano [Fisher 2009].

Más allá de los habituales enfoques descriptivos de la percepción humana, contamos con una serie de conceptos fundamentales que sustentan los enfoques predictivos, como la teoría basada en la evidencia y la inducción experta [Helton et al. 2004], la elección prescriptiva individual, cuyo objetivo es explicar y predecir, por ejemplo, el comportamiento de las personas que viajan a diario entre su hogar y el lugar de trabajo, para maximizar la utilidad (Ben Akiva [1984], McFadden [2000]), la teoría prospectiva y la elección intuitiva [Kahneman 2002].

2. Exigencias de aseguramiento de la calidad en mediciones basadas en el ser humano

La evaluación de la conformidad basada en la medición garantiza el cumplimiento de los requisitos de calidad de los productos y servicios; y, a menudo, es esencial por razones de interés público, salud, seguridad y orden, protección del medio ambiente, consumidor y comercio justo.

Como sucede en las áreas más tradicionales, el aseguramiento de la calidad de observaciones menos cuantitativas es esencial para garantizar la calidad de muchos tipos de productos. Sin embargo, en la medición basada en el ser humano, la formulación de conceptos metrológicos como incertidumbre de medida y trazabilidad, está todavía en pañales [Fisher 1997, 2009; Humphry 2011]. El presente análisis intenta reunir diferentes enfoques recientes de distintas disciplinas en una continua búsqueda por establecer conceptos, herramientas y procedimientos para garantizar la calidad de las mediciones en esta área en expansión del ser humano como objeto de medida.

Los sistemas de gestión de calidad, como los de las industrias manufactureras, han estado regulados durante más de medio siglo mediante sistemas de certificación y normas clave (normas escritas), como la conocida serie ISO-9000. Una característica común a todas las normas ISO-9000 sobre implantación de sistemas de gestión de calidad, es la de seguir una serie de pasos en el “ciclo de calidad” de Deming, tal que garanticen la calidad en todas las etapas de la vida de cualquier producto o servicio, desde que el cliente lo solicita, hasta que dispone de él, incluyendo el posterior reciclaje. Estas normas requieren a su vez mediciones acordes, de calidad garantizada.

2.1. Mediciones de calidad garantizada en servicios basados en el ser humano

La aparición de la garantía de calidad en las actividades basadas predominantemente en el ser humano, puede ejemplificarse en la reciente aparición de regulaciones y normas en materia de salud, ya sea en servicios —con la nueva norma europea EN 15224:2012— o en demandas de productos y dispositivos médicos nuevos o mejorados —como las regulaciones de la FDA, basadas en los resultados comunicados por el paciente [2009] y en la ingeniería para lo útil.

De acuerdo con el modelo de atención centrada en la persona [OMS 2008], si existe el objetivo de mejorar el tratamiento de los pacientes y promover la salud, los indicadores clave (paso d} del ciclo de Deming [NRC 2013]) normalmente serán medidas acerca de: la experiencia en la atención, la toma compartida de decisiones y el establecimiento de objetivos comunes, la inclusión del paciente en el equipo médico, el conocimiento y la comprensión del plan de cuidados por parte del paciente, las comunicaciones clínicas y, finalmente, el apoyo al cuidado personal y la calidad de vida. Junto con las medidas tradicionales de física médica, como la presión arterial, la temperatura corporal, etc., los nuevos indicadores centrados en la persona también incluyen magnitudes como la satisfacción o la ansiedad.

Una vez se han identificado los indicadores centrados en la persona, el siguiente reto considerable que se plantea en el paso g} del ciclo de Deming es el seguimiento y la medición de los sistemas de salud, mencionados en el apartado 8.2.4 de la nueva norma EN 15224:2012, para verificar que se cumplan los requisitos de los indicadores del producto (servicio de salud). Sin demostrar que hay una suficiente confianza en la medición y en la trazabilidad metrológica, no se pueden tomar decisiones sobre la importancia de las aparentes diferencias observadas en distintas mediciones. Por lo tanto, del mismo modo que en otras normas ISO-9000 sobre sistemas de gestión de calidad, la nueva norma de calidad del servicio de salud (apartado 7.6 de la norma EN15224:2012) requiere:

7.6 Control de los equipos de seguimiento y medición

La organización deberá determinar el seguimiento y la medición a realizar y los equipos de seguimiento y medición necesarios para demostrar la conformidad del producto (servicio/producto de asistencia sanitaria) con determinados requisitos.

…Cuando sea necesario para garantizar la validez de los resultados, el equipo de medición deberá:

a) calibrarse o verificarse, o ambas cosas, a intervalos especificados o antes de su utilización, frente a patrones de medida trazados a patrones nacionales o internacionales; cuando no existan tales patrones, se registrará la base utilizada para la calibración o la verificación.

2.2. Resultados comunicados por el paciente

En otro enfoque relativamente nuevo sobre la asistencia sanitaria relacionada con la atención centrada en la persona, organismos reguladores como la FDA [2009] han puesto mayor énfasis en los resultados comunicados por el paciente; por ejemplo, cuando se han de evaluar las solicitudes para un nuevo candidato a producto médico. Junto con la opinión profesional, el resultado comunicado por el paciente puede ser cualquier informe de su estado de salud procedente directamente de él, sin que el médico u otro profesional interprete dicha respuesta. Estos resultados pueden medirse basándose en características de calidad específicas, ya sea en términos absolutos (gravedad de un síntoma, signo o estado de la enfermedad) o como variación respecto a una medición previa.

Muchos de estos resultados comunicados por el paciente —tanto en el aseguramiento de la calidad de los servicios de asistencia sanitaria como de los productos médicos—consideran al ser humano como instrumento de medida y como objeto de medida con diversos instrumentos. Se necesitan con urgencia nuevos métodos que garanticen la calidad metrológica de los resultados de medición menos cuantitativos, obtenidos con sistemas de medida basados en el ser humano, no sólo en la atención sanitaria sino también en muchas y distintas áreas de aplicación del factor humano [tabla 1].

3 Metrología con mediciones basadas en el ser humano

3.1 Garantía de calidad metrológica en mediciones basadas en el ser humano

Los dos conceptos clave que definen la metrología —concretamente, la trazabilidad metrológica y la incertidumbre de medida —apenas han sido aún establecidos en la medición basada en el ser humano.

Como señala Fisher [1997, 2009]: “Un enfoque metrológico sobre la medición basada en el ser humano llega en un momento en el que las tendencias en la asistencia sanitaria actual asociada a un cambio desde las economías locales de gestión de crisis de enfermedades a las economías regionales, nacionales e internacionales de gestión preventiva de la salud, basadas en la población, aumentan la necesidad de disponer de medidas coherentes y comparables. A medida que la prevención proactiva desplaza a las respuestas reactivas, es prácticamente inevitable que el crecimiento continuo de la velocidad y alcance de las redes de herramientas informáticas impulse el paso de la medición invariante a nuevos papeles significativos que sirvan de soporte a la responsabilidad y a la comparabilidad de la asistencia sanitaria.”

El principal reto es que hay muy pocos, si es que hay alguno, patrones metrológicos reconocidos que proporcionen trazabilidad en el aseguramiento de la calidad basada en el ser humano; por ejemplo, para que los pacientes puedan recibir el mismo nivel de asistencia sanitaria dondequiera que se la proporcionen. La asistencia sanitaria, por citar sólo una aplicación importante, ha sido descrita como “la industria del billón de dólares anuales que carece de una medida o definición clara de su producto principal” [Heinemann et al. 2006].

Además de una considerable falta de patrones de medida, el segundo concepto importante de la metrología —la incertidumbre de medida— también presenta desafíos particulares en el contexto de las mediciones basadas en el ser humano. La incertidumbre de medida asociada al resultado de un ensayo es fundamental para la evaluación de la conformidad mediante inspección, ya que la incertidumbre puede, si no se tiene en cuenta:

  • conducir a estimaciones incorrectas de las consecuencias del error en lo observado.
  • aumentar el riesgo de tomar decisiones incorrectas tales como rechazar algo conforme o aceptar algo que no lo es, cuando el resultado del ensayo está cerca del límite de tolerancia [JCGM 106, Pendrill 2014].

Sin embargo, sigue siendo común encontrar análisis incorrectos de la puntuación obtenida en cuestionarios y otros instrumentos similares, habitualmente utilizados para medir la respuesta humana, donde la dificultad [Svensson 2001] consiste en que varias de las herramientas estadísticas más comunes no pueden emplearse para caracterizar la ubicación y dispersión de mediciones cualitativas con escalas ordinales [Stevens 1946] típicas de tales mediciones.

Por ello, si se necesita la comparabilidad de las características de un producto (o servicio) o el establecimiento de unos límites sobre los riesgos de decisiones tomadas en base a mediciones basadas en el ser humano, habrá que manejar, respectivamente, la correspondiente trazabilidad metrológica y la incertidumbre de medida de observaciones menos cuantitativas.

3.2 Análisis de sistemas de medida que incluyen el ser humano

Un primer paso esencial en cualquier medición de calidad garantizada consiste en hacer un análisis completo de la situación real de la medición. La aproximación al “Análisis del Sistema de Medición” (MSA en inglés) es ampliamente utilizada en la industria automovilística de todo el mundo [AIAG 2002], por citar un caso. Se basa en un modelo (ilustrado en la figura 1) en el que la información de la medición se transmite desde el objeto de medida, a menudo mediante un instrumento, hasta un operador. Estos son los tres elementos principales del sistema de medida; sin embargo, incluso el método de medición o el entorno elegido para una medición específica puede afectar a los otros elementos del sistema en la determinación de la calidad global de la medición. Podría afirmarse que el establecimiento de un sistema de medida adecuado es, sin duda, la tarea más importante de un metrólogo [Loftus y Giudice 2014].

La caracterización metrológica basada en un análisis del sistema de medida incluye tanto la trazabilidad como la incertidumbre:

  • En principio, cada elemento de un sistema de medida puede calibrarse —no sólo el instrumento, sino también el método, el operador e incluso un objeto específico concebido como patrón metrológico—.
  • La incertidumbre asociada a cualquier resultado de la medición es una indicación de la calidad global de la medición que, a su vez, está determinada por el rendimiento de los distintos elementos del sistema de medida utilizado; ya sea el instrumento, el método, el operador, el entorno, o el propio objeto medido (‘entidad’).

En los sistemas de medida “tradicionales”, en los que la principal intervención humana es la de mero operador, también se valoran algunos otros aspectos humanos, como los conocimientos previos del operador sobre la medición, en un enfoque probabilístico sobre la expresión de la incertidumbre de medida [JCGM GUM]. En el enfoque MSA, se puede evaluar la contribución del operador al rendimiento global del sistema de medida (con ANOVA, por ejemplo) como la denominada ‘Alteración del Evaluador’ [AIAG 2002].

El objetivo primordial de este análisis aparece en el segundo tipo de sistema de medida, en el que el instrumento (figura 1) se sustituye por una persona que desempeña un papel decisivo en el núcleo del sistema de medida. Existen ciertas ligazones entre la caracterización psicométrica del ser humano como instrumento de medida y tres disciplinas principales:

  • Caracterización por la ingeniería clásica de los instrumentos de medida (en cuanto a resolución, sensibilidad, linealidad, sesgo, etc.) [Wilson 2013, Pendrill & Fisher 2013, Mari y Wilson 2014] —véase la sección 4.1—
  • Sistemas de medida, como casos especiales de sistemas de información, que vinculan la pérdida de información en la “transmisión” con la incertidumbre, la entropía y los riesgos de tomar decisiones incorrectas (Klir y Folger [1988], Pendrill [2011]) —véanse las secciones 4.2 y 4.3—
  • Conceptos matemáticos y estadísticos clave, que incluyen la regresión logística [Rasch 1961] y los modelos lineales generalizados —véase la sección 4.4—

En un tercer tipo de sistema de medida —el de la medición del propio ser humano—, el objeto de medición en el sistema de medida (figura 1) es una persona, con toda la complejidad que esto implica. En los casos en los que la caracterización de un ser humano como instrumento de medida es de vital importancia, se utilizarán a su vez instrumentos de medida para obtener información sobre el ser humano. Algunos ejemplos no sólo incluyen la aplicación de sensores en el cuerpo humano [Pendrill et al. 2010], sino también otros “instrumentos” ya probados, como cuestionarios en encuestas de opinión y sondeos, y exámenes en la escuela.

4 Análisis de datos perceptivos

4.1 Datos ordinales

Figura 2. Ejemplo de puntuaciones subjetivas [Linacre 2002]

El rasgo más distintivo de la puntuación subjetiva (por ejemplo, la valoración de un paciente sobre la calidad del servicio de atención sanitaria) es cómo varían las respuestas a lo largo de todo el rango, en una escala Likert de 5 categorías. Las distancias entre las marcas de la escala no siguen necesariamente un modelo matemático exacto o conocido. La gente puede poner mayor o menor énfasis en las diferentes partes de la escala; así, los respondedores “monomodales” tienden a evitar puntuar cualquiera de los extremos de la escala (sobrestimando el grado “1” y subestimando el “5”), mientras que los respondedores “bimodales” evitan puntuar en el rango medio, prefiriendo manifestarse de forma más contundente. Un ejemplo reciente de tal comportamiento aparece en estudios [Erbacher et al. 2012] donde las respuestas de afecto positivo (sentirse “entusiasmado”), tienden a ser monomodales, mientras que la misma persona puede responder bimodalmente a cuestiones de afecto negativo (sentirse “culpable”). Sesgos de este tipo en la puntuación deben ser evaluados y corregidos; de lo contrario, la confianza en las decisiones basadas en este tipo de datos podría verse comprometida. En estas denominadas escalas “ordinales”, en las que se pueden ordenar los valores de medición, pero que carecen de las características aritméticas exactas de las escalas de orden superior, como las de intervalos y proporciones [Stevens 1946], en ningún caso pueden aplicarse las expresiones clásicas de la estadística (p.ej., para el cálculo de una media o una desviación típica) [Svensson 2001].

No sólo son necesarias nuevas herramientas estadísticas, sino que también habría que ampliar el enfoque de la ingeniería tradicional para incluir la caracterización del ser humano como instrumento de medida, representado simbólicamente en la figura 3. Ejemplos de descripciones recientes en esta área incluyen una introducción a la medición de los atributos psicológicos [Sijtsma 2011] y Mari y Wilson [2014]. La última referencia presenta analogías con, por ejemplo, un muelle mecánico que actúa como sensor, al describir un instrumento humano desde el punto de vista de la sensibilidad (C); es decir, la variación en la respuesta (R) debida al cambio en el estímulo (S).

Figura 3. Modelo psicofísico sencillo de la percepción humana (adaptado de [Sun et al. 2012])

4.2 Toma de decisiones y observaciones cualitativas

En el reto de asegurar metrológicamente la calidad de las observaciones menos cuantitativas, existe una conexión íntima [Pendrill 2014] con la toma de decisiones, cuando se relacionan las características de objetos entre sí o respecto a límites de especificaciones (p.ej., un límite superior de especificación, LSE), en casos en los que la incertidumbre de medida puede dar lugar al riesgo de tomar decisiones incorrectas.

Una definición temprana de ensayo cualitativo en química analítica tal como “La clasificación de objetos que cumplen los requisitos acordados, según los criterios especificados” [Hardcastle 1998, Ellison y Fearn 2005], reflejó esta relación con la toma de decisiones. Incluso en casos en los que la evidencia inicial es menos cuantitativa, quizás con una variable descriptiva en la escala ordinal, la correspondiente variable respuesta (resultado de la decisión) puede ser cuantitativa, por ejemplo, la fracción de producto no conforme, como en el tradicional muestreo de aceptación por atributos. Por el contrario, se puede optar por resumir el resultado de una decisión basada en observaciones totalmente cuantitativas desde el punto de vista de respuestas meramente nominales (p.ej., pasa/no pasa) [Pendrill 2011].

Una idea clave es que el instrumento humano no sólo es un sensor, sino que además incluye un algoritmo de toma de decisiones. Es bien sabido que cualquier incertidumbre, um, en una variable descriptiva (estímulo) que proporciona una base para la toma de decisiones (respuesta), conduce a su vez a ciertos riesgos (por ejemplo, riesgo para el “consumidor”, α; riesgo para el proveedor, β) de tomar decisiones incorrectas, tal como se contempla en el reciente documento [JCGM 106] que acompaña a la Guía para la expresión de la incertidumbre de medida (GUM). En este artículo, damos un paso adicional al relacionar los riesgos de decisión con la dispersión en las medidas cualitativas. De hecho, parece existir un “bucle” repetitivo, en el que la incertidumbre de medida en un estímulo (S) conduce a riesgos de clasificación incorrecta en la respuesta (R) — quizás cualitativamente —, la cual a su vez puede verse como dispersión de la medición en un nuevo estímulo, de cara a decisiones posteriores con nuevos riesgos de decisión, y así sucesivamente.

El vínculo mutuo existente entre la toma de decisiones y el tratamiento de observaciones comparativas o meramente cualitativas de propiedades nominales y ordinales, se hace explícito en el marco de la teoría de la probabilidad —véase el apéndice A.1 para más detalle.

Nuestro enfoque en esta descripción de la toma de decisiones, en la medición de magnitudes cualitativas, se centra exclusivamente en la incertidumbre de medida de la variable estímulo (asociada a una información limitada de la medición realizada sobre la entidad u objeto de medida) que conduce a riesgos de decisión en la variable respuesta (relacionada con la salida proporcionada por el instrumento humano). Otros factores que pueden dar lugar a dispersión en la salida del instrumento se pueden considerar al intentar separar los atributos de la persona y del producto, como en el modelo de Rasch [1961] descrito en la sección 5.6.

4.3 Pérdida de información y toma de decisiones. Entropía y modelos lineales generalizados

La “entropía”, como medida del orden existente en un signo o forma percibida de cualquier clase, es una herramienta ideal para la gestión de los datos cualitativos, dentro de la teoría de la información, concretamente en expresiones para la cantidad de información de un mensaje. Se prefiere un enfoque teórico de la información a otras técnicas, como el recuento de fallos en áreas como la secuenciación del ADN (Schneider & Lewis [1999]). Otro ejemplo es la selección de características en aprendizaje de máquinas para la clasificación automática de requisitos funcionales y no funcionales en grandes volúmenes de texto, mediante la inclusión de la entropía semántica [Zhang et al. 2011].

El concepto de ‘incertidumbre’ en la teoría de la información [Klir and Folger 1988], referido a la pérdida de información en la ‘transmisión’ (cuando se toman decisiones, por ejemplo), permite establecer relaciones con los riesgos de decisión tratados anteriormente. Esta formulación es bastante general y permite distintos enfoques como las teorías de la probabilidad, la lógica difusa, la plausibilidad, la evidencia, etc. [Klir and Folger 1988] —véase, para más detalle, el apéndice A.2 sobre un tratamiento basado en la probabilidad.

4.4 Elección perceptiva, regresión logística y modelos lineales generalizados

Por último, la combinación de los enfoques anteriores (riesgos en la toma de decisiones y pérdida de información sobre la entropía teórica) con la formulación de una función psicométrica [Dzhafarov 2011] —véase el apéndice A.3 para más detalle— conduce fácilmente a una expresión de regresión logística (A.6) adecuada para el correcto tratamiento de los datos ordinales como ejemplo de modelo lineal generalizado.

Una observación fundamental es que la pérdida de información sobre la entropía no sólo es incertidumbre de medida sino que a su vez mide los riesgos de tomar decisiones incorrectas.

En este apartado se ha demostrado, relacionando los riesgos de decisión al manipular observaciones cualitativas con la teoría de la información, que la elección perceptiva y los modelos lineales generalizados proporcionan herramientas esenciales para la caracterización del ser humano como instrumento de medida.

5 Confianza, incertidumbre y trazabilidad metrológica en la medición basada en el ser humano

El enfoque de regresión logística en el manejo de resultados de medición basados en el ser humano, incluso los de las escalas ordinales, se está convirtiendo rápidamente en el método de elección en muchas áreas de aplicación, desde los estudios internacionales sobre la educación (como el estudio PISA [OECD 2009]) y las encuestas de satisfacción de clientes, hasta la asistencia sanitaria centrada en la persona.

5.1 Separación entre los valores de los atributos de la persona y del producto en respuestas obtenidas, según el modelo de regresión logística de Rasch

La respuesta de un ser humano cuando se enfrenta a una tarea o característica específica de un producto, dependerá de una combinación entre las características de la persona y las del producto. En metrología tradicional, a menudo se logra una separación del instrumento y del objeto de medida, como cuando se determina la masa de una pesa a partir de la respuesta calibrada de un instrumento de pesaje. Sin esta separación, la dispersión en el atributo del producto se vería enmascarada por la dispersión del instrumento. En la medición basada en el ser humano, podría utilizarse un análisis factorial corriente de la estadística tradicional para separar los dos atributos, persona-objeto, aunque no necesariamente funcionaría con datos ordinales [Wright 1994].

Una particular versión de regresión logística [apartado 4.4] goza de considerable atención como herramienta de manejo de datos, gracias a Rasch [1961], el estadístico danés que, en respuesta al criticismo de los métodos psicométricos de la época, intentó, explícitamente, una separación de las respuestas medidas según la ecuación (A.6) en un valor de atributo de la persona (θ ,como capacidad o tolerancia) y otro de atributo del objeto (β, como nivel de complejidad o calidad, respectivamente), al escribir z = θ – β. En el caso dicotómico más simple, la función de regresión logística es [Rasch 1961]:

             (1)

El enfoque de Rasch únicamente proporciona estimaciones “no afectadas por las capacidades o actitudes de la persona medida en particular, o por las dificultades de los puntos de la encuesta o ensayo particular utilizados para medir”. No es simplemente un enfoque matemático o estadístico, sino un enfoque específicamente metrológico de la medición basada en el ser humano. Cabe remarcar que se puede obtener la misma probabilidad de éxito con una persona capaz de realizar una tarea difícil, que con una persona menos capaz realizando una tarea más fácil. La separación entre los atributos del objeto medido y los de la persona que los mide, nos lleva de la teoría de la medición invariante a la psicometría. La figura 4 lo ejemplifica evaluando la capacidad de un paciente para realizar una serie de tareas en un rango de niveles de dificultad, quizás durante un tratamiento, mientras que la tabla 1 resume el amplio rango de atributos del objeto y de la persona susceptible a este enfoque.

Figura 4. Medición de los efectos del cansancio en las actividades cotidianas durante la quimioterapia. Trabajo presentado en COMET, Chicago [Mallison T. (2001)]

5.2 Tareas elementales del instrumento humano

Al abordar la relativa inmadurez de la formulación de los conceptos metrológicos en contextos de percepción, un primer enfoque útil es analizar algunas de las tareas humanas más elementales, como contar o reconocer formas de nubes de puntos [figura 5], en las que se conoce de manera independiente el valor esperado, dado que el objeto de medición (conjunto de puntos en este caso) ha sido preparado con antelación [Dehaene et al. 2008, Sun et al. 2012, Giordani y Mari, 2012, Pendrill y Fisher 2013, Pendrill 2013]. Una vez dominado el análisis de estas situaciones elementales, se puede hacer frente a las tareas conceptualmente más difíciles que se plantean en los distintos campos de aplicación que consideran la medición basada en el ser humano [Tabla 1].

Figura 5. Conjunto de tareas visuales elementales con valor previamente conocido y con dificultad
creciente: a) recuento de m puntos (adaptado de Dehaene, et al. [2008] y Pendrill y Fisher Jr. [2013]) y
(b) estimación del grado (r) de elipticidad o achatamiento (adaptado de Knoblauch y Maloney [2008] y
Pendrill [2013])

La mayoría de los lectores podrá contar exactamente tres o cinco puntos sin dificultad; sin embargo, contar diez puntos podría presentar problemas si se mira fugazmente la imagen situada más a la derecha de la figura 5 (a). Determinados grupos de personas —niños pequeños, enfermos de demencia, indios Munduruku adultos, estudiados por Dehaene et al. [2008]— pueden tener cada vez más dificultad al contar un mayor número de puntos. Igualmente, incluso la gente formada y con capacidad, tendrá dificultad para distinguir entre elipses de baja correlación (valores de r entre el 50 % y el 10 %) de la figura 5 (b).

Un resultado sorprendente de la investigación de Dehaene et al. [22] es que la familiar dependencia logarítmica de la respuesta humana al nivel del estímulo, observada en sentidos humanos como el del oído, parece ser igualmente aplicable a la capacidad de contar; es decir, la respuesta humana es proporcional a niveles fraccionales de estímulo más que a absolutos. Hay que tener en cuenta que esta dependencia logarítmica, habitualmente conocida como Ley de Weber-Fechner, no está relacionada originalmente con el término logarítmico de la ecuación (A.6), más general, aunque sí puede darse en el caso particular de que la función psicométrica sea inversamente proporcional al cambio fraccional del nivel del estímulo —véase el apéndice A.3—.

La probabilidad de una respuesta correcta, Péxito, en cada caso (conteo correcto o estimación de la elipticidad o grado de achatamiento), depende de las medidas de posición y dispersión de los juicios perceptivos en el rango de valores del estímulo, dadas por los mismos parámetros (resolución y sesgo), que se utilizarían para caracterizar un instrumento de medida (en este caso, el perceptor humano). Se han demostrado tres modos diferentes de caracterizar estas series de observaciones (Pendrill y Fisher Jr. [2013] y Pendrill [2013], respectivamente) para proporcionar estimaciones comparables de Péxito en un rango de valores reales de un estímulo (por ejemplo, desde r = 0 hasta r = 100 %).

i) Un análisis de Rasch (ecuación.1) empleando WINSTEPS®, obtiene por separado estimaciones de la capacidad de la persona θ, (azul) y de la complejidad de la tarea, β, (rojo) [figura 6 como respuesta a la percepción de elipticidad] en una escala común y cuantitativa.

Figura 6. Estimaciones por separado de la capacidad de una persona (azul) y del nivel de
complejidad de la tarea (rojo) como respuesta a la percepción de la elipticidad con un modelo de
Rasch (ecuación 7) en un rango de valores de estímulo reales desde r= 0 hasta r = 100 %
[adaptado de Pendrill 2013]

ii) La capacidad de resolver (distinguir) parejas de estímulos adyacentes, calculadas con las ecuaciones (A.1) y (A.3)

iii) La eficacia de la clasificación, calculada como relación consecuencia/coste de una clasificación incorrecta [Bashkansky et al. 2007, Pendrill and Fisher Jr 2013]

La gráfica de Rasch de la figura 6 establece una escala de medición para el grupo particular de objetos y personas estudiados en el ensayo. Esta gráfica se puede ajustar —tanto su rango como su centro— si se añaden nuevos objetos o personas. Si el estudio parece no contar con suficientes personas sometidas a objetos de una dificultad correspondiente, el análisis de Rasch puede sugerir cómo complementar este estudio. Un ejemplo lo constituye el análisis de Rasch de los exámenes oftalmológicos de pacientes que sufren de cataratas. Los exámenes originales que datan de una época en la que el tratamiento clínico sólo se justificaba por encima de un cierto nivel de pérdida de visión, hoy en día no se consideran complejos. En la actualidad, el tratamiento moderno se puede administrar a niveles considerablemente inferiores de pérdida de visión en los que el tratamiento temprano es considerado factible y beneficioso [Pesudovs 2010].

Ahora volvamos a la búsqueda de maneras de formular conceptos metrológicos para garantizar la calidad de las mediciones basadas en el ser humano.

5.3 Incertidumbre de medida en observaciones basadas en el ser humano

La incertidumbre de medida requería de declaraciones significativas sobre las diferencias aparentes entre valores, tales como las probabilidades relativas o las puntuaciones de calidad de una clasificación correcta entre distintas categorías. Este aspecto de la metrología puede tratarse con el modelo de Rasch que se detalla a continuación.

Para las observaciones dicotómicas de la persona i sobre el ítem k, la puntuación de la respuesta es:

             (2)

donde Pi,k es la probabilidad de éxito Péxito de la ecuación 1. Las distribuciones binominales del error para las puntuaciones dicotómicas se aproximan a distribuciones de Gauss cuando se acumulan todas las observaciones, dado que forman parte del proceso de estimación [Linacre 2010].

Debido a la fiabilidad limitada de la mayoría de las mediciones, el valor β del atributo del objeto medido en la expresión (1) de Rasch, determinado como valor de “consenso” sobre una población de personas ensayadas que actúan como instrumentos de medida, difiere del “valor verdadero”, β’, debido al error de medición ε β siendo β=β+ ε β.

Un indicador de la incertidumbre de medida de los valores θ y β de los atributos estimados por Rasch, es su expresión como error estándar derivado de la información de Fisher en el contexto de la estimación de máxima verosimilitud; por ejemplo, para un objeto en particular j:

En la literatura sobre análisis factoriales tradicionales aún persiste cierta contención acerca de la mejor expresión para la confianza, como el factor α de Cronbach. Por el contrario, en el análisis de Rasch, gracias a la clara separación entre la dispersión en la persona y en el objeto, un coeficiente de confianza aceptado es, simplemente, la fracción de la varianza total de un atributo asociado a la varianza real del ítem, en contraposición a la dispersión de la incertidumbre de medida:

Un valor objetivo típico para este coeficiente de confianza es Rβ= 0,8, que corresponde a una incertidumbre de medición que no supera la mitad de la variación observada en el producto. Se hace necesario este tipo de evaluación de la conformidad metrológica mediante una incertidumbre máxima permitida, con el fin de limitar los riesgos en la toma de decisiones [2014].

5.4 Unidades, referencias y trazabilidad metrológicas

Sin acceso a patrones metrológicos reconocidos, será difícil juzgar objetivamente los niveles relativos de calidad de los productos y servicios valorados por el ser humano en las numerosas aplicaciones que se indican en la tabla 1. Afortunadamente, el enfoque de Rasch [1961], con su separación explícita entre la estimación de los atributos de la persona y del objeto, es especialmente adecuado para introducir la trazabilidad metrológica en la medición basada en el ser humano, como se detalla a continuación.

Dado que la teoría de la medida invariante permite estimar el nivel de dificultad β para una tarea particular, independientemente de quién se esté enfrentando a ella, ello posibilita la identificación de un patrón metrológico para la dificultad de dicha tarea. Una vez acordada la definición y realización de un conjunto de tareas estándar, éste puede utilizarse de forma reproducible como referencia en otras situaciones. Como en la metrología tradicional, esta trazabilidad permite todas las ventajas acordes con la medición objetivamente comparable; así, una serie de elementos —p. ej., clínicas de atención a enfermos de diabetes [Socialstyrelsen 2010]— pueden compararse entre sí en cuanto a la calidad percibida de sus servicios.

El hecho de contar con una serie de patrones psicométricos calibrados para la dificultad de un ítem también permitiría a su vez una calibración de la capacidad θ de cada persona (que actúa como “instrumento de medida”) para gestionar elementos en un rango de dificultad diferente. Este procedimiento determina el correspondiente error de medición εθ en la capacidad de la persona: θ = θ + εθ , en casos en los que el ser humano actúa como instrumento de medida. En principio, dicho instrumento calibrado puede usarse con posterioridad para definir los patrones de un nuevo objeto, y así sucesivamente.

5.5 Magnitudes y unidades en la metrología basada en el ser humano

¿Cuáles son las similitudes y diferencias existentes entre este tipo de patrón psicométrico y los patrones de medida más tradicionales de la física y la ingeniería?

Humphry [2011], al considerar unidades en psicometría y magnitudes frente a valores numéricos, señala que no se puede elevar un número a una potencia que sea un valor de una magnitud dimensional, como ocurre en la expresión de Rasch . En su forma de regresión logística (ecuación 1), la “regla de medida” de la fórmula de Rasch es descrita por Linacre y Wright [1989] en los términos siguientes: “La unidad matemática de medición de Rasch para el logaritmo de las probabilidades, el “logit”, debe definirse antes del experimento.

Un logit es la distancia, a lo largo de la línea de la variable, a la que las probabilidades de observar el suceso especificado en el modelo de medición, se multiplican por un factor 2,781…, el valor de “e”, la base de los logaritmos “naturales” o neperianos utilizados para calcular el logaritmo de las probabilidades. Todos los logits tienen la misma longitud respecto a este cambio en las probabilidades de observar el suceso indicado”.

Si los atributos de las personas, tareas o productos de Rasch son “magnitudes” en lugar de valores meramente numéricos, entonces debería haber “referencias” metrológicas asociadas a ellas, si queremos ser coherentes con la definición de “magnitud” del Vocabulario internacional de metrología, VIM [apartado 1.1, JCGM 200, 2008]. En una nota a la definición, en este contexto, una “referencia” puede ser una“unidad de medida, un procedimiento de medición, un material de referencia o una combinación de ellos”. El acceso a referencias metrológicas para las magnitudes psicométricas permitiría —además de las unidades matemáticas logit— comparar objetivamente las escalas de diferentes “reglas” para una determinada magnitud, p. ej., la capacidad de una persona o la complejidad de una tarea.

Así, las unidades de medida (analizadas por Humphry [2011]) asociadas a los parámetros de los atributos de Rasch,θ y β, deberían estar íntimamente relacionadas con la trazabilidad metrológica y los patrones de medida. Quizás las analogías más cercanas a las referencias en psicometría se encuentran en los materiales de referencia, los cuales desempeñan el papel de referencias para la trazabilidad metrológica en la metrología química. En psicometría, una referencia certificada para la evaluación del conocimiento sería, por ejemplo, un concepto particular para entender la física o la calidad del producto de un determinado servicio de asistencia sanitaria. Al formular ejemplos de referencias de medida en psicometría, lo que se busca es una cierta medida consensuada y normalizada de, por ejemplo, el nivel de complejidad que presenta una determinada tarea u obstáculo.

Una de las siete unidades básicas del sistema internacional —la de intensidad luminosa— está relacionada con la percepción humana. En las unidades de visión del SI, el aspecto humano de la percepción visual de la intensidad luminosa tiene que ver con referencias separadas para “objetos” y para “personas”, respectivamente [folleto del SI]:

  • La definición física objetiva del emisor estándar de un determinado número de vatios en la unidad SI para radiometría, la candela.
  • Dos espectros de acción definidos por la CEI y aprobados por el CIPM: V(λ) para la visión fotópica y V′(λ) para la visión escotópica.

Contando ya con referencias de medición, un proceso de calibración en educación y aprendizaje puede describirse de la siguiente manera: al aplicar el modelo de Rasch, primeramente se establecen y gradúan los parámetros de los distintos ítems, en un proceso llamado calibración —por ejemplo, el profesorado puede evaluar la dificultad de un ítem o elemento en una prueba educativa a partir de la proporción de respuestas correctas históricamente obtenidas en las clases; sin embargo, también puede crear conceptos o atributos, que pueden ser una simple sucesión lineal de segmentos discretos de un continuo, dispuestos en un “mapa”, desde el menor al mayor nivel [Wilson 2011].

Una vez establecidas y aceptadas estas referencias, se constituiría un sistema de calibraciones, para garantizar que cualquier resultado de medición psicométrico pudiese ser trazado a una referencia, donde la trazabilidad metrológica se define como en [VIM apartado 2.41]:

propiedad de un resultado de medida por el cual el resultado puede relacionarse con una referencia mediante una cadena ininterrumpida y documentada de calibraciones, cada una de las cuales contribuye a la incertidumbre de medida.

En el marco de la educación, esta trazabilidad garantizaría imparcialidad a cada nueva clase de estudiantes, pero también (el) que todos los exámenes nacionales e internacionales fuesen comparables.

Fisher [1997] llevó a cabo un estudio inicial de los aspectos metrológicos del análisis de Rasch (figura 7) en el que comparó las estimaciones de la probabilidad de tener éxito, Péxito, de hasta diez instrumentos distintos (encuestas, cuestionarios o exámenes como los bien conocidos instrumentos FIM y PECS) de valoración de la discapacidad física, para una serie de tareas en un rango de niveles de dificultad, —desde el más fácil (comer) en el extremo derecho, hasta el más difícil (subir escaleras) en el extremo izquierdo del eje horizontal. El nivel de concordancia de las distintas estimaciones y la dispersión observada indican la calidad metrológica de los diferentes instrumentos.

Figura 7. Estimaciones de probabilidad de tener éxito, Péxito, en una serie de tareas, en un rango de
niveles de dificultad, para hasta diez instrumentos distintos de valoración de la discapacidad física
[adaptado de Fisher 1997]

5.6 Magnitudes y conceptos en la evaluación de la conformidad y la metrología

estudios comparativos, como los de Pendrill y Fisher Jr. [2013], apoyan la comprensión y aplicabilidad del modelo de Rasch en distintos casos — del mismo modo que en otras áreas científicas hay modelos que se toman como “hipótesis de trabajo” y que son considerados aceptables siempre y cuando la prueba empírica no los rechace. Se debe evitar la eliminación demasiado libre de valores atípicos, existiendo casos específicos en los que no se puede aplicar el modelo de Rasch en su forma más simple. El alcance de la validez del modelo de Rasch en psicometría es objeto de debate: algunas lecturas recomendadas son un artículo de Humphry [2011] así como una serie de comentarios sobre el mismo tema tratado en su artículo que abordan muchas preocupaciones actuales acerca de la disciplina. Como han señalado recientemente [Borsboom y Zand Scholten 2008], parecer haber ciertas similitudes entre el modelo de Rasch y unos modelos aditivos de medición conjunta [Luce y Tukey 1964]. Mientras que algunos afirman que relacionar el modelo de Rasch con la teoría de la medición representable (RMT) sitúa a la medición psicométrica en el mismo plano que la medición más cuantitativa de niveles de intervalos, otros señalan —los llamados ‘representacionistas estrictos’— que las probabilidades no son en sí mismas las entidades empíricas observables a las que se refiere la RMT [Borsboom y Zand Scholten 2008].

La estrecha conexión que existe entre el tratamiento de las observaciones menos cuantitativas y la toma de decisiones [sección 4.2] implica que hay que ir con cuidado al manejar conceptos, definiciones y nomenclatura en la interfaz donde convergen dos disciplinas —la metrología y la evaluación de la conformidad—. Dos conceptos diferentes en principio, pero estrechamente relacionados y fácilmente confundidos, procedentes de las dos disciplinas son, respectivamente:

  • El ‘mensurando’: la magnitud que va a ser medida.
  • Una ‘característica de calidad’: una magnitud que va a ser evaluada.

En una introducción al modelo de medición de Rasch, Mari y Wilson [2014] consideran una serie de factores que podrían conducir a una dispersión en la salida del instrumento trazando analogías entre la respuesta humana a un elemento de la prueba (por ejemplo, la actitud de una persona) y la función de ‘transducción’ del instrumento humano como “muelle booleano”. Ambos afirman que las distribuciones de probabilidad en la respuesta del instrumento podrían reflejar, textualmente: “a) la presencia de una variable subyacente (de “influencia”) no observada; b) una dependencia no determinista de la “indicación en el mesurando” (en este caso, la actitud); o c) que el propio ‘mensurando’ sea estocástico”.

Para aclarar los conceptos y la terminología, consideremos cómo de diferentes son las magnitudes que están en el foco de los tres tipos de sistema de medición ilustrados en la figura 1. A modo de ejemplo, en los estudios elementales de conteo o percepción de la elipticidad, un mensurando inicial es el número o el grado de correlación en las nubes de puntos mostradas en la figura 5. En este caso la persona, que actúa como instrumento de medida, estima el valor de cada mensurando. Sin embargo, lo interesante no es el número de puntos, porque ya lo conocemos, sino cómo de bien se han llevado a cabo esas mediciones. La capacidad de realizar tales mediciones se define a partir de un proceso de toma de decisiones, por ejemplo, ¿el instrumento humano es capaz de resolver la diferencia entre estímulos adyacentes? ¿En la nube, hay 9 o 10 puntos? En este proceso de toma de decisiones, es el observador humano quien realiza la evaluación de la cantidad, por lo que los atributos del objeto —número o elipticidad de las nubes de puntos— se convierten en características de calidad. A través de un análisis de Rasch acerca de la probabilidad de éxito, como los riesgos en la toma de decisiones, el ejercicio proporcionará estimaciones de nuevos mensurandos: a) la capacidad de cada instrumento humano y b) el nivel inherente de complejidad que presenta un determinado objeto. Por último, si en algunas aplicaciones del factor humano la capacidad o el nivel de complejidad es crucial, se impondrán límites de especificación, en cuyo caso estas magnitudes evaluadas se convierten en características de calidad, y así sucesivamente

Conclusiones

Son muchas y diversas las aplicaciones en las que, a pesar del avance de la tecnología, se sigue teniendo en cuenta el factor humano, no sólo como operador pasivo, sino también de dos formas radicalmente diferentes y activas —como objeto de medición o incluso como instrumento de medida—. Esto conduce a una clara necesidad de saber tratar los sistemas de medida en los que interviene el ser humano.

El aseguramiento de la calidad de las mediciones basadas en el ser humano, en las que se basa la garantía de calidad de productos y procesos, está todavía en pañales. Afortunadamente, el método psicométrico de medida invariante de Rasch, presentado aquí en términos de elección perceptiva y entropía de la información, brinda la oportunidad de introducir los conceptos metrológicos de incertidumbre y trazabilidad. Las unidades de medida relacionadas con los materiales de referencia certificados en metrología química parecen ser la analogía más cercana.

Agradecimientos

Deseo dar las gracias por los fructíferos debates a Steve Ellison de LGC, William P Fisher Jr., Berkeley y Antonio Possolo del NIST. Agradezco también la invitación para presentar este artículo en las revistas e-medida y NCSLi Measure. Doy también las gracias a David Torres Irribarra (Berkeley) por la revisión de la traducción al español. Parte de este trabajo se realizó dentro del proyecto EMRP NEW04, que pertenece al Programa Europeo de Investigación en Metrología (EMRP, FP7 Art. 185), financiado conjuntamente por los países participantes en el EMRP dentro de EURAMET (www.euramet.org) y la Unión Europea.

Apéndice A.1 Toma de decisiones y observaciones cualitativas

En el caso más sencillo, en el que se sabe que el estado previo de una entidad bajo observación (el objeto de medida) está en una categoría particular M, , para la variable estímulo (S en la figura 3), la probabilidad qc de clasificar la respuesta (R) en una categoría c, viene dada por la acumulación de probabilidades [Bashkansky et al. 2007]

                                                                         (A.1)

La ecuación (A.1) vincula la variable respuesta (probabilidad de una categorización exitosa, Péxito, en la toma de decisiones) a los riesgos, α, de decisiones erróneas que surgen de la incertidumbre en la medición de la variable descriptiva. Un ejemplo de estado previo conocido es el número de puntos preparados que se muestran en la figura 5 (a).

Estos riesgos en la toma de decisiones, se pueden modelar por ejemplo para dos tipos de percepción humana, tal como se hace en psicofísica [Iverson y Luce 1998]:

  • La identificación implica, en el caso dicotómico, una detección sí-no —¿el estímulo está dentro de la tolerancia o fuera de la región de valores límite permitidos por una especificación? El riesgo de decisión, α, (del “consumidor”) se estima en este caso como función de distribución acumulativa (CDF) más allá del límite de especificación (digamos, LSE) de la variable descriptiva, x, del conjunto inicial de observaciones:

                                                                          (A.2)

[JCGM 106:2012, Pendrill 2014].

  • La elección, en el caso dicotómico, implica la discriminación por pares de estímulos. La capacidad de resolver o distinguir dos estímulos adyacentes, sa y sb —p. ej., contar nueve puntos cuando hay diez — está dada por la superposición de las dos distribuciones, donde el ancho de cada distribución está determinado por la incertidumbre perceptiva w · s de cada observación, donde w es la constante de Weber:

                                                                          (A.3)

Esto puede verse como un caso más general, que se reduce a la expresión (A.2) cuando el ancho de una de las distribuciones del estímulo se reduce a cero [Pendrill y Fisher 2013].

Los valores del “riesgo de decisión” en ambos casos siguen la forma general de una curva de ojiva (de acuerdo con la ecuación (A.6), que recuerda a la ‘característica de funcionamiento’ en todo el rango de valores de la variable descriptiva, pero con formas ligeramente diferentes, dependiendo de los tipos subyacentes de decisión a tomar.

Estas relaciones pueden extenderse al caso politómico, multinominal, si fuese necesario [Pendrill 2014].

Apéndice A.2 Pérdida de información y toma de decisiones. Entropía y modelos lineales generalizados

Los riesgos en la toma de decisiones tratado anteriormente, se pueden relacionar con el concepto de “incertidumbre” en la teoría de la información [Klir y Folger 1988], como pérdida de información en la ‘transmisión’; es decir, a la hora de tomar decisiones, como diferencia entre la cantidad de información en los estados posterior (Q) y anterior (P). Esta diferencia puede medirse, en términos de información teórica, mediante la llamada entropía relativa o divergencia de Kullback-Leibler (KL):

                                                                         (A.4)

como diferencia entre la entropía (H) después de hacer una elección (H (P, Q), llamada ‘equivocación’), y antes de hacerla (H (P)).

En la teoría de la probabilidad, en la que la cantidad de información semántica se expresa como la entropía H de Shannon, la correspondiente divergencia (de información semántica) de Kullback-Leibler (KL) es:


(A.5)

Apéndice A.3 Elección perceptiva, regresión logística y modelos lineales generalizados

Considerando la transmisión de información como una percepción de toma de decisiones en la discriminación por pares de estímulos adyacentes, al igual que sucede con la elección en psicología cognitiva [Iverson y Luce 1998, ec. (2)], la distancia subjetiva D(a,b) entre dos estímulos, a y b > a, viene expresada según Dzhafarov [2011] como la integral en el nivel s del estímulo de una medida (la llamada ‘función psicométrica’), de la capacidad de percibir una diferencia P(s, s+ds) = P[b sea considerado mayor que a]:

Consideremos de nuevo el caso dicotómico más simple, donde el estado anterior se sabe que es M, , como en los estudios elementales de puntos. En ese caso, la distancia subjetiva, identificada con la divergencia KL DKL(P,Q) (A.5) para la decisión basada en la medición, se obtiene tras realizar las sustituciones
y ds = -z , dando:

,

donde la entropía previa, H(P) = 0 (ya que se conoce el estado anterior). Esto lleva a la función de enlace de la regresión logística [Linacre 2006, Pendrill 2014]:

(A.6)

La expresión (A.6) es un ejemplo de función de “enlace”, g, en un modelo lineal generalizado (GLM) empleado para tratar los escenarios de toma de decisiones donde no siempre se puede esperar que la variable respuesta (R) varíe linealmente con la variable descriptiva (S). Hay una extensa familia de funciones de enlace GLM, g, en las que el valor de la esperanza E(R)= μ = g-1(η) = g-1(S · β ) posee un predictor lineal η = S · β que será alguna combinación lineal de parámetros desconocidos, β, (z en A.6), aun cuando la propia respuesta no es lineal.

En el caso especial en que una variación de la función psicométrica sea inversamente proporcional a la variación fraccional del nivel del estímulo; es decir,

, donde la constante de proporcionalidad de Weber, w, es la que aparece en la ecuación (A.3), entonces la distancia subjetiva entre los estímulos a y b es:
, la ley de Weber-Fechner [Dzhafarov 2011].

En resumen, la probabilidad acumulada de una decisión “correcta” está relacionada con la variación de entropía en la transmisión de información, lo que puede interpretarse como el proceso combinado de observación (medición) de una variable descriptiva y una respuesta (toma de decisiones), linealizado mediante regresión logística. Esto abarca, no solo explícitamente, las respuestas no lineales, sino también las respuestas poco conocidas a la variable descriptiva, quizás permitiendo sólo evaluaciones menos cuantitativas, como en una escala ordinal o incluso meramente nominal.

Sending
Puntuación del usuario
4.4 (5 votos)

Necesidades metrológicas para el uso de gases verdes: el proyecto europeo BIOGAS

Previous article

Arturo Aliaga López. Consejero de Industria e Innovación del Gobierno de Aragón

Next article

Comments

Leave a reply

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.