Título: La iteración persona-ordenador

Página 169-201

Resumen

Capítulo 3: Metáforas, estilos y paradigmas

En este capítulo explicaremos la evolución de los sistemas interactivos, escenarios y conceptos que los han caracterizado. Al principio, la interacción hombre-ordenador se basaba en la entrada de texto y visualización de respuestas en pantalla. A medida que las empresas adoptaron esta tecnología, surgieron interacciones con menús y formularios.

Con el auge de los ordenadores personales, la interacción directa a través de interfaces gráficas se volvió común, permitiendo la manipulación visual de objetos en lugar de la entrada de texto. En el futuro, surgirán nuevas formas de interacción como realidad virtual, el uso el lenguaje natural y la migración de la interacción desde las pantallas y teclados hacia entornos de realidad aumentada.

  1. Metáforas

Tradicionalmente, está asociada al uso del lenguaje, ya que es un recurso que permite comunicar conceptos abstractos de manera más accesible utilizando términos familiares y conceptos.

En el diseño de interfaces, desempeñan un papel fundamental para proporcionar un marco conceptual comprensible para los usuarios. No solo mejoran la comprensión de los usuarios, sino que también ayudan a los desarrolladores a crear programas más eficientes para ser utilizados por comunidades de distintos usuarios.

  • Metáforas verbales

En este caso, son elementos fundamentales para el lenguaje y el pensamiento, las cuales están presentes en conversaciones cotidianas y no únicamente limitadas a la poesía como tradicionalmente pensamos. Se utilizan para comunicar conceptos abstractos de manera accesible y familiar.

Como nos enfrentamos a nuevas herramientas tecnológicas como los ordenadores hay que compararlas con algo conocido, estableciendo enlaces metafóricos que forman la base del modelo mental del usuario. Estas comparaciones permiten una comprensión más rápida de la nueva forma de transferir conocimientos de un dominio familiar, aunque existan diferencias como una máquina de escribir y un procesador de texto.

Estas pueden ser una herramienta útil para facilitar el aprendizaje de nuevos sistemas por parte de los usuarios.

  • Metáforas visuales

La empresa Xerox fue la pionera en la comprensión del diseño de interfaces que simulen el entorno físico familiar en lugar de únicamente depender de interfaces verbales. En este caso, desarrollaron la interfaz visual para el sistema Star, la cual está basada en la metáfora de una oficina física, representando los objetos electrónicos como archivadores, carpetas y papel. Por lo que el escritorio se convirtió en una metáfora de la organización global, reflejando una mesa de oficina. Por lo que fue adoptada por Apple en los ordenadores Lisa y Macintosh, extendiéndose luego a sistemas como Windows, Presentation Manager para OS/2 y estaciones de trabajo UNIX con interfaces basadas en X-Windows.

Estas son representaciones pictóricas que permiten al usuario reconocer y comprender la funcionalidad de un sistema. Pueden varias desde pequeñas imágenes en botones hasta pantallas completas en programas.

En este caso, la intuición juega un papel fundamental para la comprensión de metáforas, ya que los usuarios las conectan mentalmente con procesos que ya han sido aprendidos.

Sin embargo, no siempre garantizan la comprensión y dependen de las asociaciones percibidas de manera similar por el diseñador y los usuarios. También, influyen las diferencias culturales que pueden llevar a malentendidos como por ejemplo el uso del buzón de correo que puede que no sea comprensible en todas las culturas.

Metáfora del mundo real

Las personas organizamos la información de manera espacial. Un ejemplo, es cuando recibimos una llamada en el despacho y, mientras hablamos, escribimos el número en un papel y lo colocamos en un lugar específico. Luego, cuando lo necesitamos, recordamos donde lo hemos colocado. Esto demuestra cómo tenemos un mapa espacial en nuestra mente para registrar información en lo que llamamos nuestro mundo.

Metáfora global

Este tipo de metáforas son fundamentales porque proporcionan el marco para todas las demás metáforas de un sistema. Un ejemplo es el escritorio.

  • Metáfora del escritorio

Fue la primera metáfora global y se utiliza en todas las interfaces gráficas. Se diseñó para simular el entorno de una oficina, pero posteriormente se adaptó al concepto de los oficinistas.

En este caso, consiste en crear objetos electrónicos que simulan a los objetos de una oficina como: archivadores, bandejas, carpetas, papel, etc. La pantalla representa la organización global del escritorio de una mesa de oficina, transformando ficheros y carpetas en representaciones pictóricas en lugar de entidades abstractas con nombres arbitrarios.

El funcionamiento de estas metáforas, las carpetas en el mundo virtual so una réplica de las reales, es decir, hay que abrirlas para acceder a documentos, organizarlas jerárquicamente, moverlas a distintas ubicaciones, etc. Aunque algunas propiedades están ausente como el peso y el sonido y otras propiedades “mágicas” como duplicar documentos en varias carpeta de forma simultánea o reproducir conjuntos de carpetas automáticamente.

Esta metáfora es predominante en ordenadores y estaciones de trabajo.

La historia

En los años ’70, en el laboratorio Xerox Park en California, un grupo de investigadores trabajó en el ordenador Xerox Star, que resultó ser caro, complejo y lento, resultando en un fracaso comercial. Tras este fracaso, muchos investigadoresemigraron a empresas como Apple y Microsoft. Aplicaron los conceptos del Xerox Star al ordenador Lisa, que, aunque mejoraba, seguía siendo costoso y lento. Finalmente, en 1984, se lanzó el Macintosh, logrando un éxito excepcional gracias a su facilidad de uso.

Posteriormente, estos conceptos fueron aplicados a los ordenadores personales, como Windows para MSDOS y Presentation Manager para OS/2. También se implementaron en estaciones de trabajo UNIX con sistemas como X-Windows, que utilizan diferentes sistemas de ventanas como Motif o OpenLook.

Opiniones críticas

Consideremos la metáfora de la sobremesa intenta simplificar operaciones de ficheros comunes presentándoles en el lenguaje familiar del mundo basado en papel (documentos de papel como ficheros, carpetas como subdirectorios, papelera para borrar). Aunque la metáfora ha tenido éxito hasta cierto punto (se le tiene que explicar a un nuevo usuario que la sobremesa del ordenador es como una sobremesa real), el modelo basado en papel es una base pobre para organizar información.
Metáforas compuestas

La metáfora de sobremesa se ha fusionado con otras metáforas para facilitar la realización de diversas tareas en el ordenador. Un ejemplo bastante claro es el uso de la barra de desplazamiento.

Desde una perspectiva cognitiva, surge el problema de cómo interpretar las metáforas compuestas. Se ha podido observar que los usuarios desarrollan múltiples modelos mentales de la interfaz, destacando la complejidad y diversidad de las metáforas utilizadas en sistemas informáticos.

  • Metodología de creación de metáforas

Son un aspecto fundamental para el diseño de un sistema interactivo con interfaz visual y tiene que formar parte del diseño, teniendo una relación con el diseño global.

Definición fundamental

Se basa en la recogida de requisitos para poder disponer de los primeros datos y así establecer las primeras metáforas o análisis de tareas para precisar las funciones del sistema.

Identificación de los problemas del usuario

Se hace un estudio de los usuarios para ver en qué tienen problemas y que aspectos de la funcionalidad están implicados. La mejor manera es ver a los usuarios utilizando funcionalidades parecidas y qué problemas tienen. Para eso se le explica qué tienen que hacer y ver si lo están entendiendo, enseñarles el prototipo y observar como lo utilizan.

Generación de la metáfora

Una manera de empezar es hacer un examen de como seria esa tarea en la realidad. Una vez identificados los problemas y las herramientas que se utilizan, ver qué característica les resulta difícil de comprender; siendo estas las candidatas para la creación de metáforas.

Evaluación de la metáfora

Una vez generada la metáfora es el momento de evaluar cual escoger para expresar la nueva funcionalidad. A continuación, explicamos cinco puntos clave a la hora de evaluar la utilidad de la metáfora:

  • Volumen de la estructura: cuanta estructura nos proporciona, ya que una con poca estructura no es muy útil.
  • Aplicabilidad de la estructura: qué parte de la estructura es relevante para el problema. Lo que es importante es lo que no es relevante ya que puede llevar al usuario en dirección incorrecta y caer en falsas expectativas.
  • Representatividad: debe tener representación visual, auditiva y palabras asociadas.
  • Adaptabilidad de la audiencia: los usuarios deben entender la metáfora, porque aunque cumpla los otros requisitos y no lo entiende no nos sirve.
  • Extensibilidad: puede tener otras partes de estructura que puede ser útil para más adelante

Otra versión

Para establecer una metáfora debemos seguir los siguientes pasos:

  • Identificar el tipo de comparación: se debe encontrar la relación entre la información familiar y la nueva
  • Grado de ajuste: estudiar el grado de coincidencia y de diferencias que existen.

El problema surge cuando no existe una relación completa entre la tarea conocida y la nueva.

  • Lenguaje visual para el diseño de metáforas

Pueden conseguir su efectividad a través de la asociación con organizaciones, ya que se pueden asociar estructuras, clases, objetos, atributos a nombres o operaciones, procesos, algoritmos a verbos, etc.

Objetos familiares

Algunas familias de objetos más familiares son:

  • Escritorio: dibujos, ficheros, carpetas, papeles, clips, notas de papel.
  • Documentos: libros, capítulos, marcadores, figuras; periódicos, secciones;

revistas, artículos; cartas; formularios.

  • Fotografía: álbumes, fotos, portafotos.
  • Televisión: programas, canales, redes, anuncios comerciales, guías.
  • Disco compacto, cassette, grabaciones, pistas, jukeboxes.
  • Pila de cartas: cartas, pilas.
  • Juegos: reglas del juego, piezas del juego, tablero de juego.
  • Películas: rollos, bandejas de transparencias, presentaciones, rollos, películas, teatros.
  • Contenedores: estanterías, cajas, compartimentos.
  • Árboles: raíces, tronco, ramas, hojas.
  • Red, diagrama, mapa: nodos, enlaces, hitos, regiones, etiquetas, bases

(fondos), leyenda.

  • Ciudades: regiones, hitos, caminos, casas, habitaciones, ventanas, mesas.

Verbos

Los ejemplos típicos de conceptos de acción y relación con objetos son:

  • Mover: navegar, conducir, volar
  • Localizar: apuntar, tocar, enmarcar elemento(s)
  • Seleccionar: tocar elemento, gravar elemento, poner dedo en elemento y

moverlo.

  • Crear: añadir, copiar
  • Borrar: tirar, destruir, perder, reciclar, borrar
  • Evaluar: Mover botón, desplazar puntero, rodar, girar
  • Vaciar, flujo: agua, electricidad
  • Ejemplos de metáforas
  • Cortar: nos representa su funcionalidad de cortar papeles, etc. Aportando la idea de cortar un trozo de documentos, parte de un dibujo, etc.
  • Papelera: es una herramienta muy habitual, sirve para poner todos los papeles o elementos que no sirven para tirarlo como basura. Haciendo uso del símbolo de reciclaje.
  • Pintar: es una herramienta común y de fácil comprensión. En este caso, se utiliza un bote de pintura para hacer comprender al usuario que lo que hace es llenar de color el interior de un objeto.
  • Portapapeles: es un componente del sistema operativo que nos permite pasar información entre distintas aplicaciones. Es muy fácil de intuir, pero en sí la metáfora es muy simple. En este caso, esta metáfora presenta problemas de cobertura.
  • Correo: es un elemento habitual, y sirve para enviar información a un destinatario. Se utiliza para el correo electrónico.
  • ¿Qué es la interacción?

Interacciones

Son los intercambios que suceden entre la persona y el ordenador.

Interacción multimodal

La mayoría de los sistemas actuales se comunican a través de un teclado, una pantalla y habitualmente un ratón. Estos dispositivos representan canales de comunicación del sistema que corresponden a diferentes canales humanos.

La interacción es multimodal cuando se utilizan varios canales de comunicación de forma simultánea. Un ejemplo, son los sistemas contemporáneos que tienden a incorporar múltiples canales de entrada/salida, así se reconoce que los seres humanos procesan información simultáneamente a través de varios canales.

  • Estilos de Interacción

¿Qué es un estilo de interacción?

Es un término para agrupar las diferentes formas en los que los usuarios pueden comunicarse o interaccionar con el ordenador. Los estilos más predominantes son:

  • Interfaz por línea de órdenes: fue el primer estilo de interacción de uso general y sigue siendo bastante usado. Permite dar instrucciones directas al ordenador a través de teclas de función, caracteres, abreviaciones cortas o palabras.

La ventaja de usar un único carácter o tecla es la ejecución rápida, pero la principal desventaja es la dificultad de recordar, ya que para facilitar la memorización es fundamental nombrar adecuadamente las órdenes.

Este estilo es predominante para usuarios expertos pero no para novatos. La falta de indicación visual de las órdenes dificulta el aprendiza, pudiendo evitarse con órdenes más coherentes, aunque los estándares iniciales son más crípticos y varían entre sistemas. Las más conocidas son:

  • Shell de Unix
  • MSDOS
  • Menús y navegación: un menú es un conjunto de opciones en pantallas que los usuarios pueden seleccionar, ejecutando una orden subyacente y provocando cambio en el estado de la interfaz. A diferencia de la anterior, los usuarios no necesitan recordar palabras o sintaxis, siempre y cuando los menús de textos sean significativos, aunque no siempre es así. Su estructura se organiza jerárquicamente, y las guías de estilo proporcionan pautas para su diseño básico, por lo que se considera un número ideal de opciones de menú entre 3 y 8.

Pueden ocupar mucho espacio, por lo que la solución principal son los menús desplegables que aparecen cuando un texto define opciones que se despliegan al interactuar o pop-up, aparecen tras una acción y se mantienen hasta la selección de una opción o desactivación.

Esta selección puede hacerse con el ratón o con la combinación de teclas.

  • Manipulación directa: la interfaz por línea de órdenes se originó a partir de los teletipos, mientras que la navegación por menú tuvo sus inicios en las pantallas de texto. Con el desarrollo de pantallas gráficas de alta resolución y dispositivos como el ratón, se crearon entornos de manipulación directa, los cuales ofrecen una representación visual de las acciones y objetos de interés. Estas ideas se aplicaron inicialmente en la computadora Xerox Star y después en el Apple Macintosh, que fue el primer ordenador con éxito comercial.

La manipulación directa describe los sistemas con las siguientes características:

  • Representación continua de los objetos y de las acciones de interés.
    • Cambio de la sintaxis de comandos compleja por la manipulación de objetos y acciones.
    • Acciones rápidas, incrementales y reversibles que provocan efecto visible inmediatamente en el objeto seleccionado.

Ben Schneiderman,destaca varias ventajas en estos sistemas como:

  • Facilidad de aprendizaje para nuevos usuarios
    • Capacidad de memorización para usuarios intermitentes
    • Reducción de mensajes de error.
    • Inmediatez en la retroalimentación de las acciones y de la generación de confianza en los usuarios debido a la comprensibilidad y reversibilidad de las acciones

Presenta también desafíos, ya que no todas las tareas pueden describirse mediante objetos concretos, y no todas las acciones pueden realizarse directamente.

Interfaz WIMP

Es el entorno más común. Esto quiere decir:

  • Ventanas (Windows): son áreas de pantalla que funcionan como terminales independientes, permitiendo la visualización simulatánea de tareas separadas. Los usuarios pueden dirigir su atención a diferentes ventanas, y si se superponen y una se oculta luego se puede volver a recupera seleccionándola.
    • Iconos (Icons): pueden cerrarse y perderse o reducirse a un icono, permitiendo tener múltiples ventanas en la pantalla. Los iconos ahorran espacio y sirven como recordatorio para que el usuario puede reanudar el dialogo restaurando la ventana a su tamaño original. Se pueden utilizar en otros aspectos del sistema, aunque pueden variar pero es fundamental para su representación.
    • Menús (Menus): ofrecen una lista de operaciones o servicios para seleccionar. En estos los nombres debe ser significativos e informativos para indicar las intenciones. La selección de una opción se realiza moviendo el puntero sobre el ítem deseado, lo cual suele provocar un cambio de color o inversión de vídeo para indicar que es la opción potencial a seleccionar. La acción final de selección generalmente requiere otro paso, como hacer clic en un botón del ratón.

Además, los menús suelen contar con aceleradores de teclado, que son combinaciones de teclas con el mismo efecto que seleccionar la opción en el menú. Esta característica permite a usuarios expertos trabajar de manera más rápida al evitar el uso exclusivo del ratón para seleccionar las opciones.

  • Punteros (Pointers): es un componente fundamental, ya que a manipulación directa se basa en apuntar y seleccionar objetos. Algunos de los dispositivos usados son: ratón, joystick y trackball, ya que el usuario visualiza un cursos que puede controlar con los dispositivos mencionados, facilitando la interacción y selección de elementos de la interfaz gráfica.
  • Interacción asistida: sabemos que los ordenadores se utilizan en una amplia variedad de actividades diarias. A medida que el uso del ordenador se vuelve más común en la vida diaria, un número creciente de nuevos usuarios se suma a esta tecnología, y se espera que este número continúe aumentando. Sin embargo, la forma en que las personas interactúan con las computadoras no siempre responde a estas crecientes necesidades.

El estilo de interacción predominante, la manipulación directa, requiere que el usuario especifique todas las tareas y controle todos los eventos, lo cual puede resultar desafiante para nuevos usuarios. Como respuesta está emergiendo un nuevo estilo de interacción denominado “interacción asistida”. Este enfoque utiliza la metáfora del asistente personal o agente que colabora con el usuario en el mismo entorno de trabajo. En lugar de dirigir la interacción de manera directa, el usuario trabaja en un entorno cooperativo donde se comunica, controla eventos y realiza tareas con agentes o asistentes.

Tiene el potencial de reducir el esfuerzo necesario para llevar a cabo tareas. A diferencia de la manipulación directa, donde se deben seleccionar objetos y acciones de manera explícita, la interacción asistida permite provocar cambios en los objetos sin que cada uno corresponda a una acción específica del usuario.

Agentes de la interfaz

Un agente, según Henry Lieberman, es un programa que el usuario percibe como un asistente o programa de ayuda, en lugar de considerarlo una herramienta en términos de interfaz de manipulación directa. Los agentes deben exhibir ciertas características asociadas con la inteligencia humana, como capacidad de aprendizaje, inferencia, adaptabilidad, independencia y creatividad.

Pattie Maes describe que el usuario delega tareas a un agente en lugar de simplemente darle órdenes directas para realizar una tarea.

En contraste con las interfaces de manipulación directa, donde los cambios de estado en la pantalla son explícitos y uno a uno con las acciones del usuario, un agente de la interfaz tiene la capacidad de afectar los objetos en la interfaz sin instrucciones explícitas del usuario. Los agentes pueden observar varias interacciones del usuario antes de tomar una acción, o incluso lanzar una serie de acciones basadas en una sola interacción.

Las características distintivas de los agentes incluyen:

  •  Autonomía: trabajan en segundo plano sin requerir instrucciones explícitas
    • Inteligencia: actúan por iniciativa propia y se adaptan a diferentes situaciones
    • Uso personal: se adaptan y aprenden del usuario.

Los agentes son más discretos que los asistentes, operan en segundo plano y toman iniciativa propia cuando encuentran información relevante para el usuario.

La autonomía de los agentes implica que trabajan en segundo plano sin ser solicitados explícitamente y pueden observar al usuario y las fuentes de información accesibles. Su inteligencia radica en su capacidad para actuar por iniciativa propia y adaptarse a entornos heterogéneos. Además, los agentes se adaptan y aprenden del usuario, respetando las decisiones del usuario y tomando decisiones en situaciones que pueden no ser cómodas para el usuario.

Implementar agentes es una tarea desafiante y puede realizarse utilizando tecnologías orientadas a objetos o técnicas basadas en conocimientos y aprendizaje. Los agentes son esenciales para aprovechar eficazmente el conocimiento de las fuentes de información en entornos complejos de sistemas de información. Son fundamentales para liberar a los usuarios de tareas rutinarias y mejorar la usabilidad de los ordenadores, especialmente para aquellos que no están motivados por la tecnología. La multitarea es una característica común tanto de asistentes como de agentes, ya que suelen trabajar en segundo plano o de manera concurrente.

Integración de agentes con otras aplicaciones

Se explora cómo utilizar mecanismos de comunicación entre aplicaciones para implementar agentes independientes de aplicaciones. El enfoque se centra en agentes capaces de aprender observando las acciones del usuario en la interfaz y generando procedimientos generalizados para automatizar tareas.

En términos de propiedades que deben tener las aplicaciones para interactuar con agentes, se describen las siguientes:

  • Escriptable: si proporciona un medio, ya sea a través de un lenguaje de script o mediante un API, que permite a un agente externo llamar las órdenes de la aplicación. Facilita la interacción entre el agente y la aplicación, permitiendo que el agente emita comandos a la aplicación según sea necesario.
  • Recordable: si puede informar a un agente externo sobre las funciones que el usuario puede realizar, ya sea a través de menús, iconos o combinaciones de teclas. Permite al agente conocer las acciones disponibles para el usuario, lo que es fundamental para su capacidad de aprendizaje.
  • Examinable: si permite la revisión periódica de las estructuras de datos de la aplicación. Implica la capacidad de un agente para analizar las estructuras de datos de la aplicación en intervalos regulares y deducir las acciones que se están llevando a cabo en la interfaz de usuario al compararlas con otros estados de las estructuras de datos.

Es importante destacar que, aunque estos mecanismos de comunicación ofrecen una forma de cooperación entre agentes y aplicaciones, todavía hay margen para mejorar y lograr una cooperación más completa entre ambas entidades.

Aspectos a considerar en la integración agente-aplicación

Es fundamental la granularidad del protocolo de eventos, lo que implica definir el conjunto de eventos que la aplicación debe transmitir al agente y que este acepte. La elección precisa de estos eventos es esencial para asegurar la comunicación efectiva.

Otro aspecto importante es la capacidad del agente de compartir o modificar la interfaz, implicando la necesidad de definir hasta qué p unto el agente puede interactuar y influir en la interfaz de la aplicación. La capacidad de compartir o modificar la interfaz puede tener implicaciones significativas en la colaboración eficiente entre la aplicación y el agente, así como en la experiencia general del usuario.

Ejemplo: El agente Microsoft

La tecnología ActiveX® para agentes interactivos se manifiesta a través de Microsoft Agent, que introduce una forma novedosa de interacción denominada “interfaces conversacionales” que incorpora aspectos de la comunicación social. Además de admitir la entrada estándar mediante teclado y ratón, esta tecnología ofrece un soporte opcional para el reconocimiento de voz, permitiendo que las aplicaciones respondan a comandos verbales.

Los agentes generados tienen la capacidad de responder utilizando distintas modalidades, incluyendo voz sintetizada, grabada o texto. Esta versatilidad proporciona una experiencia de usuario interactiva y rica, permitiendo la comunicación de manera más natural y adaptada a las preferencias individuales del usuario.

Asistentes

Los asistentes son entidades computacionales diseñadas para ayudarnos en el uso de aplicaciones, los cuales proporcionan orientación de una manera sencilla, permitiendo a los usuarios comprender fácilmente qué acciones deben realizar. Son capaces de interpretar tanto palabras escritas como habladas, así como acciones gráficas, ejecutando acciones complejas o comandos cortos.

Una característica clave es su alta flexibilidad en la recepción de instrucciones. En comparación con menús y macros, los asistentes son a menudo más flexibles, ya que los usuarios solo necesitan expresar verbalmente lo que desean hacer. Estos requieren una cantidad significativa de información durante las interacciones gráficas del usuario, lo que sugiere la necesidad de capacidad de aprendizaje para adaptarse al usuario con el tiempo.

La activación de un asistente se realiza seleccionando órdenes y activando un botón de asistencia o realizando una acción gráfica sobre él. Los asistentes son comunes en las aplicaciones actuales, y en ocasiones, una sola aplicación puede tener más de un asistente para brindar una variedad de funciones de apoyo

Ejemplo de asistentes

La herramienta proporciona la capacidad de convertir una presentación de PowerPoint a un formato basado en la web a través de una serie de tareas. Ofrece una variedad de formatos predefinidos entre los cuales se puede seleccionar. Después de elegir el formato deseado, la herramienta guarda toda la información resultante en un directorio previamente seleccionado. Como podemos ver en la siguiente captura:

Ventajas y desventajas:

Las ventajas que proporcionan son las siguientes:

  • Flexibilidad
  • Permite la iniciativa del usuario
  • Es atractivo para usuarios expertos
  • Potencialmente rápido para tareas complejas
  • Capacidad para hacer marcos

Las desventajas que proporcionan son las siguientes:

  • Requieren la memorización y entrenamiento importante
  • Difícil de memorizar
  • Gestión de errores pobres

Ordenadores emocionales

Según los avances científicos, las emociones juegan un papel fundamental en los procesos como en la toma de decisiones, formación de opiniones y aprendizaje, etc.

Rosalind Picard argumenta que para lograr que los ordenadores sean inteligentes y puedan interactuar de manera natural con los humanos, es necesario que las máquinas tengan la capacidad de reconocer, comprender, experimentar y expresar emociones.

  1. Paradigmas

¿Qué es un paradigma?

Significa ejemplo o modelo. En el contexto de los paradigmas de interacción, se refiere a ejemplos o modelos que sirven como base para todos los sistemas de interacción. Estos son abstracciones que agrupan todos los posibles modelos de interacción según características similares.       

Los paradigmas interactivos actuales incluyen:

  • Ordenador de sobremesa: es el paradigma dominante, la interacción se lleva a cabo de manera aislada del entorno. Los usuarios interactúan principalmente sentados con un ordenador de sobremesa utilizando manipulación directa, como teclado y ratón.
  • Entornos virtuales y realidad virtual: los términos “entorno virtual” y “realidad virtual” abarcan una amplia gama de estilos de interacción, que van desde interfaces en tres dimensiones con las que se puede interactuar y actualizar en tiempo real, hasta sistemas en los que el nivel de autonomía, interacción y sensación de presencia es prácticamente igual al del mundo real.

Para considerar un sistema como de realidad virtual, deben cumplirse ciertas condiciones:

  • Sensación de presencia física directa: El usuario experimenta una sensación de presencia física o experiencia directa a través de indicaciones sensoriales creadas por la tecnología. Estas indicaciones pueden ser visuales, auditivas o hápticas, o combinaciones de las tres.
  • Indicaciones sensoriales en tres dimensiones: la información, normalmente visual, se presenta en tres dimensiones, lo que contribuye a la inmersión del usuario en un entorno tridimensional.
  • Interacción natural: los sistemas de realidad virtual permiten la manipulación de objetos virtuales de manera similar a la manipulación de objetos reales.

Una forma común de interacción virtual implica el uso de cascos ya que proporciona visualización tridimensional y posicionamiento mediante los 6 grados de libertad y ratones 3D simula una mano virtual que se puede mover para realizar operaciones de selección y acciones, como abrir puertas o agarrar objetos.

El uso de dispositivos como datagloves amplía estas acciones al agregar la capacidad de realizar acciones con las posiciones de los dedos. Además, el uso de dispositivos hápticos permite a los usuarios experimentar fuerza sobre los objetos, lo que aumenta las posibilidades de interacción y realismo en el entorno virtual.

La cueva (CAVE)

La “cueva” es un espacio tridimensional de 3x3x3 metros delimitado por tres paredes (una frontal y dos laterales), todas ellas funcionando como pantallas de proyección. Las paredes utilizan retroproyección, y el suelo utiliza proyección frontal desde el techo. Las imágenes proyectadas son en tres dimensiones, y se requieren gafas de cristal líquido para percibir un efecto de estereoscopia.

El usuario tiene la capacidad de moverse dentro de este espacio y visualizar las imágenes proyectadas en las paredes y el suelo. Para lograr esto, se utiliza un sensor de posición y orientación que permite al ordenador conocer la ubicación del usuario. De esta manera, el ordenador puede generar imágenes con la perspectiva correcta para cada plano de proyección, logrando una percepción estereoscópica efectiva.

La interacción del usuario con el entorno se realiza mediante un dispositivo tipo joystick aéreo llamado “wand”, que cuenta con una serie de botones y un sensor de posición y orientación. Además, el espacio está equipado con un sistema que genera sonido cuadrafónico. Un aspecto destacado de la “cueva” es su capacidad para admitir múltiples usuarios, hasta cinco personas con gafas, que pueden moverse y experimentar dentro de este espacio al mismo tiempo. Un usuario lidera la interacción utilizando el “wand”.

Los beneficios y problemas son:

  • Simulaciones imposibles en otro estilo
    • Alto coste
    • Cansancio del usuario

Algunos ejemplos de uso de la realidad virtual son:

  • Entrenamiento de operarios de una central nuclear
    • Entrenamiento de bomberos
    • Reconstrucciones virtuales de patrimonio histórico
  • Computación ubicua: lo propuso Mark Weiser, del Xerox PARC en 1991. Este enfoque busca extender la capacidad computacional al entorno del usuario, permitiendo que la información esté presente en todas partes a través de pequeños dispositivos diversos conectados en red a servidores de información. Busca integrar la tecnología de manera transparente en el entorno cotidiano, disolviendo la presencia del ordenador en un único punto y delegándolo a un segundo plano.

En este paradigma, ya no se trata de tener estaciones de trabajo y pantallas únicas para interactuar, sino de disponer de visualizaciones distribuidas por todas partes que facilitan interacciones sencilla.

Implica la presencia constante de la tecnología en el mundo real para mejorarlo, a diferencia de la realidad virtual, que crea un mundo virtual separado.

Donald Norman argumenta que el ordenador personal es una tecnología frustrante y propone que debería ser visto como una infraestructura, silencioso, invisible y no obstructivo. Weiser, por otro lado, aboga por la omnipresencia de la computación, integrada de manera coherente en el entorno y accesible a través de diversos dispositivos.

A medida que la tecnología ha avanzado, la visión de Weiser se ha convertido en una realidad tecnológica, con la presencia de una variedad de dispositivos. Sin embargo, el cambio de paradigma de la sobremesa a la computación ubicua requiere más que simples adaptaciones de software y hardware; implica la creación de un entorno coherente que integre la interacción y permita la interoperabilidad de múltiples dispositivos en diferentes lugares y para múltiples usuarios.

  • Realidad aumentada (RA): es un paradigma de interacción que busca reducir las interacciones con el ordenador al utilizar información del entorno como una entrada implícita. El usuario puede interactuar con el mundo real, que se ve aumentado por la información sintética proporcionada por el ordenador. Este enfoque integra los dos mundos, real y computacional, reduciendo significativamente el costo interactivo. La situación del usuario se reconoce automáticamente mediante diversos métodos de reconocimiento.

Asiste y mejora la interacción entre los humanos y el mundo real, permitiendo la integración del uso del ordenador en las actividades cotidianas. Por lo que los objetos de la vida diaria se convierten en elementos interactivos, facilitando el acceso para usuarios diversos y no especializados.

A diferencia de otros paradigmas, permite al usuario mantener el contacto con su entorno de trabajo, centrándose en el mundo real aumentado en lugar de sumergirse en un mundo virtual. Se emplean métodos de reconocimiento, como el tiempo, la posición o la identificación de objetos mediante visión por computadora, y se pueden utilizar códigos de barras para hacer que el mundo real sea más comprensible para el ordenador.

El papel del ordenador es el de asistir y mejorar las relaciones e interacciones entre las personas y el mundo real. Este paradigma tiene aplicaciones potenciales en diversos sectores como medicina, arquitectura, diseño interior, construcción, ingeniería civil, etc. Se distingue de la computación ubicua en que utiliza la realidad misma para la interacción, sin la necesidad de adoptar nuevos procedimientos de trabajo, manteniendo métodos tradicionales que son familiares para los usuarios.

  • Principio del formulario

Corrientes existentes

Se distinguen dos corrientes fundamentales que representan enfoques distintos dentro de este nuevo paradigma:

  • Aplicación de Realidad Virtual en el Mundo Real: implica el uso de una nueva tecnología que mejora la percepción del usuario del mundo real mediante la superposición de información adicional sintetizada a través de un modelo computarizado.

Se suelen utilizar gafas especializadas para superponer información virtual sobre objetos y tareas en el entorno real.

Los usuarios pueden trabajar y examinar objetos tridimensionales reales mientras reciben datos complementarios sobre estos objetos o sobre la tarea que están llevando a cabo.

  • Dispositivos que Aumentan la Realidad y Interactúan Directamente: en este caso, los usuarios interactúan directamente con el mundo real, que está enriquecido con información sintetizada por el ordenador.

A diferencia del primer enfoque, no se trata de superponer información virtual sobre la realidad, sino de permitir la participación activa de objetos cotidianos, como bolígrafos o blocs de notas, que interactúan automáticamente con el sistema sin necesidad de acciones específicas por parte del usuario.

Este enfoque minimiza la necesidad de que el usuario se adapte a un nuevo entorno de trabajo, ya que se integra de manera natural con objetos y herramientas familiares.

Ambos enfoques buscan mejorar la interacción entre el usuario y el entorno, ya sea proporcionando información adicional sobre objetos y tareas en el mundo real o permitiendo la interacción fluida con objetos cotidianos enriquecidos con información computarizada.

Líneas de trabajo

  • Superficies Interactivas en el Mundo Arquitectónico: se busca la transformación de superficies dentro de espacios arquitectónicos para convertirlas en interfaces activas entre el mundo físico y el mundo digital.
    • Acoplamiento de Bits y Átomos: se refiere a la integración sin interrupciones entre objetos cotidianos que se pueden tocar,
    • Uso del Medio Ambiente como Interfaz: explora la utilización del entorno físico
    • Ejemplos de Realidad Aumentada: dentro de esta línea, la realidad aumentada se utiliza como una forma innovadora de integrar elementos digitales en el entorno físico.

Algunos ejemplos descritos en el artículo de Hiroshi Ishii del MIT incluyen: Metadesk, Ambient Room y Transboard

Diferencia entre realidad aumentada y Realidad Virtual

La Realidad Virtual (RV) ha sido un área de gran interés, donde el usuario se sumerge por completo en un mundo artificial, sin interacción directa con objetos del mundo real. El entorno virtual reemplaza por completo el mundo real, ofreciendo una experiencia inmersiva total.

La Realidad Aumentada (RA), aunque comparte potencial con la RV, ha recibido menos atención. Los usuarios pueden interactuar con una combinación de mundo real y virtual de manera natural.

Ordenadores corporales

Busca transformar la interacción entre el usuario y la tecnología. Aquí se destacan algunos aspectos clave de esta visión:

  • Portabilidad Total: El objetivo principal es que el ordenador sea tan portátil integrándose sin esfuerzo
    • Interacción Natural: Debe permitir la interacción de manera natural y sin obstáculos, adaptándose al contexto del usuario. Se busca lograr comodidad y facilitar la concentración en la tarea sin distracciones.
  • Manos Libres: Se espera que los ordenadores corporales puedan utilizarse sin necesidad de emplear las manos o, en su defecto, reduciendo al mínimo dicha interacción. Se exploran opciones como reconocimiento de voz y dispositivos de entrada especiales.
  • Invisibilidad Futura: A medida que los chips se vuelven más pequeños y poderosos, se plantea el desafío de hacer que el ordenador corporal sea prácticamente invisible, integrándolo totalmente en la vestimenta o accesorios cotidianos.
  • Aplicaciones Diversas: Los ordenadores corporales se visualizan como herramientas versátiles que pueden tener aplicaciones en una amplia variedad de campos.

Dispositivos utilizados en RA

Puede involucrar varios dispositivos, aunque su presencia puede variar según la aplicación específica. Aquí se presenta una lista de dispositivos asociados, y su inclusión dependerá de la implementación concreta:

  • Ordenador: preferiblemente con capacidad de aceleración de gráficos 3D.
    • Sistema GPS diferencial: para proporcionar información precisa sobre la ubicación.
    • Gafas o sistema de visión montado en casco: con seguidor de orientación o head-trackers.
    • Seguidores de movimiento de la cabeza: para procesar la orientación del usuario.
    • Sensores de sonar: utilizados para detectar objetos reales.
    • Scanners: también empleados para la detección de objetos reales.

El problema clave es el registro de objetos, es decir, almacenar información sobre el objeto virtual para superponerla adecuadamente sobre el objeto real. Para ello, se utilizan head-trackers junto con sensores de sonar y scanners para abordar este desafío, aunque la sensibilidad de estos dispositivos puede ser un problema.

Gafas montado en casco (see-through head-mounted display)

Las “see-through head-mounted displays” (pantallas montadas en la cabeza con capacidad de visión transparente) están inspiradas en las primeras creaciones. Estos dispositivos permiten superponer gráficos sobre lo que la persona puede ver. Se utilizan en ordenadores portátiles y en diversas aplicaciones. Estos dispositivos suelen incorporar un seguidor de orientación conocido como “head-tracker”.

Aplicaciones: Algunos escenarios de RA

El fontanero del futuro

En el año 2005, se presenta un escenario futurista donde un fontanero utiliza tecnología de Realidad Aumentada (RA) para realizar la planificación y presupuestación de una instalación

Mantenimiento mecánico y reparación

La Realidad Aumentada (RA) ofrece una valiosa herramienta para mejorar la eficiencia y la precisión de los técnicos y mecánicos. En este escenario, un mecánico puede ser asistido por un sistema de RA mientras examina y realiza reparaciones en un motor u otro componente mecánico complejo.

Diseño interior

La Realidad Aumentada (RA) ofrece soluciones innovadoras para el diseño y la visualización de proyectos arquitectónicos y de diseño interior. Antes de la construcción, renovación o redecoración de un edificio, se invierte mucho tiempo en el diseño y las discusiones sobre los cambios propuestos. La RA aborda los desafíos de comunicación y comprensión visual al permitir a las personas interactuar y visualizar de manera más efectiva las propuestas.

Construcción exterior

A menudo, se desperdicia tiempo y dinero en la construcción debido a la mala interpretación de planos, el uso de versiones obsoletas o la transferencia imprecisa de información del plano a la construcción real.

  1. Comparación de los paradigmas de interacción

A continuación, vamos a adjuntar una comparación entre paradigmas de interacción:

  1. El ordenador de sobremesa (GUI) la interacción entre el usuario y el ordenador está asilada de la interacción entre el usuario y el mundo real.
  2. En la realidad virtual, el ordenador cubre al usuario y la interacción entre el usuario y el mundo real desaparece
  3. En la computación ubicua el usuario interacciona con el mundo real pero también puede interaccionar con los ordenadores que dispone en el mundo real.
  4. La realidad aumentada soporta la interacción entre el usuario y el mundo real utilizando la información aumentada del ordenador.

Conclusiones

Hay muchas aplicaciones útiles de la tecnología RA, que generara cambios dramáticos en áreas como construcción, diseño y en empresas de manufacturación.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *