tmtresearch

Projects

Integra TV for all

Image

Un consorcio coordinado por TMT Factory formado además por la Universidad Ramón Llull (Enginyeria i Arquitectura La Salle, UserLab), la Universidad Politécnica de Madrid (Departamento de Inteligencia Artificial) y la Universidad Carlos III de Madrid (Departamento de Informática) está llevando a cabo un proyecto de investigación industrial orientado a la investigación planificada relacionada con la Acción Estratégica e-inclusión y e-asistencia del Programa Nacional Español de Tecnologías de Servicios de la Sociedad de la Información, cuyo objeto es la adquisición y aplicación de nuevos conocimientos que puedan resultar de utilidad para contribuir a mejorar considerablemente el servicio IntegraTV.

Image

El nombre del proyecto, IntegraTV-4all, quiere representar los esfuerzos hacia una nueva televisión para todos y para promover el acceso de las personas con discapacidad a las nuevas tecnologías, con un desarrollo tecnológico adecuado y orientado a sus posibilidades y necesidades, y el impulso del diseño para todos en este ámbito.

El proyecto también cuenta con la ayuda del Ministerio de Industria, Turismo y Comercio a través de una importante subvención PROFIT, y con la colaboración de la Fundación ONCE, y las empresas ATLAS y Fundosa Teleservicios.

El proyecto IntegraTV-4all quiere extender IntegraTV en nuevas direcciones, a través del desarrollo e integración de un nuevo módulo que contribuya a facilitar la autonomía personal y la integración social de colectivos tales como, primariamente, personas con alguna discapacidad sensorial (ceguera, deficiencias visuales, sordera, hipoacusia, limitaciones de habla). Potencialmente, sin embargo, el resultado del proyecto puede ser útil también para personas con alguna discapacidad física o psíquica y personas de avanzada edad.

El ámbito de la fase piloto del proyecto son tres hoteles de la cadena Confortel (hoteles especialmente preparados para discapacitados) y cuatro usuarios domésticos. De esta manera se demuestra la posibilidad de conectar en teleconferencia usuarios que utilicen el servicio IntegraTV-4all en entornos no homogéneos y al mismo tiempo se demuestra la robustez de la aplicación.

Image

La Fase 1 de desarrollo de IntegraTV-4all incluye el estudio del diseño de la interfaz gráfica y de los contenidos. El equipo de desarrollo de IntegraTV-4all está convencido de que aparte de proporcionar una interfaz de usuario totalmente accesible para las personas con alguna discapacidad, también es imprescindible proporcionar unos contenidos adaptados a esas personas. En este sentido, se lleva a cabo una investigación para ver qué contenidos hay accesibles para personas con discapacidad visual y/o auditiva. Básicamente, los contenidos encontrados son películas y juegos infantiles para personas con discapacidades visuales.

En la Fase 2 del proyecto se implementa un servicio básico de televisión interactiva que permita navegar por los menús usando la voz. Para este servicio IntegraTV-4all básico se utiliza el software de reconocimiento del habla y conversión de texto en habla Verbio (de la empresa ATLAS). El sistema de reconocimiento del habla en lenguaje natural permite seleccionar con la voz los menús disponibles en el contexto actual más una serie de menús de acceso directo desde cualquier punto. El sistema de conversión de texto en habla permite sintetizar de forma automática los textos necesarios para el sistema.

En la Fase 3 del proyecto se implementan los componentes fundamentales del servicio avanzado: el sistema de diálogo con lenguaje natural libre, el locutor virtual (desarrollado por la Universitat Ramon Llull) y el presentador virtual. Se plantea la incorporación de técnicas avanzadas de interacción hombre-máquina para hacer posible que ciertos servicios de IntegraTV-4all (por ejemplo, los servicios de despertador y dormidor) se ofrezcan a través de un diálogo libre entre el usuario y el sistema:

Image

Para ello es necesario:

1) Desarrollar la capacidad del sistema para comprender el lenguaje;
2) Facilitar el seguimiento de un diálogo pro-activo y de iniciativa mixta (en el que tanto el sistema como el usuario pueden intervenir en el mismo).

Casos

Para facilitar la comprensión del funcionamiento del proyecto, se presentan de 2 posibles casos relativos a la prueba piloto en hoteles:

Caso 1 Caso 2


Caso 1

Pedro, un discapacitado visual, entra en un hotel provisto con el sistema de IntegraTV-4all y se dirige a recepción. Allí informa que tiene deficiencia visual, cosa que permite configurar el sistema instalado en la habitación asignada a Pedro con el perfil adecuado a su discapacidad. Cuando entra en su habitación, gracias a un dispositivo (una colección de altavoces y micrófonos distribuidos por toda la habitación) que identifica cuando alguien entra en la habitación, se le informa, mediante voz, de la configuración de la habitación: dónde se encuentra el baño, dónde está la cama, el televisor, el armario, el teléfono.
La interfaz de voz utilizada para dicho sistema incluye un programa de reconocimiento de voz de alta calidad y uno de síntesis de voz, que permiten reproducir textos y reconocer la voz del cliente.
Pedro decide, para hacer tiempo antes de comer, escuchar alguno de los poemas de Antonio Machado que están accesibles en IntegraTV-4all. En voz alta y clara navega por los menús del servicio hasta la opción “Cuentos y relatos”. El sistema reconoce la petición de Pedro y automáticamente empieza a reproducir los poemas.
Al rato le entra hambre y decide consultar la carta del restaurante del hotel. En voz alta y clara navega por los menús del servicio hasta la opción “Servicios hotel”. El sistema lo reconoce, deja de reproducir los poemas de Machado y por pantalla aparece la carta del restaurante del hotel. La carta es presentada también por voz y el sistema permite hacer una reserva mediante el mando a distancia.
Pedro se prepara para bajar a comer, pero antes decide configurar el despertador para la siesta de la tarde y la mañana siguiente. Mediante un sistema de reconocimiento del lenguaje libre, sólo con decir “Me gustaría levantarme a las seis de la tarde de hoy” basta para que el despertador quede configurado.
Acto seguido Pedro baja al restaurante a comer. Por la tarde, al sonar del despertador, Pedro pide “cinco minutos más” y el despertador se reconfigura automáticamente…
Al cabo de una semana de relajada estancia, al despedirse, Pedro recibe en recepción su factura y un CD de poemas de Antonio Machado.



Caso 2

Sonia, una chica con una discapacidad auditiva aguda entra en un hotel provisto del sistema IntegraTV-4all y se dirige a recepción. Igual que en el caso anterior, informa en recepción del tipo de discapacidad que padece para que le configuren la habitación asignada a su perfil.
Cuando entra en su habitación, se encuentra cansada y decide pedir alguna cosa para comer mediante el servicio de habitación accesible por el televisor. En la pantalla del televisor escoge la opción de servicios del hotel para llegar hasta la carta del restaurante. Le aparecen todas las opciones y escoge un sándwich de jamón de soja y una bebida.
Formula el pedido para que lo traigan a su habitación. Cuando llega la persona encargada de traer el pedido, mediante un sistema luminoso visual en el televisor, aparece un aviso informando de que alguien está llamando a la puerta. Sonia abre y recibe su comida. Mientras come, decide ver las noticias actuales en la TV.
Mediante el mando a distancia selecciona la opción de ver la TV y le aparecen todos los canales que ofrecen una programación subtitulada para sordos. Escoge las noticias y se sienta en el sofá de la habitación disfrutando de la comida y de una televisión totalmente adaptada a sus necesidades.


Para hacer todo esto posible se parte de los resultados alcanzados por los equipo de la Universidad Politécnica de Madrid y la Universidad Carlos III de Madrid, en los proyectos europeos ADVICE (Virtual Sales Assistant for the Complete Customer Service Process in Digital Markets) y VIP-ADVISOR (Virtual, Independent Advisor for Personal Insurance and Finance Risk Management). El esquema de funcionamiento del servicio final se describe en la siguiente figura. El usuario se comunica mediante una expresión en lenguaje natural que es analizada por un reconocedor de habla. La salida de este reconocedor se procesa para extraer tanto la semántica como la pragmática, esto es, lo que dice el usuario y la intención o finalidad con la que lo dice. Esta información es interpretada en el contexto de una conversación por un gestor de la interacción que decide de qué modo debe responder el sistema y para ello utilizará información tanto del servicio que se solicite como conocimiento sobre características o preferencias del usuario, aunque el uso de perfiles de usuario es costoso y posiblemente estará muy limitado en los primeros prototipos. Una vez decidida la respuesta, se genera una expresión en lenguaje natural que es transmitida finalmente al usuario mediante un sintetizador de voz.

Image

Ficha técnica


  • Tipo de producto: Sistema de televisión interactiva
  • Encargo: Análisis y desarrollo (incluyendo diseño y estudio de usabilidad)
  • Arquitectura: .NET
  • Comunicaciones: SOAP, lenguaje natural, ASR, TTS
  • Gestión de diálogos: Modelo de hilos, agentes software
  • Desarrollo: Visual Studio C#
  • Cliente: Integra Interactive
  • Web: www.integra.tv


Proyecto finalista en los premios ICG a la innovación digital que el Internet Global Congress promueve. El ICG 2005 se celebró en Barcelona del 6 al 10 de junio y tuvo como objetivo promover la innovación y conocimiento en la sociedad digital.


TMT Research - 2011 - Some rights reserved Powered by TMT Factory