viernes, 7 de mayo de 2010

Wiki Interfaces de Voz

En ella encontrarás diferentes aspectos de las Interfaces de voz:
Tecnologías, comparativos, mercado, algoritmos, algunos videos y referencias a sitios de interés.

http://interfacesdevoz.wikispot.org/Front_Page#preview

jueves, 6 de mayo de 2010

A Breakthrough in Voice-Powered Interfaces for Mobile Phones

Cellular Application
Send text messages - cellular voice recognition
http://espanol.video.yahoo.com/watch/1000565/3786110

BlueGenie #Voice #Interface: Truly Hands-Free

Cellular Application
http://www.youtube.com/watch?v=P9nk3QWdkMA

Solución por voz

Reconocedor de voz utilizado por T-Systems para control de inventarios de su centro de distribución.
http://www.youtube.com/watch?v=BOl72EZI06s

A Comparative Study of Speech and Dialed Input Voice

A study comparing speech and dialed input voice user interfaces for farmers in Gujarat, India.
http://portal.acm.org/citation.cfm?id=1518701.1518709&coll=GUIDE&dl=GUIDE&CFID=87279170&CFTOKEN=98698836
Patel, N., Agarwal, S., Rajput, N., Nanavati, A., Dave, P., and Parikh, T. S. 2009. A comparative study of speech and dialed input voice interfaces in rural India. In Proceedings of the 27th international Conference on Human Factors in Computing Systems (Boston, MA, USA, April 04 - 09, 2009). CHI '09. ACM, New York, NY, 51-54. DOI= http://doi.acm.org/10.1145/1518701.1518709

Mobile Refinding of Web Information Using a Voice

How a voice-controlled service, accessible by telephone, could help to support mobile users' needs for refinding specific information previously found on the web.
http://portal.acm.org/citation.cfm?id=1111360.1111369&coll=GUIDE&dl=GUIDE&CFID=87279170&CFTOKEN=98698836

Comparación de Algoritmos de Aprendizaje para Identificación del Usuario a través de la Voz

Comparación de Algoritmos de Aprendizaje para Comparación entre cuatro algoritmos de aprendizaje automático para identificación del hablante.
http://portal.acm.org/citation.cfm?id=1111360.1111409&coll=GUIDE&dl=GUIDE&CFID=87279170&CFTOKEN=98698836

Likelihood-Maximizing-BasedMultiband Spectral Subtraction for Robust Speech Recognition

Improving speech recognition accuracy
http://portal.acm.org/results.cfm?coll=GUIDE&dl=GUIDE&CFID=87279170&CFTOKEN=98698836

Recognition of Noisy Speech: A Comparative Survey of Robust.

Técnicas para reducir las distorsiones de frecuencia o ruido en la comunicación entre el humano y un equipo con reconocimiento de voz.
http://portal.acm.org/citation.cfm?id=1592528.1592533&coll=GUIDE&dl=GUIDE&CFID=87279170&CFTOKEN=98698836

Aplicación para el móvil - Reconocedor de Voz


CTIA: Vlingo Text to Speech Voice Recognition App
http://www.youtube.com/watch?v=nnJrcN8R3xY

Calculating route (Voice Recognition)


TomTom GO 520 / 720 Speech Recognition

Reconocedor de Voz para Redes Neuronales e Inteligencia Artificial


Voice and Speech Recognition Software from e-Speaking

Sw de reconocimiento de voz para utilizar aplicaciónes de la PC.
http://www.youtube.com/watch?v=pYu6_cNRCD4&feature=related

Air Combat Simulator uses Voice


miércoles, 5 de mayo de 2010

sábado, 1 de mayo de 2010

PlayStation 3 Voice Recognition PSVR

Sony Computer Entertainment presentó el PSVR, una librería de reconocimiento de voz para PlayStation 3, que pretende soportar hasta 20 idiomas y hacer uso del micrófono para realizar operaciones en la pantalla.

miércoles, 14 de abril de 2010

reacTIVision y TUIO: Un kit de herramientas tangibles para las Superficies Interactivas

Yazmín Magallanes Velázquez.
Universidad de las Américas, Puebla
yazmin.magallanesvz@udlap.mx


Abstract
Esta reseña presenta una descripción de las herramientas de reacTIVision y TUIO como kit en apoyo a las superficies interactivas.
reacTIVision es un conjunto de herramientas de visión por computadora para el seguimiento de la interacción multi-táctil.
TUIO es un protocolo diseñado principalmente como una capa de abstracción para la designación y la transmisión de punteros y los estados de objetos tangibles en el contexto de superficies interactivas.

1. Introducción
El protocolo TUIO y el framework reacTIVision comprenden un conjunto de herramientas para el rápido desarrollo de interfaces de usuario para superficies tangibles y superficies multi-táctiles.
Ambos componentes fueron inicialmente desarrollados para aplicaciones musicales.
El protocolo TUIO fue adoptado por el código abierto con la finalidad de realizar ingeniería inversa en grandes superficies multi-contacto. El acceso a tal variedad de código abierto apoyó la democratización de las nuevas tecnologías tangibles de interfaz multi-contacto. Desde su publicación inicial y lanzamiento en 2005, TUIO y el conjunto de herramientas reacTIVision han sido utilizados con éxito para el diseño y aplicación.


2. Abstracción de superficie tangible
El objetivo inicial de la definición de protocolo TUIO era proporcionar una descripción simple de punteros y los estados de señal del contexto de una mesa de superficie bidimensional. Esta descripción proporciona una solución básica para la implementación de superficies multi-táctiles y el seguimiento de etiquetado de objetos físicos.
El protocolo se basó en TUIO Open Sound Control (OSC), que ha sido ampliamente adoptado para la codificación de datos de control de instrumentos musicales y dispositivos interactivos de propósito general. OSC exitosamente supera las limitaciones de rendimiento del estándar musical de protocolo MIDI.
El escenario de la solicitud inicial para el protocolo TUIO fue definida por el intercambio de datos de control entre dos o más interfaces interactivas.

3. El motor ReacTIVision
La versión 1.4 de reacTIVision soporta seguimiento básico multi-táctil con los dedos. En su última versión introduce varias capas de seguimiento, que mejoran su interpretación. Esto es especialmente importante en las condiciones con movimiento rápido de objetos debido a los gestos expresivos en la interpretación musical.

4. El protocolo TUIO
La especificación del protocolo TUIO original estaba concentrada en las necesidades específicas del proyecto reacTable, principalmente centrándose en objeto etiquetado y el seguimiento de los dedos en el contexto de un escenario de colaboración a distancia, garantizando al mismo tiempo robustez general del sistema distribuido en red.
Un perfil TUIO define dos mensajes centrales: Set y Alive. Los mensajes Set se utilizan para comunicar información sobre el estado del token, tal como la posición, orientación, velocidad y aceleración. Los Mensajes Alive indican el conjunto actual de tokens presentes en la superficie utilizando una lista de identificadores de sesión.
El protocolo de TUIO de nueva generación permitirá incluso la descripción del objeto y sus relaciones, tal como relaciones de contenido o conexiones mecánicas entre objetos.
La actual implementación disponible de seguimiento en su mayoría incluye software multi-táctil basado en visión por computadora, como touché, BBTouch y Community Core Vision. Además las implementaciones del tracker TUIO son basadas en el controlador de hardware, como el Wiimote (dispositivo de control), donde WiimoteTUIO por ejemplo permite el rápido desarrollo de aplicaciones para pizarrones interactivos usando las capacidades IR(Infra Rojas) de seguimiento de un controlador Wiimote y una aplicación de cliente TUIO adecuada. Además de eso, existen puentes TUIO dedicados para hardware multi-touch, tales como los dispositivos de la N-trig, que son utilizados actualmente para la mayoría de las Tablet PC multi-touch.
Iniciativas similares de integración se han comenzado por Windows 7 y Microsoft Surface, que se han extendido para proporcionar apoyo a nivel del sistema TUIO.
También existen una gran variedad de aplicaciones iPhone, que permiten el uso de este dispositivo como un controlador remoto multi-táctil que puede enviar la TUIO sobre su conexión de red inalámbrica.
La implementación de TUIO está disponible para muchos lenguajes de programación tales como Objective C, Python, Smalltalk, Ruby y Actionscript, así como sonido y ambientes multimedia como VVVV, SuperCollider, Chuck u Open Frameworks y también de varios entornos de programación a nivel de reconocimiento de gestos y desarrollo de interfaces tangibles para Java, C # o C ++, que están utilizando TUIO como la capa de entrada común.
Aplicaciones como la NASA WorldWind, Google Earth, Second Life o el motor de juego de Blender se han mejorado con controles multi-táctiles y con la ayuda del protocolo TUIO.
Dentro del sistema X-Window, el cual es comúnmente usado en Linux, el multi-puntero del X-Server MPX recientemente se ha incluido en la rama principal y por lo tanto se ha convertido en un componente estándar de todas las grandes distribuciones de Linux.

5. Conclusiones y trabajo futuro
Se espera que la aplicación del futuro protocolo TUIO 2.0, ofrezca una base sólida para la
realización de superficies interactivas con entornos más versátiles. La labor futura en las interfaces tangibles cambiará el foco a una vista más generalizada de la plataforma TUIO, donde reacTIVision servirá como una implementación de referencia común para definir las características de protocolo, que tiene la intención de abrir un mayor desarrollo de las implementaciones basándose en tecnologías alternativas.

6. Referencias
1. S. Jordà, M. Kaltenbrunner, G. Geiger, and R. Bencina, "The reacTable," Proceedings of the International Computer Music Conference, 2005.
2. J. Y. Han, "Multi-touch sensing through frustrated total internal reflection," SIGGRAPH 2005 Sketches, 2005.
3. M. Kaltenbrunner, T. Bovermann, R. Bencina, and E. Costanza, "TUIO - A Protocol for Table Based Tangible User Interfaces," in GW '05: Proceedings of the 6th International Workshop on Gesture in Human-Computer Interaction and Simulation, 2005.
4. G. Reitmayr and D. Schmalstieg, "An open software architecture for virtual reality interaction," VRST '01: Proceedings of the ACM symposium on Virtual reality software and technology, 2001.

Agentes Inteligentes

El uso de los agentes es una gran ventaja, ya que son entidades capaces de aprender nuestros gustos y actuar tal y como lo haríamos nosotros, pero adelantándose y realizando tareas que nosotros podríamos realizar si dispusiésemos de más tiempo.

Enseguida muestro algunas circunstancias en las que se podrían utilizar los agentes, así como algunas aplicaciones y beneficios de utilizarlos.

Usar agentes cuando:
Proporciona un alto potencial de rendimiento o reduce el riesgo
Puede capturar y conservar conocimientos humanos irremplazables
Puede desarrollar un sistema más consistente que los expertos humanos
Puede proporcionar los conocimientos necesarios en varias ubicaciones al mismo tiempo o en un ambiente hostil peligroso para la salud humana.
Puede proporcionar conocimientos costosos y poco comunes.
Puede proporcionar los conocimientos necesarios para la capacitación y el desarrollo con el propósito de compartir los conocimientos y la experiencia de expertos humanos con un gran número de personas.

Beneficios y algunas aplicaciones:

Reducir tiempo en la realización de tareas monótonas.

Realizar tareas administrativas.

En aplicaciones Industriales como:
• Control de procesos
• Producción

Aplicaciones comerciales (Apoyarnos en la búsqueda y selección de artículos dependiendo de las características que queramos y en un mejor tiempo):

• Gestión de información
• Comercio electrónico
• Monitorización
• Mediador de diferentes fuentes de información

Aplicaciones médicas:
• Monitorización de pacientes.
• Ayudar a la toma de decisiones de un médico mediante el análisis de resultados de un diagnóstico médico.

Entretenimiento:
• Juegos (incorporar personajes virtuales que pueden funcionar de forma casi autónoma).
• Teatro interactivo y cine (donde se permite a un usuario interpretar el papel de un personaje en una obra donde el resto de los personajes pueden ser virtuales).

Estoy consciente de que un agente no puede sustituir las actividades humanas en un 100% pero si pueden ayudar a realizar algunas de ellas e incluso servir como apoyo en la toma de decisiones.

lunes, 11 de enero de 2010

Uno de los principales retos en casi todos los sistemas de cómputo está enfocado a la interacción humano-computadora con aplicaciones gráficas, sencillas y amigables con el usuario. La utilización de navegadores para texto, imágenes y videos basados en el World Wide Web (WWW) han aumentado las expectativas del servicio que recibe un usuario y de la manipulación de información. Los últimos avances en el desarrollo de lenguajes y plataformas como Java, OpenGL y VRML hacen cada vez más completa y funcional la visualización de la información.

http://www.bibliodgsca.unam.mx/tesis/tes7cllg/sec_33.htm