Apple patenta sistema que detecta y lee los labios cuando registra comandos de voz

Apple ha desarrollado un novedoso sistema para mejorar la comprensión de comandos de voz en su asistente digital Siri, especialmente en entornos ruidosos o con interferencias. El objetivo es que los dispositivos que cuentan con Siri puedan entender mejor lo que los usuarios están diciendo.

El sistema se basa en la detección de los movimientos de la boca y la lectura de los labios del usuario mientras pronuncia los comandos. Para lograrlo, utilizan sensores de movimiento, como acelerómetros o giroscopios, que registran las vibraciones generadas durante el habla. Estos sensores consumen menos energía que los micrófonos tradicionales y permiten detectar los movimientos de la boca, la cara, la cabeza y el cuello.

El sistema compara los movimientos detectados con patrones previamente aprendidos y almacenados en una base de datos. De esta manera, puede encontrar coincidencias y entender lo que el usuario está solicitando. En esencia, el sistema lee los labios del usuario para interpretar sus peticiones.

Con esta innovación, los dispositivos que cuenten con este sistema de reconocimiento de voz serán más precisos al entender comandos como “Oye, Siri” y otras órdenes comunes, como “siguiente canción”. Esto mejorará la experiencia del usuario al interactuar con Siri en situaciones con mucho ruido o interferencias.

Para implementar este sistema, Apple necesitará analizar una gran cantidad de datos sobre los movimientos que realizan los usuarios al pronunciar cada palabra. De esta manera, podrán crear perfiles de voz que permitan al sistema diferenciar la pronunciación de cada usuario y el idioma en el que se realizan las peticiones.

Entradas relacionadas