banner

Blog

Jun 03, 2023

Una técnica novedosa para mejorar la capacidad de aprendizaje de los robots que realizan tareas repetitivas

5 de junio de 2023

Este artículo ha sido revisado de acuerdo con el proceso editorial y las políticas de Science X. Los editores han destacado los siguientes atributos al tiempo que garantizan la credibilidad del contenido:

comprobado

corregir

por Cactus Communications

Aprender de los errores del pasado no se limita a los humanos. Las computadoras también lo hacen. En las industrias, esto se hace a través de sistemas de control basados ​​en computadora que ayudan a operar los sistemas de producción. Para los robots industriales que realizan tareas específicas en lotes, por ejemplo, producir ropa, chips de computadora o productos horneados, la técnica de control más utilizada es el control de aprendizaje iterativo (ILC). La mayoría de las industrias aún confían en los sistemas ILC que utilizan una estrategia de aprendizaje llamada regla de actualización de tipo proporcional (PTUR). Esta técnica mejora el rendimiento de los sistemas ILC al repetir la misma tarea una y otra vez y actualizar su entrada de control en función de los errores encontrados en iteraciones anteriores.

Sin embargo, esta metodología de control fue propuesta décadas atrás. Y dado que los sistemas ILC se están adoptando cada vez más para realizar tareas más complejas, existe la necesidad de técnicas que puedan aprender más rápido y con mayor precisión.

En un avance reciente, un grupo de científicos ha propuesto una nueva técnica que utiliza la regla de actualización de potencia fraccionaria (FPUR) para mejorar el potencial de rendimiento de los sistemas ILC lineales de entrada única y salida única. El estudio ha sido publicado en el IEEE/CAA Journal of Automatica Sinica.

Las tasas de convergencia, las tasas a las que la diferencia entre la salida deseada y la salida real disminuye con el tiempo, juegan un papel crucial en la definición de la eficiencia de un sistema ILC. Los métodos existentes para mejorar la tasa de convergencia a menudo resultan insatisfactorios en situaciones que requieren alta precisión. Incluso en el caso de ganancias de aprendizaje constantes o seleccionadas manualmente, los sistemas ILC actuales que utilizan el método de actualización lineal no aprovechan al máximo la información disponible. Por lo tanto, los científicos investigaron enfoques más allá de PTUR, que utilizaron métodos de actualización no lineal para aprender y alcanzar el resultado deseado.

"El PTUR tradicional usa un término lineal para el error de seguimiento para actualizar la entrada de control. Por otro lado, FPUR usa un término fraccionario para la actualización. Dado que cualquier número positivo menor que uno tiene una potencia fraccionaria mayor que él mismo, la intensidad de actualización de FPUR es más grande que el de PTUR para pequeños errores de seguimiento, lo que conduce a una tasa de convergencia más rápida", explica Zihan Li, autor principal del estudio y estudiante de maestría en la Escuela de Matemáticas de la Universidad Renmin de China.

El equipo desarrolló un nuevo método FPUR inspirado en las nuevas estrategias de control de tiempo finito (FTC) y control de modo deslizante de terminal (TSMC), que son técnicas potenciales para superar los problemas mencionados anteriormente y para mejorar la velocidad de convergencia. Los científicos también adoptaron un enfoque de mapeo no lineal para explorar la dinámica del error a lo largo del tiempo. Este enfoque les permitió informar sobre el rendimiento de convergencia rápida y caracterizar los posibles ciclos límite de errores de seguimiento en los sistemas ILC. Además, también se realizaron simulaciones numéricas para validar la eficacia del nuevo método.

Cuando se le preguntó acerca de cómo el sistema propuesto cambiaría el campo de los sistemas ILC, Li dijo: "Este estudio tiene tres propósitos principales. Primero, proporciona un algoritmo que utiliza un método de actualización no lineal para mejorar la capacidad de aprendizaje. Segundo, muestra que la adaptación Los términos de potencia fraccional permiten que la tasa de convergencia se regule en función del rendimiento real. Y, por último, exhibe tasas de convergencia rápidas a la par de las de FTC y TMSC".

Este estudio ha demostrado, por primera vez, el uso de FPUR para ILC en sistemas lineales de entrada única y salida única. La técnica propuesta podría usarse potencialmente en otros sistemas repetitivos, como vehículos autónomos, vehículos aéreos no tripulados y robots de rehabilitación.

Más información: Zihan Li et al, Mejora del control de aprendizaje iterativo con la ley de actualización de potencia fraccional, IEEE/CAA Journal of Automatica Sinica (2023). DOI: 10.1109/JAS.2023.123525

Más información: Cita
COMPARTIR