Seguidores

Archivo del blog

martes, 15 de septiembre de 2009

Ivan Dario Giraldo

AGENTE ESTIMULO RESPUESTA
Los agentes de estimulo respuesta (agentes E-R) son sistemas que no tienen estados internos y que solo reaccionan a los estímulos generados por los entornos donde operan, este tipo de comportamiento permite la construcción de una gran variedad de robots capaces de responder a los estímulos que reciben sus sensores.
Representación e implementación de las funciones para la selección de acciones
Para realizar la selección de acciones, debemos construir una función, definida sobre el vector de características, que tenga R valores de salida distintos, suponiendo que existen R posibles acciones a elegir.
Sistemas de Producción
Los sistemas de producción proporcionan una representación adecuada para las funciones de selección de acciones. Un sistema de producción esta formado por un conjunto de reglas de producción ci ai , donde ci es la condición y ai es la acción, por lo tanto un sistema de producción esta formado por un conjunto no vacio de este tipo de reglas.
La condición de una regla puede ser cualquier función booleana definida sobre el vector de características que se calcula a partir de las entradas sensoriales, normalmente la función es un monomio (una conjunción de literales booleanos), la selección de la acción se realiza comenzando con la primera regla c1 a1 , se busca, siguiendo el orden establecido en el conjunto de reglas, una de ellas en la que la evaluación de su condición proporcione el valor de 1, y se selecciona su parte de acción. La parte de acción puede ser una acción primitiva, una llamada a otro sistema de producción o un conjunto de acciones que tienen que ser ejecutadas simultáneamente. En la mayor parte de los casos, la última regla del conjunto tiene como condición el valor de 1, y por tanto, si ninguna de las condiciones de las reglas anteriores toma el valor de 1, se ejecuta por defecto la acción asociada a esta última regla. A medida que se van ejecutando las acciones, se van modificando las entradas sensoriales, así como los valores de las características derivados a partir de aquellas. Por tanto, las condiciones de las reglas deben se comprobadas continuamente, de tal forma que una acción ejecutada en cualquier instante se corresponde con la primera regla cuya condición toma el valor de 1 en dicho instante.
En los sistemas de producción dirigidos por objetivos, la condición de la primera regla de la lista (la primera en ser comprobada) define el objetivo general que persigue el sistema. Siempre que dicha condición se satisfaga, el sistema no ejecutara acción alguna. Si esta condición no se verifica, pero se satisface la condición de la segunda regla, entonces se ejecutara la acción correspondiente a la segunda regla, que en la mayor parte de los casos acercara al sistema hacia el objetivo general. Con el resto de las reglas se procede de igual manera. Este tipo d sistemas de producción es la base de un formalismo denominado programas Teleo-Reactivos, o programas T-R. En un programa T-R, cada acción ejecutada correctamente acerca al agente al cumplimiento de alguna condición asociadas a las reglas que le preceden. Estos sistemas de producción son fáciles de programar, siempre y cuando el objetivo general del agente este bien definido (expresado como una condición booleana de las características). Los programas T-R también son bastantes robustos, ya que todas las acciones conducen inexorablemente al agente hacia el objetivo general.
Redes
Se pueden construir programas que implementen funciones booleanas y sistemas de producción de una forma sencilla. Alternativamente, los sistemas de producción se pueden implementar directamente por medio de circuitos electrónicos. El circuito puede tener como entradas las propias señales sensoriales. Un tipo muy común de circuito lo constituyen las redes formadas por elementos con umbral o por otro tipo de elemento que aplique la función no lineal sobre una suma ponderada de sus entradas. Un ejemplo de este tipo de elementos es la Unidad Lógica con Umbral (ULU), esta unidad realiza una suma ponderada de las entradas, compara esta suma con un umbral y si supera el umbral, produce como salida un 1; en cualquier otro caso produce un 0.

f= 1 si ∑ xiwi ≥0 =0 en cualquier otro caso
Las funciones booleanas que pueden ser implementadas mediante una ULU se denominan funciones linealmente separables (el nombre se debe a que una ULU separa el espacio de los vectores de entrada en dos regiones, la de los vectores que quedan por encima del umbral y la de aquellos que quedan por debajo, mediante una superficie lineal denominada hiperplano de n dimensiones). Muchas funciones booleanas, aunque no todas, son linealmente separables.
La arquitectura de subsunción
Aunque no existe una definición precisa de esta arquitectura, la idea general consiste en hacer que el comportamiento global del agente descanse sobre un conjunto de módulos de comportamiento. Cada uno de estos módulos recibe información directa de las entradas sensoriales. Si dichas entradas satisfacen una precondición, especifica para cada modulo, se ejecuta un programa que también es especifico para cada modulo. Además, un modulo de comportamiento puede ser subsimido en otro. Cuando un modulo j se subsume en un modulo i, el programa que se ejecuta si la precondición del modulo i se satisface, tiene la prioridad sobre el programa asociado al modulo j, a este tipo de distribución se le denomino arquitectura horizontal.
Consideraciones adicionales
El uso de agentes E-R esta más extendido en nuestro entorno de lo que podríamos pensar. Entre los sistemas que utilizan este tipo de agentes nos encontramos los termostatos utilizados para el control de temperatura, los sistemas de control que gestionan la velocidad de un automóvil, a las partes de un sistema operativo que gestionan las interrupciones y en general todos los sistemas utilizados en plantas de fabricación automáticas.
La división horizontal para la separación entre los componentes de percepción y acción constituye una forma práctica de abordar el diseño de un agente. La división horizontal permite al diseñador considerar de forma simultánea aquellos aspectos relacionados con la percepción y la acción que sirven de base para presentar pautas de comportamientos especificas. La división vertical es una alternativa al planteamiento horizontal, en la que se pueden tener distintos módulos encargados de recoger, de diferentes fuentes, grandes cantidades de información (es decir, percepción) y otros módulos encargados de sacar el máximo partido posible a la información, proporcionada por los primeros módulos, para poder desarrollar diferentes tareas (es decir, acción). La relación inherente que existe entre la extracción de información y la generación de pautas de comportamiento hace que el planteamiento vertical sea más atractivo a la hora de optimizar el esfuerzo de programación.
En la actualidad, los sistemas basados en el planteamiento horizontal se pueden beneficiar de la división vertical entre percepción y acción. De esta forma, el vector de características se puede dividir en diferentes campos, donde cada campo puede ser procesado por un sistema perceptual especifico y evocar distinta acciones o comportamientos, como ocurre en la arquitectura de subsunción.

No hay comentarios:

Publicar un comentario