Guardrails

Los guardrails permiten definir reglas de comportamiento defensivo del agente: qué temas o respuestas debe evitar, cuántas violaciones tolera por conversación y por cliente, y qué mensaje mostrar cuando se viola una regla.

La whitelist de términos permitidos es a nivel workspace y se gestiona aparte — ver Whitelist de guardrails .

Obtener Guardrails

GET https://api.platica.mx/v1/agents/{agentId}/guardrails

Parámetros de URL

Parámetro	Tipo	Descripción	Requerido
`agentId`	string	Identificador único del agente	✓

Respuesta

{
  "enabled": true,
  "rules": [
    "No prometas reembolsos automáticos",
    "No menciones precios fuera de la lista oficial"
  ],
  "message": "Lo siento, no puedo ayudarte con eso.",
  "conversationStrikeThreshold": 3,
  "clientStrikeThreshold": 5
}

Campos de la respuesta

Campo	Descripción
`enabled`	Si los guardrails están activos
`rules`	Lista de reglas en lenguaje natural (máximo 20)
`message`	Mensaje que se envía al cliente cuando se viola una regla
`conversationStrikeThreshold`	Máximo de violaciones permitidas en una sola conversación (1-10)
`clientStrikeThreshold`	Máximo de violaciones permitidas históricamente por cliente (1-10)

Actualizar Guardrails

Todos los campos son opcionales — sólo se actualizan los presentes en el body.

PATCH https://api.platica.mx/v1/agents/{agentId}/guardrails

Parámetros de URL

Parámetro	Tipo	Descripción	Requerido
`agentId`	string	Identificador único del agente	✓

Cuerpo de la solicitud

{
  "enabled": true,
  "rules": [
    "No prometas reembolsos automáticos",
    "No menciones precios fuera de la lista oficial"
  ],
  "message": "Lo siento, no puedo ayudarte con eso.",
  "conversationStrikeThreshold": 3,
  "clientStrikeThreshold": 5
}

Parámetro	Tipo	Descripción	Validación
`enabled`	boolean	Activar/desactivar guardrails	—
`rules`	array de strings	Reglas en lenguaje natural	Máximo 20 entradas, cada una no vacía
`message`	string	Mensaje al cliente cuando se viola una regla	Máximo 500 caracteres
`conversationStrikeThreshold`	integer	Máximo de violaciones por conversación	Entero entre 1 y 10
`clientStrikeThreshold`	integer	Máximo de violaciones por cliente	Entero entre 1 y 10

Respuesta

{
  "status": "success",
  "message": "Agent guardrails updated successfully",
  "data": {
    "enabled": true,
    "rules": [
      "No prometas reembolsos automáticos",
      "No menciones precios fuera de la lista oficial"
    ],
    "message": "Lo siento, no puedo ayudarte con eso.",
    "conversationStrikeThreshold": 3,
    "clientStrikeThreshold": 5
  }
}

data siempre refleja el estado completo de los guardrails tras el merge, no sólo los campos actualizados.

Anterior Sub-agentes Siguiente Reglas de Asistencia