Optimiseur de Structure de Caching de Prompts LLMPRO

Structurez les contextes de prompts complexes en zones de cache statique et de mutation dynamique pour maximiser les hits de cache.

Target Model Provider Engine

Model Preset & Cost Profile

Static Architecture & System InstructionsCACHE TARGET

Dynamic User Query & Session VariablesMUTATION CONTEXT

Static Tokens

Dynamic Tokens

Est. Savings

Input Transaction Cost Analysis

Standard Input Cost (No Caching)$0.00000

Optimized Architecture Cost$0.00000

manifest-payload-compiled.json

[
  {
    "role": "system",
    "content": [
      {
        "type": "text",
        "text": "",
        "cache_control": {
          "type": "ephemeral"
        }
      }
    ]
  },
  {
    "role": "user",
    "content": ""
  }
]

Instructions

1
Choisissez votre fournisseur de modèle cible (Anthropic ou OpenAI).
2
Collez vos instructions système et vos schémas invariants dans la zone Statique.
3
Saisissez vos requêtes utilisateur ou variables dynamiques dans la zone Dynamique.
4
Inspectez l'utilisation des tokens, l'analyse des coûts et téléchargez la structure JSON compilée.

Questions Fréquemment Posées

En séparant les instructions statiques (qui ne changent pas fréquemment) des requêtes dynamiques, les fournisseurs de LLM peuvent mettre en cache la partie statique, réduisant ainsi les coûts et la latence de l'API.

Anthropic Claude nécessite un minimum de 1 024 tokens dans le bloc mis en cache pour activer les avantages du caching. Un avertissement s'affiche si vous êtes en dessous.

AI Agent Rule & SKILL.md BuilderJump to tool

Réducteur & Optimiseur de VecteursJump to tool

Extracteur d'Entités Local (NLP)Jump to tool

Input Transaction Cost Analysis

Instructions

Questions Fréquemment Posées

Related Tools