Dokumentacja

Budżety i cache

Limity szybkości i budżety per klucz, limity organizacji oraz dwa cache odpowiedzi.

Budżety i limity

Każdy klucz niesie limity zapytań (żądania i tokeny na minutę) oraz budżet wydatków z okresem: total, daily lub monthly. Nad każdym kluczem stoi zbiorczy limit obejmujący całą organizację.

Egzekwowanie odbywa się na bramie, w realnych pieniądzach: każde żądanie jest wyceniane z aktualnego cennika i obciążane przed wysyłką. Po przekroczeniu limitu zapytań wywołanie zwraca 429; po przekroczeniu budżetu, 402. Żądanie nigdy nie dociera do dostawcy. Jeśli liczniki są kiedykolwiek nieosiągalne, kontrola zawodzi w stanie zamkniętym (fail closed) i uzgadnia się z niezmiennym rejestrem audytu, zamiast zgadywać.

Buforowanie

Dwa opcjonalne cache'e odpowiedzi: dokładny (dopasowanie znormalizowanego żądania) i semantyczny (podobieństwo wektorowe z zachowawczym progiem). Oba są ściśle izolowane per organizacja, szyfrowane w spoczynku i wymagają retencji treści. Włącz je w Konsoli, w widoku Cache.

Każdy wpis audytu zapisuje, jak obsłużono wywołanie: none | exact | semantic.