LLM Security & Guardrails

Llama Guard — Meta&amp;amp;#x27;s Safety Classifier

By Sandeep Belgavi · 2026-07-03 · 1 sections

Taxonomy

13 hazard categories: violence, hate, sexual, criminal, weapons, defamation, etc. Configurable per app.

Advertisement

Run alongside primary LLM. Classify user input + LLM output. Block/redact on hit.

Advertisement

Small model (7B). ~50ms on GPU. Streaming supported via chunked classification.

Advertisement

Disclaimer · Privacy · Contact