Jak zabránit tomu, aby vaši vývojáři sypali interní kód do veřejného LLM?
Autor: Unnits
Pokud vaši vývojáři používají AI, spoléhat se na to, že „přece vědí, co mohou a nemohou sdílet,“ je hazard. Lidská chyba je otázkou času. Pokud chcete mít absolutní jistotu, že interní logika, API klíče nebo zákaznická data neodejdou na servery třetích stran, musíte mezi vývojáře a LLM modely postavit technickou bariéru.
Skutečným řešením pro engineering management je implementace interní LLM Gateway (proxy vrstvy) s integrovaným DLP (Data Loss Prevention).
Jak tato architektura funguje v praxi?
- Centralizace veškerého AI provozu: Veškeré požadavky z IDE (VS Code, JetBrains) nebo z interních chatů se nesměrují přímo na OpenAI/Anthropic, ale protékají skrz vaši interní proxy (např. s využitím open-source nástrojů jako LiteLLM nebo custom API proxy).
- Automatié maskování a tokenizace (DLP): Než proxy odešle požadavek ven, projde text filtrem. Pomocí regulárních výrazů a NER (Named Entity Recognition) algoritmů proxy automaticky detekuje a nahradí citlivé údaje (např. interní IP adresy, specifická doménová jména, SQL struktury nebo osobní data) obecnými zástupnými tokeny (
[SECRET_1],[IP_ADDRESS]). Jakmile model odpoví, proxy dosadí původní hodnoty zpět pro vývojáře. - Secret Scanning před odesláním: Integrujte do proxy nástroje typu TruffleHog nebo GitGuardian. Pokud se vývojář pokusí do promptu vložit kód, který obsahuje zapomenutý hardcoded API klíč nebo heslo, proxy požadavek okamžitě zablokuje a zaloguje incident.
- Striktní audit logování: Na rozdíl od veřejného ChatGPT, kde nemáte přehled o tom, co lidé zadávají, na vlastní proxy logujete metadata (kdo, kdy a kolik tokenů spotřeboval), aniž byste museli ukládat samotný citlivý obsah promptu.
Tímto přístupem nezpomalíte vývojáře o jedinou sekundu, ale přenesete kontrolu nad datovou suverenitou plně do rukou vaší firmy.
