Appearance
Veri Sınıflandırması ve Saklama (Data Classification & Retention)
- Sahip: Simetri
- Son Güncelleme: 2026-04-16
- Güncelleme Tetikleyicisi: Yeni tablo/alan, yeni veri kategorisi, yeni saklama düzenlemesi.
- Çeyreklik Review: 90 günde bir DSAR akışı ve retention job'larının çalıştığı doğrulanır.
1. Neden Bu Doküman?
EU AI Act, GDPR ve B2B enterprise satışta ilk sorulan üç soru aynıdır: "Hangi veri, ne kadar süreyle, kim tarafından görülebilir?" Bu dosya, bu üç soruya tek yerden yanıt verir. threat-model.md varlık envanterini (§2) baz alır; retention ve DSAR mekanizmalarını da bağlar.
2. Sınıflandırma Katmanları (4 Tier)
| Tier | Etiket | Tanım | Örnek |
|---|---|---|---|
| T0 | Public | Dışarı açık, açıklansa ihlal değildir. | Marketing içeriği, açık API şemaları |
| T1 | Internal | Simetri içi; dışarı çıksa ticari zarar var ama düzenleyici yaptırım yok. | Sistem prompt'ları (IP), mimari diyagramları |
| T2 | Confidential | İş sözleşmesi / NDA kapsamı; sızarsa müşteri güveni bozulur. | B2B müşteri ayarları, ATS entegrasyon key'leri |
| T3 | Restricted (PII) | Kişisel/psikometrik veri; GDPR ve EU AI Act kapsamı. En sert koruma. | Sohbet transkripti, trait skorları, e-posta |
Bir alan birden fazla tier'a düşerse en sert olanı uygulanır.
3. Humindx Varlıkları → Tier Eşlemesi
threat-model.md §2'deki A1–A8 ile tutarlıdır.
| Varlık | Tier | Gerekçe |
|---|---|---|
| A1 — Ham sohbet transkripti | T3 | PII + psikometrik veri |
| A2 — PII-masked sanitized transkript | T3 | Hala bireysel davranış örüntüsü |
| A3 — Noise-injected embedding | T3 | Inversion saldırısı ile geri dönüş riski |
| A4 — Trait skorları | T3 | Doğrudan kişiye atfedilir |
| A5 — Context Room metadata | T2 | Kullanıcı kimliği ile ilişkili |
| A6 — Audit trail kayıtları | T2 | Integrity-critical, PII-masked |
| A7 — LLM sistem prompt'ları | T1 | IP; sızıntı ticari kayıp |
| A8 — B2B yönetim reçeteleri | T3 | Aday bazında çıktı |
4. Saklama Süreleri (Retention)
| Veri | Süre | Silme Yöntemi | Gerekçe |
|---|---|---|---|
| A1 ham transkript | 24 saat (Redis TTL) | TTL expiration | vector-privacy.md → Cold Path'e geçtikten sonra gerek yok |
| A2 sanitized transkript | 90 gün | Cron job, sert silme | Model regresyon testi penceresi |
| A3 embedding | Hesap aktif + 30 gün | Kullanıcı silinince cascade | RAG için gerekli; hesap kapanınca fayda bitiyor |
| A4 trait skorları | Hesap aktif + 30 gün | Kullanıcı silinince cascade | DNA kartı değeri |
| A5 context room metadata | Hesap aktif + 30 gün | Cascade | — |
| A6 audit trail | 7 yıl | Immutable + arşivlenir | GDPR hesap verebilirlik + KVKK 6 yıl |
| A7 prompt'lar | Git tarihi boyunca | Manuel (Git revert) | IP |
| A8 B2B reçeteler | Müşteri sözleşme süresi + 1 yıl | Silme isteği + otomatik | Sözleşme vade sonrası |
Silme job'u testi: Her retention job'u için
tests/retention/altında bir kontrol testi olmalı — çeyreklik review'da sonucu kontrol edilir.
5. Erişim Matrisi (Role × Tier)
Detay RLS politikası architecture/context-rooms-design.md'de. Özet:
| Rol | T0 | T1 | T2 | T3 |
|---|---|---|---|---|
anonymous | R | — | — | — |
b2c_user (kendi) | R | — | — | R (kendi) |
b2b_gateway | R | — | R (kendi tenant) | R (agrega + sınırlı) |
internal_analyst | R | R | R (masked) | — |
platform_admin | RW | RW | RW | R (audit kaydı ile) |
platform_admin T3 erişimi her seferinde audit event'i üretir (audit-trail.md §3).
6. DSAR (Data Subject Access Request) Akışı
GDPR Art. 15-22 (erişim, düzeltme, silme, taşıma) için tek giriş noktası: dsar@humindx.com + B2C app "Verilerim" menüsü.
1. Talep alındı → audit event: dsar.received
2. Kimlik doğrulama → 2FA + son 3 oturum cihazı onayı
3. Talep tipi sınıflandırma → Erişim / Taşıma / Düzeltme / Silme
4. Teknik yürütme:
- Erişim: user_id üzerinden tüm T3 kayıtlar + audit özet
- Taşıma: JSON export (schema: docs/modules/api-contracts.md)
- Silme: cascade + embedding'ten forget (re-train yerine unlink)
5. 30 gün içinde yanıt → audit event: dsar.completedSilme'nin sınırları: Audit trail (A6) retention süresi dolana kadar silinmez — yasal zorunluluk (GDPR Art. 17(3)). Kullanıcıya bu açıkça bildirilir.
7. Sınıflandırma → Kod Kuralları
- T3 alan tutan her tablo
db-schema.md'de-- tier:T3yorumu taşır. - T3 alanı LLM'e gönderen kod
vector-privacy.mdsanitization adımını atlayamaz — CI statik analizi bu atlamayı yakalar (Tier 3 follow-up). - T1 prompt dosyalarını değiştiren PR'lar CODEOWNERS kapsamında.
8. Ne Zaman Bu Dokümanı Aç?
- Yeni tablo/alan ekleniyor → tier ataması
- Yeni saklama düzenlemesi (KVKK değişikliği, sözleşme) → §4 revize
- DSAR ritmi değişiyor → §6 revize
- İlk B2B sözleşmesi müşteri-özel retention talep ediyor → ADR aç