AML tarama operasyon ekibinin günün %60-80'i false-positive eşleşmeleri kapatmakla geçer. Bir orta-büyüklük Türk PSP'sinde gözlemlediğimiz tipik vaka: günde 600 PEP eşleşmesi, %99.4'ü false positive, 4 kişilik bir ekip sadece bu işle uğraşıyor. Bu maliyet hem operasyonel (insan emeği) hem risk (gerçek eşleşmenin "elenmiş" muamelesi görmesi). Bu HowTo, production'da test edilmiş 7 tekniği — gerçek banka ve PSP müşterilerimizde %50-80 azalma ürettiklerini — adım adım anlatır.
1. Adım: Match Grouping ile Tekrarları Otomatik Kapatma
Sorun: Aynı müşteri için aynı yanlış eşleşme her hafta tekrar review'a düşüyor. Analist aynı vakayı 50 kez kapatıyor.
Çözüm: Match grouping (eşleşme kümeleme). Bir analist bir eşleşmeyi "false positive" olarak kapattığında, sistem bu karara dair fingerprint üretir: müşteri ID + eşleşen liste kaydı ID + tarih + analist notu. Aynı müşteri için aynı liste kaydı tekrar eşleştiğinde sistem otomatik kapatır ve sadece log'a yazar.
Pratik etkisi: Bir Türk bankası müşterimizde günlük PEP eşleşmelerinin %62'si match grouping ile otomatik kapatıldı. Analist yükü 8 saat/gün → 3 saat/gün.
Dikkat: Match grouping'i süresiz tutmayın. Liste kaydı değişebilir (yeni alias eklenebilir, alt kademe pozisyon ana pozisyona terfi edebilir). Tipik geçerlilik: 90-180 gün, sonra otomatik recalculation.
2. Adım: Threshold Kalibrasyonu ve Segment-Bazlı Eşik
Sorun: Tek bir eşleşme skoru eşiği (örn. ≥85 manuel review) tüm müşterilere ve listelere uygulanıyor. Düşük riskli müşterilerde aşırı alarm, yüksek riskli müşterilerde yetersiz hassasiyet.
Çözüm: Threshold'u risk segmentine ve liste tipine göre değişken yapın.
Örnek matris:
| Müşteri Risk Seviyesi | Yaptırım Threshold | PEP Threshold | Adverse Media Threshold |
|---|---|---|---|
| Düşük | ≥90 | ≥92 | ≥85 |
| Orta | ≥85 | ≥88 | ≥80 |
| Yüksek | ≥80 | ≥83 | ≥75 |
| Çok yüksek | ≥75 | ≥78 | ≥70 |
AML risk skorlama modeli çıktısı doğrudan bu matrise bağlanır.
Pratik etkisi: Aynı banka müşterisinde threshold kalibrasyonu sonrası toplam manuel review %28 azaldı, false-negative oranı değişmedi (validasyon ile teyit edildi).
Dikkat: Yüksek riskli müşteri threshold'unu çok düşürmeyin — analist yorgunluğu artar, gerçek alarm gözden kaçar. Genel öneri: çok yüksek riskli için 75'in altına inmeyin.
3. Adım: Multi-Attribute (Çok-Özellikli) Scoring
Sorun: Sadece isim üzerinden eşleşme aşırı false-positive üretir. "Mehmet Yılmaz" sorgusu listede 47 farklı kişiye eşleşir.
Çözüm: Doğum tarihi, doğum yeri, uyruğu, T.C. kimlik no, pasaport no gibi disambiguating alanları zorunlu sorguya dahil et. Bu alanlar varsa eşleşme adayları dramatik şekilde daralır.
Skor hesaplama:
Eşleşme Skoru = (İsim_Skoru × 0.5)
+ (DOB_Eşleşmesi × 0.2)
+ (Uyruğu_Eşleşmesi × 0.15)
+ (Doğum_Yeri_Eşleşmesi × 0.10)
+ (Kimlik_No_Eşleşmesi × 0.05)
Eğer DOB ±2 yıl içinde eşleşmiyorsa skor 20 puan düşer; eşleşiyorsa 20 puan artar. Uyruğu farklıysa 15 puan düşer.
Pratik etkisi: Multi-attribute scoring çoğu sistemde tek başına false-positive'i %40-60 azaltır. Türk müşterilerimizde T.C. kimlik no eşleşmesi zorunlu olduğunda yaptırım taraması false-positive oranı %95'ten %2-3'e düştü.
Dikkat: Liste kaydında DOB veya kimlik no yoksa multi-attribute scoring devre dışı kalır; bu durumda sadece isim üzerinden, threshold yüksek tutulmalı.
4. Adım: Contextual Filtering (Bağlam-Tabanlı Filtreleme)
Sorun: Özellikle adverse media taramasında, müşterinin haberde "sanık" mı "tanık" mı "hâkim" mi olduğu net değil. Sistem her olumsuz kelime geçen haberi alarm üretir.
Çözüm: NLP tabanlı bağlam analizi. Aspect-based sentiment, named entity recognition, role classification ile müşterinin haberdeki rolünü belirle. Sadece "olumsuz rol" durumlarında alarm üret.
Bu, adverse media için kritik; yaptırım ve PEP taramasında daha az etkili.
Pratik etkisi: Türkçe haber kaynaklarında bağlam-tabanlı filtreleme ile adverse media false-positive %38 azalttı. Detaylı uygulama için adverse media taraması makalemize bakın.
Dikkat: NLP model çıktısı %100 doğru değil. Yüksek riskli müşteriler için contextual filtering'i daha az agresif tutun — şüpheli vakaları analist görmesi gerekir.
5. Adım: Continuous Learning (Sürekli Öğrenme)
Sorun: Analist günde yüzlerce false-positive kapatıyor, ama sistem bu kapanışlardan ders çıkarmıyor. Aynı pattern yarın tekrar alarm üretiyor.
Çözüm: Continuous learning — analistin kapatma kararlarını öğrenme verisi olarak kullan. Yaygın eğitim hedefleri:
- Aynı alias varyasyonları (örn. "Mohammed" / "Mohamed" / "Muhammad") için skor ayarı
- Yaygın isim çakışmalarında (Türkçe yaygın isim listesi) threshold yükseltme
- Sektör-bazlı false-positive pattern'leri (örn. tıp sektöründe "satıcı" kelimesinin farklı anlamı)
- Source tier weighting'in analist davranışına göre fine-tune'lanması
Implementation: Basit yaklaşım — analist kapatma gerekçelerini structured tag ile etiketler (örn. "yaygın isim", "kimlik bilgisi farklı", "bağlam yanlış"). Bu tag'ler ay sonu raporda analiz edilir, pattern oluşan vakalar rule olarak sisteme eklenir. Daha gelişmiş yaklaşım: gradient boosting modeli analist kapatmalarını öğrenir, benzer eşleşmelere suppression skoru atar.
Pratik etkisi: 6 ay continuous learning ile bir bank müşterimizde yaptırım taraması false-positive %47 azaldı. Adverse media için etki daha büyük (%55).
Dikkat: Continuous learning sürekli denetim altında tutulmalı. Modelin "her şeyi suppress eden" duruma evrilmesi risk; aylık precision/recall validasyonu şart.
6. Adım: List Source Weighting (Liste Kaynak Ağırlıklandırma)
Sorun: Tüm listeler eşit ağırlıkla işleniyor. OFAC SDN'de eşleşme ile alt-kademeli ulusal listede eşleşme aynı operasyonel aciliyetle işleniyor.
Çözüm: Liste kaynağına göre eşleşme önceliği ve threshold ayarı.
Tipik ağırlık matrisi:
| Liste | Bağlayıcılık | Threshold | Otomatik Aksiyon |
|---|---|---|---|
| BM Konsolide | Yüksek | ≥80 | Manuel review, hızlandırılmış |
| OFAC SDN | Yüksek | ≥80 | Manuel review, hızlandırılmış |
| MASAK Kararname | Çok yüksek (TR) | ≥75 | Anında durdurma + manuel review |
| AB Konsolide | Yüksek (AB iş) | ≥82 | Manuel review |
| UK HMT OFSI | Orta-yüksek | ≥83 | Manuel review |
| Ulusal listeler | Düşük-orta | ≥88 | Standart manuel review |
Pratik etkisi: Bir PSP müşterimizde ulusal listelere threshold yükseltilmesi (≥85 → ≥90) toplam false-positive'i %18 azalttı, gerçek pozitif kaçırma olmadan.
Dikkat: Ana listeleri (OFAC SDN, BM, MASAK) asla aşırı yüksek threshold'a koymayın. Bunlar bağlayıcı kararlara dayanır; kaçırma ciddi regülatör problemi.
7. Adım: Segment-Bazlı Behavioural Filtreleme
Sorun: Tarama threshold'u + match grouping yapsanız bile, belirli müşteri segmentlerinde tekrarlayan yanlış eşleşme patternleri var.
Çözüm: Müşteri davranış patternine göre filtre kuralları:
- Düşük hacimli kişisel müşteri + uzun ilişki + STR geçmişi yok: Adverse media taramasını haftalık (günlük değil); düşük skor eşleşmelerini otomatik kapat
- Onaylanmış UBO + listede temiz şirket sahibi: Yüksek skor eşleşmelerini manuel review'a düşür ama önceliklendirme düşük tut
- Yüksek riskli ülke vatandaşı + PEP statüsü olmadan: Hassasiyet artır
- Yeni müşteri (ilk 90 gün): Tüm eşleşmeleri standart önceliklendirme ile review
Pratik etkisi: Behavioural segmentation sonrası bir banka müşterisinde gece-üstü rescreening eşleşmelerinin %33'ü düşük öncelik queue'ya alındı; analist günbaşı yüksek-öncelik queue'ya odaklanabildi.
Dikkat: Segment kuralları compliance birim onayından geçmeli. "Düşük öncelik" eşleşmeler hâlâ review'a düşüyor ama analist throughput hedefi daha yüksek — kapatma kalitesi düşmemeli.
Performans Takibi
7 tekniği uyguladıktan sonra metrik takibi şart:
- FPR (False Positive Rate): Toplam alarm / gerçek pozitif. Hedef azalma %50-80.
- Analist throughput: Saatte kapatılan vaka. Hedef artış 2-3x.
- TPR (True Positive Rate / Recall): Gerçek riskin yakalanması. Korunmalı veya iyileşmeli.
- Mean time to closure: Vaka açılışından kapanışa kadar süre. Azalmalı.
- Analist memnuniyeti: Soft metrik ama önemli. Gereksiz iş yokluğu motivasyon artırır.
Aylık dashboard'a koyun, compliance birime raporlayın.
Rollout Sırası: 90 Günlük Plan
Tekniklerin paralel uygulanması mümkün değil — sıra önerisi:
Hafta 1-2: Baseline ölçüm. Mevcut FPR, analist throughput, MTTC ölçülür. Validation seti (geçmiş 3 ay STR-onaylı vakalar) oluşturulur. Bu olmadan iyileştirme miktarını kanıtlayamazsınız.
Hafta 3-4: Match grouping aktivasyonu. En hızlı kazanım; konfigürasyon çoğu platformda hazır. İlk hafta sonrasında %30-50 azalma görmeye başlamalı.
Hafta 5-8: Threshold kalibrasyonu. Risk segmentine ve liste tipine göre threshold matrisini gözden geçirin. Pilot olarak düşük-riskli müşteri segmentinde başlayın; sonuçları doğrulayın; tüm segmente yayın.
Hafta 9-12: Multi-attribute scoring. Veri kalitesi check (DOB ve kimlik bilgisi ne kadar müşteride mevcut?). Tarama API'sini güncelleyin. Validation set üzerinden test. Production'a kademeli geçiş.
Hafta 13-16: Contextual filtering (adverse media için). NLP modelini değerlendirin (in-house vs vendor). Pilot segment. Validation. Production.
Hafta 17-20: Continuous learning. Analist kapatma verilerinin model eğitimi için yapılandırılması. İlk model eğitimi. Validation. Suppression skor threshold'unu yüksek tutun başlangıçta.
Hafta 21-24: List source weighting + behavioural segmentation. Liste önceliği, segment-bazlı filtreleme kuralları. Compliance review.
90 gün sonunda 4-5 tekniğin production'da olması beklenir; ölçülmüş etki rapor edilir.
Compliance Yönetim Çerçevesi
False-positive azaltma teknik mühendislik işi değil; compliance kararı. Yapılması gerekenler:
- Model değişiklik kararı belgeleme: Her threshold değişikliği, faktör ağırlığı güncellemesi, suppression rule'u tarih + neden ile log'lanır
- MLRO onayı: Önemli değişiklikler MLRO veya compliance birim tarafından onaylanır
- Quarterly audit: Otomatik kapatılan vakaların rastgele örneklemi manuel review; pattern kontrolü
- Annual model validation: Tüm model bağımsız iç denetim tarafından gözden geçirilir
- Regulator dokümantasyonu: MASAK denetimi sorduğunda model anlatımı ve metrik tarihçesi hazır olmalı
Yapmamanız Gerekenler
Threshold'u %5'in üstüne çıkararak tüm sorunu "çözmek". Threshold'u körü körüne yükseltmek gerçek pozitifleri kaçırmaya yol açar. Validasyon olmadan değiştirmeyin.
Continuous learning'i denetimsiz bırakmak. Model üzerinde insan denetimi şart; bazı pattern'ler suppress edilmemeli (örn. yüksek riskli müşteri için adverse media eşleşmeleri).
Match grouping'i süresiz tutmak. Liste verisi değişiyor; eski kararlar geçersizleşebilir.
Operasyonel veriyi compliance birime raporlamamak. False-positive azaltma compliance birim onayıyla yapılmalı; "biz mühendis olarak threshold ayarladık" denetimde sorun.
Sıkça Sorulan Sorular
Bu 7 tekniği hepsini birden mi uygulayalım?
Hayır, sırayla uygulayın. İlk match grouping (en kolay, en etkili), sonra threshold kalibrasyonu, sonra multi-attribute scoring. 4-7. teknikler daha karmaşık; sırayla 2-3 ay arayla devreye alın. Aksi takdirde hangi tekniğin etki ettiğini ölçemezsiniz.
Continuous learning ile compliance birim arasındaki çatışma nasıl yönetilir?
Model kararları "öneri" olarak çıkmalı; otomatik suppression sadece yüksek-güven durumlarda. Compliance birim periyodik olarak model kararlarını review etmeli. Bizde standart: her ay rastgele 100 otomatik kapatılan vaka manuel review'a alınır, kapatma kalitesi denetlenir. Model drift veya yanlış öğrenme tespit edilirse re-training.
Cross-jurisdiction (TR/AB) yapan PSP'ler için bu teknikler aynı çalışır mı?
Çoğunlukla evet, ama threshold ve weighting jurisdiction'a göre farklılaşır. AB tarafında AMLD5 + AMLD6 false-positive yönetim beklentisi formaldır; AB EBA'nın 2020 rehberi "false-positive azaltma sistemleri olmalı ama gerçek riski kaçırmamalı" der. TR tarafında MASAK'ın benzer beklentisi var ama dokümantasyon yükümlülüğü daha esnek.
KOBİ fintech için bu kadar teknik uygulanabilir mi?
Modern AML platformları (Legichain dahil) bu tekniklerin çoğunu yerleşik sunuyor — KOBİ kendi mühendislik eforunu harcamadan kullanır. Match grouping, threshold kalibrasyonu, multi-attribute scoring çoğu platformda hazır. Continuous learning ve contextual filtering daha gelişmiş çözümlerde var. KOBİ için seçim: doğru vendor.
False-positive %0'a inebilir mi?
Hayır. %0 false-positive demek threshold'u o kadar yükseğe çekmek ki gerçek pozitifler de kaçırılır. Realistik hedef: yaptırım için %0.5-2, PEP için %5-15, adverse media için %15-30 false-positive aralığı. Bu seviyelerde recall korunur ve operasyonel yük sürdürülebilir.
Legichain ile False Positive Azaltma
Legichain AML tarama platformu bu 7 tekniğin tümünü yerleşik olarak sunar. Match grouping otomatik (admin konfigürasyonu), threshold kalibrasyonu segment-bazlı (risk modelinizle entegre), multi-attribute scoring varsayılan olarak aktif (DOB, uyruğu, kimlik no), contextual filtering adverse media için NLP-tabanlı, continuous learning her hafta production verisinden model retraining yapar.
Türk bankası müşterimizde 6 ay sonra ölçtüğümüz: yaptırım taramasında false-positive %71 azalma, PEP'te %66, adverse media'da %58. Analist throughput 2.4x. Toplam tarama maliyeti (insan + sistem) %45 düşüş.
