Adverse media (olumsuz medya) taraması, bir müşterinin veya işlem tarafının suç, dolandırıcılık, terör finansmanı, yolsuzluk veya benzeri olumsuz haberlerle anılıp anılmadığını araştırır. Yaptırım veya PEP listesinde olmayan ama basında "rüşvet iddiası" ile geçen bir CEO, Enhanced Due Diligence (EDD) tetiklenmesi gereken bir vakadır. Bu yazı adverse media taramasının kapsamını, otomasyon tekniklerini ve Türkiye için spesifik dikkat noktalarını ele alır.
Adverse Media Taraması Niye Var?
AML taramasının üç dikeyinden biri olarak adverse media, diğer ikisinin (yaptırım, PEP) gözünden kaçan riskleri yakalar:
- Müşteri henüz hiçbir yaptırım listesinde değil, ama hakkında savcılık soruşturması açıldı.
- Bir şirket henüz suçlanmamış, ama sektör basınında "vergi kaçırma" iddiası dolaşıyor.
- Eski PEP statüsü kalktı, ama yolsuzluk soruşturması yeni başladı.
FATF Recommendation 12 ve AMLD5 Article 18, Enhanced Due Diligence (EDD) kapsamında "kamuya açık olumsuz bilgi" değerlendirmesini zorunlu kılar. Türkiye'de MASAK 5 No'lu Tebliği, yüksek riskli müşteriler için "müşterinin ticari faaliyeti, finansal hacmi ve geçmişi" değerlendirmesini ister — pratikte adverse media taramasını gerektiren bir hüküm.
Hangi Haber Kategorileri Taranır?
Endüstri standardı (Wolfsberg Group adverse media rehberi) şu kategorileri tanımlar:
- Finansal suçlar: Kara para aklama, vergi kaçırma, dolandırıcılık, zimmet, banka soygunu.
- Terör finansmanı: Terör örgütleri ile bağlantı, terör finansmanına aracılık.
- Yolsuzluk: Rüşvet, kamu görevini suistimal, kayırmacılık, çıkar çatışması.
- Yaptırım ihlali: Yaptırım rejimini delme, ambargo malı ticareti.
- Organize suç: Mafya bağlantısı, uyuşturucu kaçakçılığı, insan ticareti, silah kaçakçılığı.
- Diğer: Çevre suçları, fikri mülkiyet ihlali, modern kölelik, kara para aklamayı kolaylaştırma.
Her kategorinin risk ağırlığı farklıdır. Terör finansmanı haberi yaptırım kararından bile öncelikli görülebilir; vergi kaçırma iddiası ile yolsuzluk farklı operasyonel akışa girer.
Manuel vs Otomatik Tarama
Geleneksel yaklaşım: bir analist Google'a müşterinin adını yazar, manuel okur. Bu yaklaşım küçük bir müşteri tabanı için işler ama:
- Yüz binlerce müşterili portföy için ölçeklenmez.
- Türkçe + İngilizce + Arapça + diğer dillerde paralel arama gerekir.
- Sonuçlar hafif farklı isimlerde (örn. "Mehmet Yılmaz") sayısızdır; analist bağlamı tek tek değerlendirir.
- Tekrarlayan sonuçlar (aynı haber 50 sitede) verim öldürür.
Modern adverse media tarama otomatize edilmiştir: NLP (doğal dil işleme) tabanlı sistemler haber metnini parse eder, kişiyi tanır (Named Entity Recognition), olumsuz kategoriyi sınıflandırır (zero-shot veya fine-tuned classifier), bağlamı (suspect mu, witness mı, judge mi) ayırır.
Otomasyon Bileşenleri
Haber kaynağı toplama. Binlerce haber sitesinden RSS, sitemap veya API üzerinden makaleler toplanır. Türkçe için Hürriyet, Milliyet, Sabah, BBC Türkçe, Reuters Türkçe, Bloomberg HT, sektör yayınları (Banka & Finans, Kripto Para Haberleri vb.) önemli kaynaklar.
Dil tespiti ve normalizasyon. Her haber metnin dili tespit edilir; uygun NLP modeline yönlendirilir.
Named Entity Recognition (NER). Metinden kişi, şirket, konum, tarih bilgileri çıkarılır. Türkçe için spaCy'nin Türkçe modeli, ya da fine-tuned BERT/XLM-R modelleri kullanılır. Türkçe NER'in zorluğu: ek alma (Mehmet'in, Mehmet'e), birleşik isimler, lakap kullanımı.
Risk kategori sınıflandırma. Metnin hangi adverse media kategorisine girdiği — finansal suç, terör finansmanı, yolsuzluk vs. — zero-shot veya fine-tuned classifier ile belirlenir.
Bağlam ayırımı. Müşteri haberde nasıl geçiyor? "Sanık", "tanık", "kurban", "savcı", "hakim", "yorumcu" — bunlar tamamen farklı sinyaller. Sadece isim eşleşmesi yeterli değil; "X uyuşturucu davasında sanık" ile "X uyuşturucu davasında hâkim" farklı risk seviyesi.
Eş referans çözümleme. "CEO Mehmet Yılmaz... O bu konuda..." — "O" zamiri CEO'ya işaret eder; sistem bu bağlantıyı çözmeli ki bağlam doğru atfetilsin.
Duplikasyon ve clustering. Aynı olayı kapsayan farklı haberler tek bir vakaya bağlanır; analist 50 ayrı bildirim değil 1 vaka görür.
Skor ve önceliklendirme. Kaynak güvenilirliği, haber tazeliği, kategori ağırlığı, müşteri risk profili birlikte değerlendirilerek vaka skoru üretilir.
Türkçe NLP Sorunları
Türkçe adverse media taramasında karşılaştığımız tipik problemler:
Ek karmaşıklığı. Türkçe agglutinatif dil — "Mehmet'in", "Mehmet'e", "Mehmet'ten" tek bir entity'ye işaret eder. NER modelinin morfolojik analize duyarlı olması gerekir.
Birleşik tamlamalar. "Mehmet Yılmaz'ın şirketi" gibi yapılarda hem şahıs hem şirket entity'si çıkartılmalı.
Türkçe karakter / Latin çift kullanımı. Aynı kişi bazı haberlerde "İlhan" bazılarında "Ilhan" olarak geçer. Hem normalize edilmiş hem orijinal form indekslenmeli.
Akıştan dil değişimi. Bir Türk işadamı için Reuters İngilizce haberi, Türk yayını Türkçe haberi yapar. Sistem her ikisini birleştirmeli.
Sektörel terminoloji. Hukuki Türkçe ("müştereken ve müteselsilen sorumlu") günlük dilden farklı; NLP modeli bu sektörel kullanımları öğrenmeli.
False Positive: Bağlam Olmadan Olmaz
Adverse media en yüksek false-positive oranı üreten taramadır (%70-85 sektör ortalaması). Sebepleri:
- Yaygın isim çakışması. "Mehmet Yılmaz" haberinde olumsuz vaka var, ama haberdeki Mehmet Yılmaz ile sizin müşteriniz farklı kişi.
- Yanlış bağlam atfetme. Müşteri haberde "sanık" değil "tanık" olarak geçiyor; sistem ayırt edemiyor.
- Eski haber tekrar yüzeye çıkması. 2015 haberi, 2024'te bir blog'da tekrar yayımlanıyor; sistem yeni gibi algılıyor.
- Tarafsız bağlamda olumsuz kelime. "Mehmet Yılmaz dolandırıcılık önleme uzmanı" cümlesinde "dolandırıcılık" kelimesi var ama bağlam olumsuz değil.
Azaltma teknikleri:
- Multi-attribute disambiguation: İsim + yaş + şehir + meslek birleşik karşılaştırma. Sadece isim üzerinden eşleşme threshold'u düşük tutulur.
- Aspect-based sentiment: Kelime düzeyinde değil, müşterinin haber içindeki rolüne göre sentiment ölçümü.
- Source tier ağırlığı: Reuters, BBC, Bloomberg gibi birinci sınıf kaynaklara daha yüksek güvenilirlik; tartışmalı bloglara düşük.
- Tarihsel deduplikasyon: Aynı olayı kapsayan haberler tek vakaya bağlanır.
- Continuous learning: Analistin "false positive" işaretlediği vakaların pattern'i öğrenilir, benzerleri otomatik filtrelenir.
False positive nasıl azaltılır makalemizde bu teknikler ayrıntılı.
Türkiye'de Adverse Media için Pratik Hedefler
Türkiye odaklı adverse media programının tipik kapsamı ve hedefleri:
Kaynak kapsamı:
- Ulusal birinci tier: Reuters TR, BBC TR, AFP TR, AP, Anadolu Ajansı, BloombergHT
- Ulusal gazete: Hürriyet, Milliyet, Sabah, Cumhuriyet, Sözcü, Karar, Habertürk
- Sektör basını: Banka & Finans, Para Dergisi, Capital, Ekonomist, BloombergHT, Dünya Gazetesi, Bes Magazin (kripto için), Kripto Para Haberleri
- Resmi kaynaklar: Resmi Gazete (yasal kararlar), Adalet Bakanlığı duyuruları, BDDK/SPK/MASAK bültenleri, sermaye piyasası bültenleri
- Yerel/bölgesel: önemli müşteri kitlesinin bulunduğu illerin yerel gazeteleri
Hedef metrikleri:
- Kaynak gecikmesi (haberin yayınından sistemde işlenmesine kadar): <6 saat
- Yüksek riskli müşteri için günlük tarama
- Standart müşteri için haftalık tarama
- Vaka önceliklendirme zamanı: <2 saat
- Analist case kapanış SLA: 24-48 saat
- Bağlam doğru atfetme oranı: %90+
- False-positive oranı: %50 altı (NLP filtreleme sonrası)
Operasyonel hatırlatmalar:
- Türkçe haber kaynaklarının çoğu copyright ve scraping politikası katı; RSS veya resmi API üzerinden toplama tercih edilmeli
- Sosyal medya (X/Twitter, LinkedIn) düşük güvenilirlik kaynağıdır — adverse media için ana kaynak değil, doğrulama amaçlı kullanılır
- Hukuki Türkçe metinler için ayrı NLP fine-tuning gerekli olabilir (örn. mahkeme kararı metni)
Operasyonel Akış: Adverse Media Hit Sonrası
- Vaka oluşturma. NLP sistemi bir adverse media vakası tespit ettiğinde case management sistemine düşer; kaynak haber linkler, kategori, müşteri ID, skor ile birlikte.
- Analist incelemesi. Analist haberin tamamını okur; müşteri profili ile karşılaştırır.
- Karar. True positive (gerçekten bu kişi/şirket): risk profili güncellenir, EDD uygulanır, gerekirse hesap incelemeye alınır. False positive: vaka kapatılır, eşleşme örüntüsü öğrenme sistemine geçer.
- STR değerlendirmesi. Adverse media bulgu, eğer şüpheli işlem işaretiyle birleşirse MASAK'a şüpheli işlem raporu (STR) sunulur. Tek başına haber STR için yeterli değil; ama işlem örüntüsü ile birlikte güçlü sinyal.
- Belgelendirme. Tüm karar süreci 8 yıl saklanır (5549 sayılı Kanun).
Sıkça Sorulan Sorular
Adverse media taraması zorunlu mu?
5549 sayılı Kanun "adverse media taraması" terimini doğrudan kullanmaz, ama Enhanced Due Diligence kapsamında "kamuya açık olumsuz bilgi" değerlendirmesini şart koşar. AB AMLD5 Article 18a ve FATF Recommendation 12 aynı çerçevede. Pratikte: yüksek riskli müşteriler (PEP, yüksek riskli ülke vatandaşı, yüksek hacim) için zorunlu; düşük riskli müşteriler için risk-bazlı yaklaşımla periyodik tarama.
Türkçe içerik için hangi kaynaklar taranmalı?
Birinci derece: Reuters Türkçe, BBC Türkçe, Bloomberg HT, Anadolu Ajansı, Demirören grup (Hürriyet, Milliyet), Demirören grup-dışı (Sabah, Cumhuriyet, Sözcü), sektör yayınları (Banka & Finans, Para Dergisi, Kripto Para Haberleri). İkinci derece: T.C. Resmi Gazete (yasal kararlar), Adalet Bakanlığı duyuruları, sermaye piyasası bültenleri. Üçüncü derece: belirli bloglar, sektör forumları — ama bu kaynaklara düşük güvenilirlik ağırlığı verilmeli.
Adverse media sonucu MASAK STR'sini tetikler mi?
Tek başına genelde tetiklemez. Haber bir iddia veya soruşturma evresini gösterir; STR ise "şüpheli işlem" raporudur — yani belirli bir işlem örüntüsünün şüpheli olduğunu gösterir. Adverse media + işlem örüntüsü birlikte değerlendirilir. Bir müşterinin yolsuzluk soruşturmasında olduğunu öğrendiğinizde ve hesap hareketleri normal olmayan transfer örüntüsü gösterdiğinde, ikisi birlikte STR'yi destekler.
Otomatik adverse media tarama yeterli mi yoksa manuel review da gerekir?
Otomasyon kapsama sağlar (milyonlarca makale tarama), insan yargısı bağlam doğrulamasını yapar. İdeal akış: NLP sistemi otomatik tarama ve önceliklendirme yapar; eşik üzeri vakalar analiste düşer; analist 2-5 dakika içinde karar verir. Sadece otomasyon = false-positive seli; sadece manuel = ölçeklenemez.
Adverse media veritabanı vendor mi içyapım mı?
Geleneksel pratikte vendor (Dow Jones, Refinitiv, ComplyAdvantage). Vendor binlerce kaynaktan haber çeker, NLP yapar, normalize eder, alias yönetir. İçyapım daha ucuz görünür ama haber kaynağı lisansları + NLP pipeline + sürekli model güncelleme maliyeti hızlıca vendor maliyetini aşar. KOBİ ve orta-büyüklük kurumlar için vendor mantıklı; sadece büyük tier-1 bankalarda in-house ekonomisi tutar.
Legichain ile Adverse Media
Legichain AML tarama API'si adverse media taramasını yaptırım ve PEP taramasıyla aynı endpoint üzerinden sunar. Türkçe NLP pipeline'ı yerel haber kaynakları için ayrı kalibre edilmiştir: Türkçe morfolojik analiz, lakap çözümleme, hukuki dil tanıma, sektör terminolojisi.
Bağlam ayırımı (sanık vs tanık vs hâkim ayrımı) zero-shot classifier ile yapılır; analiste "müşteri haberde X rolünde geçiyor" şeklinde önceden etiketlenmiş vaka düşer. Match grouping ile aynı olayın farklı haber kaynaklarındaki tekrarları tek vakada birleşir.
