Sjednocení a vyčištění značných objemů klientských dat

01. června 2013

Díky skokovému zlepšení datové kvality nabízí Česká pošta zákazníkům lepší služby

POTŘEBA: Jak skrze „zlatý záznam“ získat pravdivé a komplexní informace o zákaznících?

Datová kvalita patří ke klíčovým faktorům efektivity a plánování marketingových kampaní v jakékoli firmě. Závisí na ní rozvíjení kvality stávajících i zavádění nových služeb či systémů, zajištění pravidelných obsílek (např. měsíčních výpisů) nebo zajištění procesů spojených s GDPR.

Protože se v průběhu let databáze zákaznických kontaktů přirozeně rozrůstají a přibývají další systémy a zdroje dat, narůstá i množství nekonzistencí v těchto datech. A přesně to je moment, kdy je pro firmu životně důležité se na datovou kvalitu zaměřit.

Tak tomu bylo i u České pošty, která se na Trask obrátila, abychom pro ni nalezli řešení unifikace a čištění klientských dat v datovém skladu a propojení relevantních klientských záznamů z různých zdrojů.

Česká pošta totiž původně data z různých systémů denně importovala do datového skladu (DWH) do shodných cílových tabulek. Vzhledem k existujícím rozdílům v rozsahu a způsobu uložení informací ve zdrojových systémech docházelo ke vzniku rozdílů v údajích v DWH. Tyto rozdíly měly samozřejmě negativní dopad na následné zpracování dat.

Hlavním cílem bylo proto zajistit automatické čištění a konsolidaci zákaznických dat z klientských rejstříků, a to jak v pravidelném dávkovém režimu, tak ve formě online služby umožňující unifikaci každého záznamu zadaného prostřednictvím front-endových systémů České pošty.

Naším úkolem dále bylo vymyslet, jak naložit s chybně vyplněnými a neúplnými záznamy, s neplatnými údaji či duplicitami, a jak jednorázově zlepšit datovou kvalitu a celý problém následně vyřešit natrvalo.

Všechny tyto problémy efektivně řeší moderní technologie SAS Data Quality, kterou jsme v České poště úspěšně implementovali.

ŘEŠENÍ: Platforma SAS Data Quality automatizovaně vyčistila klientská data (z více než 92 %!)

Datová kvalita je pro nás jedním z důležitých předpokladů pro další zlepšování našich služeb klientům. Ve společnosti Trask solutions jsme našli partnera, jehož zkušenosti v oblasti Business Intelligence v kombinaci s osvědčenou technologií od firmy SAS nám umožnily dosáhnout nejen adekvátního zlepšení datové kvality, ale také zajistit si její udržení do budoucna.
Ing. Jiří Baták – Ředitel odboru Business Inteligence Česká pošta, s.p

Díky osvědčené softwarové platformě SAS Data Quality (společnost SAS byla garantem projektu), která poskytuje prověřené nástroje pro čištění a unifikaci dat, Česká pošta získala vyspělý nástroj zaměřený na řešení praktických problémů datové kvality, pro dávkovou a online unifikaci a čištění klientských dat v datovém skladu.

Platforma SAS Data Quality nám umožnila:

 • Vyčistit a ověřit klientská data proti dostupným externím i interním rejstříkům
 • Konsolidovat data do skupin reprezentujících jednoho klienta
 • Vytvořit službu pro front-end systémy zajišťující online validaci a ukládání dat
 • Umožnit manuální zpracování výjimek
 • Garantovat kvalitu vyčištění klientských dat vyšší než 92 %

Při bližším pohledu se jednalo o tyto oblasti:

 • Čištění, standardizace, normalizace a identifikace typu dat (příkladem může být vyčištění adres, odstranění běžných překlepů, validace telefonů, e-mailových adres, konsolidace dat do skupin reprezentujících jednoho klienta atd.)
 • Unifikace, clustering, deduplikace dat, vytváření referenčních (master) záznamů; verifikace vůči externím zdrojům (například ověření jména a příjmení proti externím rejstříkům)
 • Přístup do unifikované master databáze prostřednictvím administračního rozhraní (administrační rozhraní umožňuje i pokročilé vyhledávání a manuální zásahy do klientských záznamů a klientských skupin)
 • Vytváření, správa a monitorování business pravidel pro obsah a kvalitu dat; propojování dat z více zdrojů (díky integraci na různé zdrojové systémy lze provést například párování adres na databázi doručovacích míst)

Hlavní přínosy

Česká pošta získala díky využití SAS Data Quality robustní platformu pro datovou kvalitu a Master Data Management.

Mezi hlavní přínosy patří zejména:

 • Využití předního technologického řešení pro udržování a zvyšování datové kvality
 • Transparentnost a kontrola nad řešením ze strany klienta
 • Garance rozvoje a podpory ze strany stabilní nadnárodní společnosti

Naše cesta k řešení

Nejprve bylo třeba vytvořit automatické čistící a unifikační mechanismy, které:

 • Čistí zákaznická data uložená ve strukturách datového skladu
 • Jsou zapojeny do pravidelných ETL procesů v prostředí České pošty a umožňují automatické dávkové čištění zdrojových dat všech integrovaných systémů,
 • Ve formě služby zajišťují proaktivní online čištění a unifikaci zákaznických dat (tyto služby slouží jako rozhraní pro front-end systémy České pošty do unifikované master databáze).

Dalším krokem bylo vytvoření vyspělé a komplexní funkcionality pro zajištění datové kvality a Master Data Managementu se zaměřením na business uživatele (námi poskytnuté řešení nevyžaduje speciální znalosti kódování a poskytuje uživateli možnost snadné definice a úpravy businessových či unifikačních pravidel datové kvality a jejich aplikace na data).

Důraz jsme kladli na uživatelsky přístupnou a přehlednou znalostní bázi datové kvality, stejně jako na intuitivní a přehlednou správu všech složek a komponent řešení (produkt je vybaven přehledným grafickým rozhraním, které je dobře pochopitelné pro technicky i businessově orientované pracovníky klienta).

A samozřejmě jsme zajistili i potřebný vysoký výkon nezbytný pro zpracování enormních objemů dat. České poště jsme zároveň poskytli i lokální konzultační i technickou podporu.

Závěr

S využitím platformy SAS Data Quality jsme České poště poskytli vyspělý, vysoce výkonný nástroj, který odstraňuje problémy spojené s kvalitou velkých objemů zákaznických dat. Konkrétně se jedná o dávkovou a online unifikaci a vyčištění klientských dat v datovém skladu.

Výhodou řešení je snadná ovladatelnost a uživatelská přístupnost nejen pro technicky orientované, ale i pro businessově založené uživatele.

Jsme hrdí na to, že díky našemu řešení Česká pošta dosáhla kvality vyčištění klientských dat převyšující 92 %, k čemuž jsme se při zadání projektu zavázali.