Baza kodów pocztowych WASKO S.A.
Zaloguj się do baz wiedzy
 
 

Deduplikacja


Deduplikacja danych polega na identyfikacji powtarzających się rekordów, pomimo występowania drobnych różnic pomiędzy nimi. Duplikacja danych powstaje podczas ręcznego wprowadzenia błędnych literowo danych, przy łączeniu różnych baz. Przy pomocy złożonych algorytmów baza jest skanowana w celu odnalezienia podobnych rekordów oraz oceniane jest ich podobieństwo. Wyszukane pary klasyfikowane są do poszczególnych grup według podziału na rekordy typu:
• takie same
• podobne
• różne

Deduplikacja danych pozwala na oznaczanie podwójnych rekordów , następnie umożliwia ich usunięcie, co pozwala na zmniejszenie ilości wymaganej pamięci do przechowywania danych.

Schemat działania deduplikacji danych:
Schemat działania deduplikacji danych
 

Doświadczenie



Mamy już 10 lat doświadczenia w prowadzeniu marketingowych baz danych


Profesjonalizm



Najbardziej kompleksowa, rozbudowana i aktualna baza miejscowości w Polsce. Źródło danych słownikowych gotowe do wykorzystania w systemach informatycznych

Zaufanie



Dotychczas nasze produkty wybrało ponad 1000 firm i instytucji, takie zaufanie zobowiązuje
 
Wszelkie prawa zastrzeżone - WASKO S.A. 1998-2017