Zaloguj się do baz wiedzy

Deduplikacja

Deduplikacja danych polega na identyfikacji powtarzających się rekordów, pomimo występowania drobnych różnic pomiędzy nimi. Duplikacja danych powstaje podczas ręcznego wprowadzenia błędnych literowo danych, przy łączeniu różnych baz. Przy pomocy złożonych algorytmów baza jest skanowana w celu odnalezienia podobnych rekordów oraz oceniane jest ich podobieństwo. Wyszukane pary klasyfikowane są do poszczególnych grup według podziału na rekordy typu:
• takie same
• podobne
• różne

Deduplikacja danych pozwala na oznaczanie podwójnych rekordów , następnie umożliwia ich usunięcie, co pozwala na zmniejszenie ilości wymaganej pamięci do przechowywania danych.

Schemat działania deduplikacji danych:

Doświadczenie

Mamy już 10 lat doświadczenia w prowadzeniu marketingowych baz danych

Profesjonalizm

Najbardziej kompleksowa, rozbudowana i aktualna baza miejscowości w Polsce. Źródło danych słownikowych gotowe do wykorzystania w systemach informatycznych

Zaufanie

Dotychczas nasze produkty wybrało ponad 1000 firm i instytucji, takie zaufanie zobowiązuje

o firmie |informacje prasowe | praca | napisz do nas | hosting

Wszelkie prawa zastrzeżone - WASKO S.A. 1998-2017