Daten gegeneinander abgleichen, doppelte Adressen und Dubletten eliminieren
Gute Daten sind die Basis von gutem Marketing. Und eine intelligente Suche nach doppelten Adressen und Dubletten ist der beste Weg dorthin. Denn nur so lassen sich Mehrfachsendungen zuverlässig vermeiden. Und nur so kann dem Wunsch einzelner Personen keine Werbung zu erhalten entsprochen werden, was spätestens seit der DSGVO unumgänglich ist. Und wenn die einzelnen Werbeaktionen dann noch untereinander, mit dem eigenen Kundenstamm und sonstigen Daten abgeglichen werden, dann sollte dem Erfolg Ihres Marketings nichts mehr im Wege stehen.
Intelligente Suche nach Dubletten / Duplikaten
Gefunden werden nicht nur exakte Treffer, bei denen Zeichen für Zeichen übereinstimmt, sondern auch unscharfe Dubletten und doppelte Adressen. Berücksichtigt werden dabei insbesondere:
- Tippfehler
- Abweichungen in der Schreibweise
- Auslassungen und Ergänzungen
- vertauschte Worte
- Abkürzungen
- Kosenamen / Spitznamen
Alles was man für die Bereinigung von Daten braucht:
- Suche nach Dubletten / Duplikaten innerhalb von einer Tabelle.
- Abgleich zweier Tabellen gegeneinander um deren Schnittmenge zu bestimmen. Auf diese Weise können beispielsweise Werbeverweigererlisten berücksichtigt oder Adresslisten synchronisiert werden.
- Suche nach Dubletten / Duplikaten über die postalische Adresse (Adressabgleich), die Telefonnummer, die Email-Adresse oder ein beliebiges anderes Kriterium.
- Der unscharfe / fehlertolerante Abgleich kommt sowohl mit Firmennamen als auch mit Adressen von Privatpersonen zurecht.
Zahlreiche Möglichkeiten das Ergebnis zu verwenden:
- Die Dubletten / Duplikate können in der Ursprungstabelle gelöscht werden. Alternativ dazu können die bereinigten Daten auch in eine neue Datei geschrieben werden.
- Die gefundenen Dubletten / Duplikate können in der Ursprungstabelle markiert werden.
- Das Ergebnis kann zum anreichern von Daten verwendet werden. Beispielsweise könnte so eine Telefonnummer aus einer zweiten Tabelle anhand des Abgleichsergebnisses in die erste Tabelle übertragen werden.
- Das Ergebnis kann mithilfe der Funktionalität einer beliebigen gespeicherten Prozedur aus der Datenbank verarbeitet werden.
- Es können diverse Protokolle und Listen erstellt werden.
Benutzerfreundlich und kostengünstig:
- Kein technisches Wissen erforderlich. Unsere Produkte sind so gestaltet, dass Sie unseren kostenlosen Support hoffentlich nie benötigen werden.
- Überzeugen Sie sich selbst. Testen Sie unsere Produkte eine Woche lang kostenlos und ohne jede Einschränkung.
- Lokale Verarbeitung der Daten. Es ist keine Weitergabe von Daten an einen externen Dienstleister nötig, was die Einhaltung der Datenschutzgrundverordnung (DSGVO) vereinfacht.
- Bei Dienstleistern zahlen Sie für jedes Projekt einzeln, für unsere Software nur ein einziges mal. Und das bei einem hervorragenden Preis-Leistungsverhältnis. (Preise)
Schnell, flexibel und sicher:
- Auch für große Datenbanken geeignet. Parallele und damit besonders schnelle Verarbeitung auf Systemen mit mehreren Prozessorkernen.
- Datenquellen (Adresslisten und Datenbanken): Excel, Access, MS SQL Server, Azure SQL, ORACLE, MySQL, MariaDB, PostgreSQL, OpenOffice Calc, LibreOffice, dBase, CSV- und Textdateien.
- Alle Programmdateien sind digital signiert. Damit ist sicher gestellt, dass diese unverändert sind und auch tatsächlich von uns stammen. Diese digitale Signatur können Sie leicht prüfen: Eigenschaften der Programmdatei (erreichbar über die rechte Maustaste) -> Digitale Signaturen -> Details -> Zertifikat anzeigen -> Details -> Antragsteller
Weitere Funktionen zum verbessern der Datenqualität:
- Funktionen zum selektieren und anreichern von Daten
- Bestimmen des Geschlechts anhand des Vornamens.
- Ermitteln der Anrede für einen Brief.
- Löschen ausgewählter Datensätze.
- Format der Postleitzahl korrigieren.
- Zusammenfassen von Tabellen.
- Zusammenfassen und zerlegen von Datenfeldern.
- und vieles mehr ...
Unsere Software:
- DataQualityTools 8: Unser Rundum-sorglos-Paket für den Dublettenabgleich und das verbessern der Datenqualität. Weitere Informationen
- DedupeWizard 8: Unser Basisprodukt für die Suche nach doppelten Adressen in Excel. Weitere Informationen
- BatchDeduplicator 8: Unsere Lösung für die regelmäßige Datenbereinigung. Weitere Informationen
KI oder keine KI?
Der Algorithmus, den unsere Produkte für das Auffinden von Dubletten verwenden basiert nicht auf künstlicher Intelligenz im Sinne von maschinellem Lernen. Stattdessen wird hierfür ein komplexer regelbasierter Algorithmus eingesetzt. Dieser hat im Vergleich zu maschinellem Lernen den Vorteil, dass er effizienter ist und dadurch weniger Rechenleistung benötigt. Außerdem sind die Ergebnisse eines solchen Algorithmus reproduzierbar. Die Qualität des Ergebnisses bleibt immer gleich. Bei einem eng umgrenzten Problem wie dem Auffinden von doppelten Adressen in Adresslisten ist ein solcher Algorithmus in der Regel die bessere Wahl.
DataQualityTools 8
Gegenüber dem DedupeWizard bieten die DataQualityTools mehr Möglichkeiten bei der Suche nach doppelten Datensätzen (Dublettensuche / Dublettenabgleich / Adressabgleich / Dublettenprüfung) und darüber hinaus noch eine ganze Reihe an weiteren Funktionen zum aufbereiten von Adressdaten / Adresslisten, beispielsweise eine Funktion zum prüfen der persönlichen Anrede einer Adresse auf der Basis des Vornamens. Verarbeitet werden können neben Excel-Dateien auch ACCESS, OpenOffice / LibreOffice Calc, dBase, CSV- und Textdateien und Datenbankserver wie der MS SQL Server, ORACLE, MySQL, MariaDB und PostgreSQL. weitere Informationen ...
DedupeWizard 8
Ein übersichtliches, ohne viel Fachwissen zu bedienendes Programm für die Suche nach Dubletten / Duplikaten in Excel. Nach Dubletten gesucht werden kann über die postalische Adresse, die Telefonnummer und/oder die Email-Adresse und zwar innerhalb von einer Tabelle oder aber zwischen zwei Tabellen, wie es beispielsweise für Werbeverweitererlisten und Robinsonlisten benötigt wird. Wenn die Dublettensuche / Dublettencheck / Dublettenprüfung über die postalischen Adresse - also Name, Straße, Postleitzahl und Ort – durchgeführt wird, dann werden bei dem Vergleich Tippfehler, Ergänzungen und vertauschte Worte berücksichtigt. Es handelt sich also um eine fehlertolerante / unscharfe Suche nach Duplikaten. weitere Informationen ...
BatchDeduplicator 8
Der BatchDeduplicator enthält im Wesentlichen die gleichen Funktionen für den Dublettenabgleich (Dublettensuche / Adressabgleich / Dublettencheck) wie auch die DataQualityTools. Wie auch bei den DataQualityTools können große Datenbanken (mögliche Datenquellen: Excel, ACCESS, dBase, OpenOffice / LibreOffice Calc, CSV-Dateien, Textdateien, MS SQL Server, MySQL, MariaDB, PostgreSQL und ORACLE) verarbeitet werden, einige Millionen Datensätze stellen dabei in der Regel kein Problem dar. Die Projekte können geplant und mit einem Ausführungszeitpunkt versehen werden, um so zum Beispiel jeden Dienstag um 17:00 Uhr ausgeführt zu werden. weitere Informationen ...
Bessere Daten müssen nicht teuer sein.