Daten abgleichen, exakt & unscharf,
Dubletten eliminieren
und vieles mehr

Es gibt viele Wege um zu besseren Daten zu gelangen. Eine intelligente Suche nach Dubletten und doppelten Adressen ist einer davon. Denn abweichende Schreibweisen machen es oft schwer zwei Datensätze, die eigentlich zusammen gehören, einander zuzuordnen.

Abgleichsergebnis

Intelligente Suche nach Dubletten

Gefunden werden nicht nur exakte Treffer, bei denen Zeichen für Zeichen übereinstimmt, sondern auch unscharfe Dubletten / Duplikate und doppelte Adressen. Berücksichtigt werden dabei insbesondere:

  • Tippfehler
  • Abweichungen in der Schreibweise
  • Auslassungen und Ergänzungen
  • vertauschte Worte
  • Abkürzungen
  • Kosenamen / Spitznamen

Alles was man für die Bereinigung von Daten braucht:

  • Suche nach Dubletten innerhalb von einer Tabelle.
  • Abgleich zweier Tabellen gegeneinander, um deren Schnittmenge zu bestimmen. Auf diese Weise können beispielsweise Werbeverweigererlisten berücksichtigt, Tabellen synchronisiert oder Daten angereichert werden.
  • Suche nach Dubletten / Duplikaten über die postalische Adresse, die Telefonnummer, die Email-Adresse oder ein beliebiges anderes Kriterium.
  • Der unscharfe / fehlertolerante Abgleich kommt sowohl mit Firmennamen als auch mit Adressen von Privatpersonen zurecht.

Weitere Funktionen zum verbessern der Datenqualität:

  • Funktionen zum selektieren und anreichern von Daten.
  • Bestimmen des Geschlechts anhand des Vornamens.
  • Ermitteln der Anrede für einen Brief.
  • Format der Postleitzahl korrigieren.
  • Zusammenfassen von Tabellen.
  • Zusammenfassen und zerlegen von Datenfeldern.
  • und vieles mehr ...

Zahlreiche Möglichkeiten das Ergebnis zu verwenden:

  • Die gefundenen Dubletten können in der Ursprungstabelle gelöscht werden. Alternativ dazu können die bereinigten Daten auch in eine neue Datei geschrieben werden.
  • Die gefundenen Dubletten können in der Ursprungstabelle markiert werden.
  • Das Ergebnis kann zum anreichern von Daten verwendet werden. Beispielsweise könnte so eine Telefonnummer aus einer zweiten Tabelle anhand des Abgleichsergebnisses in die erste Tabelle übertragen werden.
  • weitere Informationen ...

Benutzerfreundlich und kostengünstig:

  • Kein technisches Wissen erforderlich. Unsere Produkte sind so gestaltet, dass Sie unseren kostenlosen Support hoffentlich nie benötigen werden.
  • Überzeugen Sie sich selbst. Testen Sie unsere Produkte eine Woche lang kostenlos und ohne jede Einschränkung.
  • Lokale Verarbeitung der Daten. Es ist keine Weitergabe von Daten an einen externen Dienstleister nötig, was die Einhaltung der Datenschutzgrundverordnung (DSGVO) vereinfacht.
  • Bei Dienstleistern zahlen Sie für jedes Projekt einzeln, für unsere Software nur ein einziges mal. Und das bei einem hervorragenden Preis-Leistungsverhältnis. (Preise)

 Schnell, flexibel und sicher:

  • Auch für große Datenbanken geeignet. Parallele und damit besonders schnelle Verarbeitung auf Systemen mit mehreren Prozessorkernen.
  • Datenquellen (Adresslisten und Datenbanken): Excel, Access, MS SQL Server, Azure SQLOracle, MySQL, MariaDB, PostgreSQL, OpenOffice Calc, LibreOffice, dBase, CSV- und Textdateien.
  • Alle Programmdateien sind digital signiert. Damit ist sicher gestellt, dass diese unverändert sind und auch tatsächlich von uns stammen. Diese digitale Signatur können Sie leicht prüfen: Eigenschaften der Programmdatei (erreichbar über die rechte Maustaste) -> Digitale Signaturen -> Details -> Zertifikat anzeigen -> Details -> Antragsteller

KI oder keine KI?

Der Algorithmus, den unsere Produkte für das Auffinden von Dubletten verwenden basiert nicht auf künstlicher Intelligenz im Sinne von maschinellem Lernen. Stattdessen wird hierfür ein komplexer regelbasierter Algorithmus eingesetzt. Dieser hat im Vergleich zu maschinellem Lernen den Vorteil, dass er effizienter ist und dadurch weniger Rechenleistung benötigt. Außerdem sind die Ergebnisse eines solchen Algorithmus reproduzierbar. Die Qualität des Ergebnisses bleibt immer gleich. Bei einem eng umgrenzten Problem wie dem Auffinden von doppelten Adressen in Adresslisten ist ein solcher Algorithmus in der Regel die bessere Wahl.

Unsere Software:

  • DataQualityTools 8: Unser Rundum-sorglos-Paket für den Abgleich von Daten und das Verbessern der Datenqualität.

  • DedupeWizard 8: Unser Basisprodukt für die Suche nach doppelten Adressen in Excel.

  • BatchDeduplicator 8: Unsere Lösung für die regelmäßige Datenbereinigung. 

DataQualityTools

DataQualityTools 8

Die DataQualityTools helfen ihnen, ihre Daten und damit ihr Marketing zu verbessern. Zentraler Bestandteil sind die Funktionen zum Auffinden von doppelten Datensätzen. Diese können unter anderem auch dazu verwendet werden um Sperrlisten zu berücksichtigen, um Tabellen zu synchronisieren oder um Daten anzureichern. Darüber hinaus gibt es noch eine ganze Reihe an weiteren Funktionen zum Aufbereiten von Daten, beispielsweise eine Funktion für das Zusammenfassen von mehreren Tabellen oder eine Funktion zum Prüfen der persönlichen Anrede auf der Basis des Vornamens. Verarbeitet werden können Daten aus (fast) beliebigen Datenquellen. weitere Informationen ...

DedupeWizard

DedupeWizard 8

Ein übersichtliches, ohne viel Fachwissen zu bedienendes Programm für die Suche nach Dubletten in Excel. Die Suche nach Dubletten / Duplikaten kann dabei über die postalische Adresse, die Telefonnummer oder die Email-Adresse erfolgen. Neben der Suche innerhalb von einer Tabelle ist auch ein Abgleich zwischen zwei Tabellen möglich, wie es beispielsweise für die Berücksichtigung von Werbeverweigererlisten benötigt wird. Abweichende Schreibweisen, wie z.B. bei postalischen Adressen, stellen dabei kein Problem dar. Hinweis: Falls Ihnen die Funktionen die im DedupeWizard enthalten sind nicht ausreichen, dann sehen Sie sich bitte die DataQualityTools an. weitere Informationen ...

BatchDeduplicator

BatchDeduplicator 8

Der BatchDeduplicator ist ein Programm für die regelmäßige, nach einem festen Zeitplan durchgeführte Dublettenbereinigung von Datenbanken, um so die Qualität dieser Daten dauerhaft sicherzustellen. Darüber hinaus können Projekte auch ausgeführt werden, indem der BatchDeduplicator von der Kommandozeile aus aufgerufen wird. Dadurch lässt er sich beispielsweise in Batchdateien integrieren. Oder er wird über eine gespeicherte Prozedur von einem SQL Server aus aufgerufen. Verarbeitet werden können Daten aus (fast) beliebigen Datenquellen. weitere Informationen ...