In Zeiten wachsender Globalisierung und Internationalisierung ist die korrekte Zeicheninterpretation beim Data Entry sowie dem Dublettenabgleich von entscheidender Bedeutung für die Qualität von Kunden- und Adressdaten. Um vor diesem Hintergrund potenzielle Probleme mit unterschiedlichen Zeichensätzen und ihrer Darstellung von vornherein zuverlässig auszuschließen, hat Uniserv seine Abgleichsoftware mailBatch (sequentieller Dublettenabgleich) und mailRetrieval (interaktiver Dublettencheck und fehlertolerante Dublettensuche) sowie das gesamte Produktportfolio ab sofort Unicode-fähig gemacht. So ist beispielsweise im Rahmen der Dublettenbehandlung zu jeder Zeit sichergestellt, dass neben Sprachen wie Chinesisch, Russisch oder Griechisch mit ihren jeweiligen Zeichensätzen auch Hebräisch, Katakana, Hiragana sowie Hangul und weitere unterstützt werden. Die hierzu via Internet verfügbare Demo (www.uniserv.com/demo) zeigt auf der Basis realer Testfälle exemplarisch, welche hochwertige und somit im internationalen High-End-Datenqualitätsmanagement verwertbare Ergebnisqualität sich so erzielen lässt.
Unicode ist ein internationaler Standard, innerhalb dessen langfristig für jedes Sinn tragende Zeichen beziehungsweise Textelement aller bekannten Schriftkulturen und Zeichensysteme ein einheitlicher digitaler Code festgelegt ist – system-, programm- und sprachunabhängig. Auf diese Weise lässt sich das Problem der verschiedenen inkompatiblen Kodierungen der einzelnen Länder mit ihren Sprachen und Zeichensätzen beseitigen. Dabei wird jedes Zeichen mit 16 Bit in Form von Nummern dargestellt, nicht als einzelne Buchstaben. Für die Wiedergabe am Bildschirm werden diese Nummern dann in die entsprechenden Textzeichen zurückverwandelt. Weitere Informationen sind unter www.unicode.org erhältlich.
Die Demo zeigt anschaulich die Bedeutung der Unicode-Fähigkeit für international einsetzbare Abgleichsoftware auf. Ohne diese Zeicheninterpretation könnten beispielsweise chinesische Fälle gar nicht eingegeben und verarbeitet werden. Dies allein reicht jedoch noch nicht aus: Sehr häufig enthalten die Datenbanksysteme weltweit agierender Konzerne Adressen, die sowohl in lateinischen als auch in sprachspezifischen Zeichen gespeichert sind. Daher ist es von enormer Bedeutung, dass das Programm auch die jeweilige Schrift versteht und das Wissen darüber vorhanden ist, wie die jeweiligen Adressdaten üblicherweise mit lateinischen Buchstaben umschrieben werden – in diesem Zusammenhang spricht man von Transliteration. Wie aus der Demo ersichtlich, decken die Uniserv-Lösungen diese Anforderungen ebenfalls ab und sind beim Abgleich auch dann erfolgreich, wenn eine Adresse im jeweiligen nationalen Zeichensatz und die zugehörige Dublette in lateinischen Zeichen vorliegt.
Die Lösungen
Länder- und plattformunabhängig stehen mailBatch und mailRetrieval in speziellen Versionen für den Abgleich von Business- und Consumer-Adressen zur Verfügung. Die Business-Versionen erkennen neben den herkömmlichen Adresselementen zusätzlich unternehmensbezogene Bestandteile und berücksichtigen firmenspezifisch beim Abgleich weitere Eingabefelder wie Firmenname, Rechtsform, Homepage, beschreibende Unternehmenszusätze, geografische Angaben und Akronyme. In Bezug auf den Ansprechpartner innerhalb eines Unternehmens werden auch Felder wie Abteilung und Titel erkannt und abgeglichen. Der Einsatz der Business-Version empfiehlt sich für den Abgleich reiner Business-Bestände sowie gemischter Consumer- und Business-Daten mit einem Anteil von Firmenadressen ab etwa 30 Prozent.
Sie muessen eingeloggt sein um einen Kommentar zu schreiben Einloggen