Identification de noms lies

Identifying related names

Abstract

A system (100) that identifies related names includes a datastore (132) that persistently stores a collection of names. At least one name within the datastore (132) is represented both by a native orthographic form of the name and by a transliterated form of the native orthographic form of the name. The system (100) includes an input interface (110) that is structured and arranged to receive at least an input name. A transliteration module (120) is structured and arranged to produce at lease one transliterated form of the input name. An identifier is structured and arranged to identify at least one name from within the datastore (132) that relates to the transliterated form of the input name. An output interface (110) presents the at least one name identified from within the datastore (132) as being related to the input name. This system (100) may dynamically select the transliteration schema (122) to be applied to the input name from among candidate potential transliteration schemas based on various criteria, including (1) characteristics of the input name such as geographic or linguistic indicators inherent thereto (124), (2) characteristics of a pool of names against which the input name is matched (126), and/or (3) data extrinsic to the input name or pool of names which may be useful in identifying geographic or linguistic characteristics of the party from whom the input name is received (128).
Selon la présente invention, un système (100) d'identification de noms liés comprend un magasin de données (132) servant à stocker continuellement un recueil de noms. Au moins un nom au sein du magasin de données (132) est représenté par une forme orthographique d'origine du nom et par une forme translittérée de la forme orthographique d'origine du nom. Ce système (100) comprend une interface d'entrée (110) structurée et conçue pour recevoir au moins un nom d'entrée. Un module de translittération (120) structuré et conçu pour produire au moins une forme translittérée du nom d'entrée. Un identificateur est structuré et élaboré pour identifier au moins un nom du magasin de données (132) qui a trait à la forme translittérée du nom d'entrée. Une interface de sortie (110) présente le nom identifié du magasin de données (132) tel que lié au nom d'entrée. Ce système (100) peut sélectionner dynamiquement le schéma de translittération (122) à appliquer au nom d'entrée parmi des schémas de translittération potentiels candidats reposant sur divers critères, notamment (1) des caractéristiques du nom d'entrée tel que des indicateurs géographiques ou linguistiques inhérents (124), (c) des caractéristiques d'un groupe de noms auquel est amené à correspondre (126) le nom d'entrée, et/ou (3) des données extrinsèques au nom d'entrée ou au groupe de noms qui peuvent être utilisées dans l'identification de caractéristiques géographiques ou linguistiques de la partie, d'où est reçu (128) le nom d'entrée.

Claims

Description

Topics

Download Full PDF Version (Non-Commercial Use)

Patent Citations (0)

    Publication numberPublication dateAssigneeTitle

NO-Patent Citations (3)

    Title
    HERMANSEN: 'Automatic name searching in large data bases of international names.' DOCTORIAL DISSERTATION 1985, pages 1 - 141
    OSHIKA B.T. ET AL: 'Improved retrieval of foreign names from large databases.' IEEE 1981, pages 480 - 487, XP010011446
    See also references of EP 1692626A1

Cited By (0)

    Publication numberPublication dateAssigneeTitle