
×
Klassifikation unvollständiger Datensätze am Beispiel des Konsumenten-Kreditgeschäfts
Risiko, Versicherung und Finanzierung
von Wolfgang Kossa, herausgegeben von Bernahrd Kromschröder und Jochen WilhelmKossa stellt verschiedene Verfahren zur Klassifikation unvollständiger Datensätze dar und entwickelt auf der Grundlage eines Methodenvergleichs Handlungsempfehlungen für den praktischen Einsatz.
Als Beispiel wird das Konsumenten-Kreditgeschäft betrachtet, das die Zuordnung eines Kreditantragstellers entweder in die Klasse der „guten“ oder in die Klasse der „schlechten“ Kreditfälle beschreibt. Um die Klassenzugehörigkeit eines Antragstellers zu schätzen, wird ein erhobener - ggf. durch missing values (MV) - unvollständiger Merkmalsvektor ausgewertet. Zu diesem Zweck werden Analyseverfahren entwickelt, die in der Lage sind, unvollständige Merkmalsvektoren unvorbehandelt und damit unverfälscht zu klassifizieren.
Ausgehend von der quadratischen Diskriminanzanalyse (QDA) wird eine sogenannte MV-verträgliche Diskriminanzanalyse („MV-DA“) entwickelt, die auf erwarteten Diskriminanzwerten basiert. Aus dem Bereich Neuronaler Netze werden die Netzwerktypen RBF („radial basis function“), LVQ („learning vector quantization“) und SOM („self-organizing maps“) als Verfahren identifiziert, die mit geringen Anpassungen unvollständige Merkmalsvektoren klassifizieren können.
In der systematischen empirischen Untersuchung werden die genannten Verfahren MV-DA, RBF, LVQ und SOM und außerdem, nach Ersetzung der missing values durch Mittelwerte, die Verfahren QDA und MLP („multi-layer perceptron“) hinsichtlich ihrer Klassifikationsquote bei variierender Anzahl an missing values verglichen. Die hohe Leistungsfähigkeit sowie die leichte Implementierungsmöglichkeit machen einzelne Verfahren problemlos anwendbar und lassen auf hohe Praxis-Relevanz schließen.
Als Beispiel wird das Konsumenten-Kreditgeschäft betrachtet, das die Zuordnung eines Kreditantragstellers entweder in die Klasse der „guten“ oder in die Klasse der „schlechten“ Kreditfälle beschreibt. Um die Klassenzugehörigkeit eines Antragstellers zu schätzen, wird ein erhobener - ggf. durch missing values (MV) - unvollständiger Merkmalsvektor ausgewertet. Zu diesem Zweck werden Analyseverfahren entwickelt, die in der Lage sind, unvollständige Merkmalsvektoren unvorbehandelt und damit unverfälscht zu klassifizieren.
Ausgehend von der quadratischen Diskriminanzanalyse (QDA) wird eine sogenannte MV-verträgliche Diskriminanzanalyse („MV-DA“) entwickelt, die auf erwarteten Diskriminanzwerten basiert. Aus dem Bereich Neuronaler Netze werden die Netzwerktypen RBF („radial basis function“), LVQ („learning vector quantization“) und SOM („self-organizing maps“) als Verfahren identifiziert, die mit geringen Anpassungen unvollständige Merkmalsvektoren klassifizieren können.
In der systematischen empirischen Untersuchung werden die genannten Verfahren MV-DA, RBF, LVQ und SOM und außerdem, nach Ersetzung der missing values durch Mittelwerte, die Verfahren QDA und MLP („multi-layer perceptron“) hinsichtlich ihrer Klassifikationsquote bei variierender Anzahl an missing values verglichen. Die hohe Leistungsfähigkeit sowie die leichte Implementierungsmöglichkeit machen einzelne Verfahren problemlos anwendbar und lassen auf hohe Praxis-Relevanz schließen.