Empfehlungen
A   B   C   D   E   F   G   H   I   J   K   L   M   N   O   P   Q   R   S   T   U   V   W   X   Y   Z  
  Home Top 10 Fachbereiche News Hilfe & FAQ
 

Clusteranalyse

Verfahren, mit dem eine umfangreiche Menge von Elementen durch Bildung homogener Klassen, Gruppen oder »Cluster« optimal strukturiert werden soll. Elemente eines Clusters sollen möglichst ähnlich, Elemente unterschiedlicher Cluster möglichst unähnlich sein.

Verfahren der multivarianten Analyse, dessen Aufgabe es ist, Mengen von Objekten bei gleichzeitiger Betrachtung aller erfaßten Merkmale (Variablen, Eigenschaften) so in Teilmengen (Cluster) zu zerlegen, daß die zu demselben Cluster gehörenden Objekte untereinander möglichst ähnlich und die zu verschiedenen Clustern gehörenden Objekte möglichst unähnlich sind. Die Homogenität innerhalb der Cluster ermöglicht eine präzise Charakterisierung, die Heterogenität zwischen den Gruppierungen sorgt für Trennschärfe. Besondere Bedeutung fällt diesem Verfahren bei der planerischen Arbeit im Marketing zu, wo versucht wird im Rahmen einer Marktsegmentierung Zielgruppen für neue Produkte zu erfassen.

Gruppenbildung zur Darstellung, Beobachtung und Profilierung von Markt-, Kunden- und Produktsegmenten. Marktentwicklungen kann nicht durch eine einheitliche Gesamtstrategie begegnet werden. Um sich auf seinen Märkten orientieren zu können, muss sich ein Unternehmen einen Überblick verschaffen wer wie mit wem im Wettbewerb steht, welche Kunden sich wie verteilen und welche Fremdprodukte mit den eigenen vergleichbar sind.
Ein Weg hierzu ist die Cluster-analyse. Sie strukturiert den vielfältigen Gesamtmarkt, in dem sie ihn in logische Untergruppen teilt. Bspw. besteht das Fahrzeugangebot des Automobilmarktes aus den unterschiedlichsten Fahrezeugtypen und -modellen. Die Clusteranalyse sortiert diese Gesamtmenge in Gruppen sich ähnelnder Fahrzeuge. Ein Hersteller erkennt so, welches Modell welches Marktteilnehmers jeweils mit seinem Produkt in direktem Wettbewerb steht.

Bei der Clusterung von Konsumenten werden jeweils die zusammengefasst, deren Bedürfnisse, Kauf- und Entscheidungsverhalten sich möglichst ähneln. Hier kann ein Unternehmen die einzelnen Kundengruppen zielgerichtet ansprechen. Oder es kann dadurch Marktnischen erkennen. Wenn die Clusteranalyse bspw. ein großes Segment allein stehender Golf-spielender Frauen im Seniorenalter und mit einer bestimmten Kaufkraft erkennen lässt, dann kann dies ein interessantes Segment für ein neues Verlagsprodukt sein, dessen Inhalt sich exakt an diesem Lesersegment orientiert. Außerdem bietet es Unternehmen eventuell der Sportartikel-und Modebranche, der Gastronomie und der Touristik, die ebenfalls in diesem Segment eine attraktive Kundengruppe sieht, eine attraktive Werbeplattform.

Die Grundregel der Clusteranalyse ist somit:
- Die Unterschiede zwischen den einzelnen Gruppen sollen möglichst groß,
- die Unterschiede innerhalb einer Gruppe möglichst gering sein.

Die beste Möglichkeit hierzu ist, das Profil eines solchen Segments mit möglichst vielen Kriterien zu beschreiben. Bei der Clusteranalyse von Kunden genügt es bspw. nicht, sie nur nach Alter, Einkommen und soziale Schicht aufzuteilen. Werden diese soziodemographischen Merkmale allein berücksichtigt, dann bleiben die Segmente inhomogen, denn es unterscheiden sich auch Konformisten und Individualisten, Aktive und Passive, Optimisten und Pessimisten. Somit zählen bei der Clusteranalyse auch psychographische Eigenschaften, die sich unter anderem in Charakter, Interessensgebiete, Verhaltensformen, Einstellungen und Bevorzugungen darstellen.

Das Ziel der Clusteranalyse ist, unter einer Menge von Objekten, von denen bestimmte Eigenschaften durch einen geeigneten Variablensatz gemessen worden sind, sogenannte natürliche Gruppierungen (Cluster) aufzufinden. Diese gef und enen Gruppierungen sollten sich auszeichnen durch:
1. Homogenität innerhalb der Cluster. Das heißt, daß die Objekte innerhalb einer gef und enen Gruppierung eine große Ähnlichkeit in allen einbezogenen Eigenschaften aufweisen sollten. Je ähnlicher die Objekte sind, desto homogener ist die Gruppierung und desto präziser kann sie charakterisiert werden.
2. Heterogenität zwischen den Gruppierungen. Das heißt, daß sich die Objekte einer Gruppierung von den Objekten der anderen Gruppierungen stark unterscheiden sollten. Je heterogener die gef und enen Cluster sind, desto trennschärfer sind sie. Leider treten in der Praxis relativ häufig sog. Mischtypen auf, die diese beiden Bedingungen mehr oder weniger stark beeinträchtigen, so daß die Auffindung natürlicher Gruppierungen große Probleme bereiten kann. Trotzdem besitzt die Clusteranalyse für die planerische Arbeit im Marketing große Bedeutung, da nur selten ein Produkt geschaffen wird, das generell akzeptiert wird. Häufig soll ein Produkt entwickelt werden, das für bestimmte Zielgruppen (Cluster) abgestimmt ist. Dazu ist es notwendig, die Existenz, die Größe und eine detaillierte Charakterisierung dieser Zielgruppen zu erhalten. Genau diese Fragen versucht die Clusteranalyse zu beantworten. Bei der Durchführung einer Clusteranalyse sind verschiedene mathematische Probleme zu beachten: Das Datenproblem: Dabei ist zu klären, welche und wie viele Eigenschaften pro Objekt heranzuziehen sind. Vor allem aber ist wesentlich, wie diese Eigenschaften gemessen werden (nominal, ordinal,. . .), da davon die beiden folgenden Punkte betroffen sind. Die Wahl des Proximitätsmaßes: Um zu bestimmen, wie ähnlich (nahe) zwei Objekte liegen, bedarf es eines geeigneten Maßes. Man unterscheidet zwei Kategorien:
a) Distanzmaße (beispielsweise die euklidische Distanz)
b) Ähnlichkeitsindikatoren (bei spielsweise der Korrelationskoeffi zient). Die Wahl des Clusterverfahrens (Algorithmus): Es gibt eine Vielzahl von ClusterAlgorithmen, die sich alle durch mehr oder weniger große Eigentümlichkeiten auszeichnen. Die sicherlich gebräuchlichsten ClusterVerfahren sind die sog. hierarchischen Verfahren, die meist von den Einzelobjekten ausgehen und durch sukzessives Zusammenfassen zu den gesuchten Gruppierungen führen.

Die Clusteranalyse ist ein multivariates Verfahren der Datenanalyse zur Bildung voneinander unabhängiger Objektgruppen. Kriterium zur Einordnung der Objekte in bestimmte Gruppen (Cluster) ist ihre Ähnlichkeit bezüglich bestimmter Merkmalsausprägungen. Innerhalb einer Gruppe sollen die Eigenschaften der Objekte möglichst große Ähnlichkeiten (Intra-Ho-mogenität) aufweisen; die Gruppen untereinander sollen möglichst unähnlich sein (Inter-Heterogenität). Wesentliches Merkmal der Clusteranalyse ist die gleichzeitige Berücksichtigung aller gemessenen Eigenschaften der Objekte bei der Gruppenbildung. Die Vorgehensweise bei der Clusteranalyse ist in zwei Schritte zu unterteilen:

1. Messung der Ähnlichkeiten zwischen den Objekten anhand der Merkmalsausprägungen.
Dies geschieht durch Berechnen von Proximitätsmaßen wie Distanzmaße für metrisch skalierte Daten oder Ähnlichkeitsindikatoren (Ahnlkh-keitsmaße) für nominale Ausgangswerte (SMenniveau).

2. Zusammenfassen der Objekte in Gruppen. Dieses vollzieht sich auf Grund der errechneten Proximitätsmaße nach einem Klassifizierungsverfahren. Am häufigsten werden hierarchische Verfahren verwendet, bei denen entweder, ausgehend von den Einzelobjekten, schrittweise Zusammenfügungen bis zu einem umfassenden Cluster vorgenommen werden oder umgekehrt, von einer Gesamtgruppe ausgehend, schrittweise durch Teilungen eine hierarchische Struktur entsteht. Da i.d.R. die günstigste Clusterzahl im Voraus nicht bekannt ist, wird der Aggregations- bzw. Desaggregationsprozess zunächst vollständig durchgeführt und erst dann die Entscheidung über die optimale Clus-teranzahl getroffen.

Die Clusteranalyse ist verwandt mit der ebenfalls objekt- bzw. elementbezogenen Diskriminanzanalyse, die zu den Verfahren der Dependenzanalyse (Datenanalyse) gehört und mindestens intervallskalierte Merkmalsausprägungen (der unabhängigen Variablen) voraussetzt.

Typische Fragestellungen für die Clusteranalyse (vgl. Backhaus u.a., 2000, S. 330) sind z.B.:
- Auswahl von Testmärkten
- die Klassifikation von Unternehmen
- das Auffinden von Persönlichkeitstypen.

(automatische oder numerische Klassifikation, numerische Taxonomie) wichtige Verfahrensgruppe innerhalb der  multivariaten Analyse, deren Aufgabe es ist, Mengen von Objekten bei gleichzeitiger Betrachtung aller erfassten Variablen (Merkmale) so in Teilmengen (sog. Cluster oder Klassen) zu zerlegen, dass die zu demselben Cluster gehörenden Objekte untereinander möglichst ähnlich und die zu verschiedenen Clustern gehörenden Objekte untereinander möglichst unähnlich sind. Geht man bei der Clusteranalyse von der Datenmatrix aus, so kann bei p Variablen jedes Objekt der zu clusternden Gesamtheit als Punkt in einem p-dimensionalen Raum dargestellt werden.   Wichtige Stufen jeder Clusteranalyse sind:
(1)  Auswahl der relevanten Variablen: Bei hohen Korrelationen zwischen einzelnen Variablen kann durch eine vorgeschaltete Faktorenanalyse die Variablenanzahl reduziert werden.
(2) 
Clusteranalyse
Auswahl eines geeigneten Ähnlichkeits- bzw. Distanzmasses: Je nach Skalenniveau der Variablen sind unterschiedliche Masse zu verwenden. Bei metrisch skalierten Merkmalen ist die Euklidische Distanz wohl am gebräuchlichsten. Die Euklidische Distanz dik zwischen Objekt i und Objekt k ist definiert als in der Regel, vor Berechnung der Distanzmatrix eine geeignete Transformation (z.B. eine Standardisierung) der Variablen vorzunehmen. Besondere Probleme entstehen bei der Analyse gemischtskalierter Datenmatrizen ( Skala).
(3)  Auswahl eines dem gewählten Distanzmass adäquaten Homogenitätsmasses: Betrachtet man ein bestimmtes aus mehreren Objektpunkten bestehendes Cluster, so ist der Schwerpunkt (Centroid) derjenige Punkt, dessen Koordinaten die arithmetischen Mittel der Variablenwerte der zu diesem Cluster gehörenden Objekte sind. Die Homogenitätsmasse, in die - direkt oder indirekt - die Distanzen der einzelnen Objekte zu ihren zugehörigen Centroiden eingehen, dienen zur Beurteilung der Güte der Clusterbildung. Wichtigstes Homogenitätsmass ist wohl die sogenannte Abstandsquadratsumme (Varianzkriterium). (4)  Auswahl eines geeigneten Gruppierungsalgorithmus: Die zahlreichen Gruppierungsalgorithmen lassen sich in die zwei Hauptgruppen der hierarchischen Clusteranalyseverfahren und der iterativen Clusteranalyseverfahren einteilen. Bei Durchführung einer Clusteranalyse mit Hilfe eines Statistischen Programmpakets, wie z.B. SAS, SPSS oder STATGRAPHICS, können die verschiedenen Modellvarianten nach Eingabe der Datenmatrix in den Rechner durch entsprechende Programmbefehle gewählt werden. Neuerdings gibt es darüber hinaus auch menügesteuerte Softwarepakete für Mikrocomputer.      

Die Cluster-Analyse ist ein Verfahren der Marktsegmentierung, indem Schichten, Gruppen, Segmente oder Clusters gebildet werden. Bei der Clusterbildung kann es sich sowohl um natürliche Gruppierungen als auch um künstliche Abgrenzungen handeln, die sich zwar untereinander durch möglichst große Unterschiede auszeichnen sollen, aber innerhalb des Clusters sollen die zugrunde-liegenden Eigenschaften möglichst große Ähnlichkeiten aufweisen.

Cluster analysis, [1] von Tyron, Holzinger und Harman entwickeltes Modell zur Ordnung von Variablen, das als Vorform des Zentroid-Modells der Faktorenanalyse aufgefasst werden kann. Die Korrelationen zwischen den Variablen werden als Werte einer Intervallskala aufgefasst, die einen Grad der Zugehörigkeit von Variablen zueinander misst. Die Variablen werden so zu Gruppen geordnet, dass die Korrelationen innerhalb der Gruppen hoch im Vergleich zu den Korrelationen zwischen den Gruppen sind. Der Vergleich wird mit Hilfe des B-Koeffizienten durchgeführt, der das Verhältnis des Durchschnitts der Korrelationen in einer Gruppe zum Durchschnitt der Korrelationen der Variablen in der Gruppe mit Variablen ausserhalb der Gruppe angibt. Die Interpretation der Cluster hängt von den beschreibenden Absichten der Untersuchung ab. Ein der C.-A. verwandtes Modell ist die Linkage-Analyse von L.L. McQuitty, die zur Gruppenbildung von Variablen und Objekten geeignet ist.

[2] Verfahren zur Bündelung von Fällen mit ähnlichen Merkmalen zu Gruppen (Clustern), die in ihrer Binnenstruktur möglichst ähnlich und untereinander möglichst verschieden sind; diese Cluster können Grundlage einer Typologie von Fällen sein. Auf Basis einer Distanzmatrix, der verschiedene Distanzmasse zugrunde liegen können, erfolgt nach unterschiedlichen Verfahren eine schrittweise Bündelung der Fälle. Gute Zuweisungsalgorithmen erfordern bei höheren Fallzahlen noch lange Rechenzeiten, so dass Verfahren entwickelt wurden, bei denen Clusterzentren vorgegeben werden können. Die Ergebnisse des Cluster-Prozesses sind die Clustermittelwerte und die Besetzung der Cluster. Bei hierarchischen Verfahren ist der Prozess der schrittweisen Zuordnung von Interesse. Eine Validierung der Ergebnisse kann über eine Varianzanalyse der Clustermittelwerte erfolgen. Die C.-A. ist auch für dichotomisierte Daten nominalen Niveaus geeignet.

Siehe auch NC-/CNC-/DNC-Maschinen , Marktsegmentierung .

Literatur: Späth, H., Cluster-Formation und -Analyse, Theorie, FORTRAN-Programme, Beispiele, München, Wien 1983. Steinhausen, D./Langer, K., Clusteranalyse, Berlin, New York 1977.

Vorhergehender Fachbegriff: Cluster-Analyse | Nächster Fachbegriff: Clustering



  Diesen Artikel der Redaktion als fehlerhaft melden & zur Bearbeitung vormerken




   
 
 

   Weitere Begriffe : Prüflistenverfahren | Sukzessivgründung | Marktstruktur

   Praxisnahe Definitionen

Nutzen Sie die jeweilige Begriffserklärung bei Ihrer täglichen Arbeit. Jede Definition ist wesentlich umfangreicher angelegt als in einem gewöhnlichen Glossar.

  Marketing

  Definition

  Konditionenpolitik

   Fachbegriffe der Volkswirtschaft

Die Volkswirtschaftslehre stellt einen Grossteil der Fachtermini vor, die Sie in diesem Lexikon finden werden. Viele Begriffe aus der Finanzwelt stehen im Schnittbereich von Betriebswirtschafts- und Volkswirtschaftslehre.

  Investitionsrechnungen

  Marktversagen

  Umsatzsteuer

   Beliebte Artikel

Bestimmte Erklärungen und Begriffsdefinitionen erfreuen sich bei unseren Lesern ganz besonderer Beliebtheit. Diese werden mehrmals pro Jahr aktualisiert.

  Cash Flow

  Bausparen

  Fremdwährungskonto


     © 2017 Wirtschaftslexikon24.com       All rights reserved.      Home  |  Datenschutzbestimmungen  |  Impressum  |  Rechtliche Hinweise
Aktuelles Wirtschaftslexikon