Vorlesung 6 Flashcards Preview

Qualitäts Management > Vorlesung 6 > Flashcards

Flashcards in Vorlesung 6 Deck (21)
Loading flashcards...
1

Lageparameter

Median (Zentralwert): der Wert in einer der Größe nach geord-neten Reihe, der gleich viele Werte oberhalb wie unterhalb besitzt
x_med=x_((n+1)/2) für ungerade n, x_med=〖0.5(x〗_(n/2)+x_(n/2+1)) für gerade n
Modus (Modalwert): Maximum der Häufigkeitsverteilung
x_mod=x_i mit h(x_i )>h(x_k )für alle k≠i
Mittelwert (arithmetisches Mittel): Durchschnittswert einer Häufigkeitsverteilung
x ̅= 1/n ∑ _(i=1) ^n x_i

2

Deskriptive vs. induktive Statistik

Deskriptive (beschreibende, empirische) Statistik:
• Aufbereitung und Zusammenfassung von Datenmaterial und deren visuelle Darstellung
• Keine abgeleiteten Aussagen über größere Grundgesamtheiten
Induktive (schließende, beurteilende) Statistik:
• Schätzen und Testen unbekannter Wahrscheinlichkeiten, Varianzen oder Erwartungswerte
• Ableitung von Eigenschaften der Grundgesamtheit aus Daten der Stichprobe

3

Dichtefunktion der Normalverteilung

Beschrieben durch
Stichprobenmittelwert x̅
Standardabweichung s: Maß für die Streuung der Werte eine Zufallsvariable um ihren Erwartungswert
99%-Bereich zwischen -3a und +3s
Anzahl der Klassen k aus Anzahl der Stichproben n: kk= √n

4

Diskrete vs. stetige Verteilungen
Beispiele

diskrete Verteilungen:
• geometrische Verteilung
• Binomialverteilung
• Poisson-Verteilung
stetige Verteilungen:
• Normal- bzw. Standardnormalverteilung

5

Dichtefunktion
Verteilungsfunktion

Eine auf R integrierbare Funktion heißt Dichtefunktion, wenn für diese gilt:
- f(x)≥0 für alle x∈R
- ∫ _(-∞) ^(+∞) f(x)dx=1
Die Verteilungsfunktion einer stetigen Zufallsvariable X ergibt sich somit zu:
F(x)=P(X≤x)=∫ _(-∞) ^x f(u)du

6

Streuungsparameter

Durchschnittliche Abweichung: arithmetisches Mittel der Abweichungen vom Mittelwert
d= 1/n ∑ _(i=1) ^n |x_i-x ̅|
Varianz: mittlere Quadratische Abweichung vom Mittelwert
- Stichprobe hinreichend groß:s ̂^2= 1/n ∑ _(i=1) ^n (x_i-x ̅)
- Sonst: s^2= 1/(n-1) ∑ _(i=1) ^n |(x_i-x ̅)
s2 Varianz einer Stichprobe
σ Varianz der Grundgesamtheit

7

Boxplot

• schneller Überblick, in welchem Bereich die Messdaten liegen und wie diese streuen
• Box um den Bereich, in dem die mittleren 50% der Daten liegen
• Antennen / Whiskers zeigen die Entfernung zu den größten und kleinsten Ausreißern

8

Histogramm

- Säulendiagramm, das große Menge gesammelter Daten (min. 50) als Häufigkeitsverteilung darstellt
- Spannweite R = xmin – xmax
- Anzahl Klassen k = √n (n Anzahl Einzeldaten)
- Klassenbreite h= R/k

9

Normalverteilung
Standardnormalverteilung

Normalverteilung
- Meistgenutzte Wahrscheinlichkeitsverteilung von stetigen Zufallsvariablen
- Verteilungsfunktion nur numerisch lösbar, daher Substitution auf Standardnormalverteilung

Standardnormalverteilung
- Normalverteilung mit η = 0 und σ2 = 1
- Die Werte der Verteilungsfunktion liegen tabellarisch vor
- Die Dichtefunktion ist symmetrisch: ϕ(-x)=1-ϕ(x)

10

Paretodiagramm

• Darstellung der Ursachen eines Problems als Säulendiagramm
• x-Achse: Ursachen absteigend nach quantitativer Häufigkeit geordnet; y-Achse: Häufigkeit
• zusätzlich Kurve mit kumulierter Häufigkeit

11

Streudiagramm

• Streudiagramm = Scatterplot
• Darstellung zweier Wertepaare in einem kartesischen Koordinatensystem

12

Dotplot

• Einfache Darstellung der Verteilung von kontinuierlichen, quantitativen Daten
• Für kleine bis mittelgroße Datensätze
• Häufigkeiten werden als Punkte („Dots“) über den Merkmal-ausprägungen aufgetragen

13

Lineare Regressionsanalyse
Regressor
Regressand

Regressionsanalyse: Anpassung des Wirkzusammenhangs zwischen quantitativen Faktoren und Zielgrößen an die vorliegenden Daten, sodass die Übereinstimmung möglichst hoch ist
Regressor: unabhängige Variable X
Regressand: abhängige Variable Y
-> Minimierung der Fehlerquadrate (Gauß)
o Abstandsfunktion Q2(x,y) aufstellen
o Nullwert der partiellen Ableitungen bestimmen
o Parameter a und b ermitteln
• Schwerpunkt enthalten -> von einem arithmetischen Mittel kann auf das andere geschlossen werde

14

Korrelationskoeffizient

gibt den Grad des linearen Zusammenhangs an
Division der Kovarianz durch die Standardabweichungen
r=s_xy/(s_x*s_y ), -1 ≤ r ≤ 1
Je größer r, desto weniger weichen Beobachtungspaare von einer Regressionsgeraden ab („starke Korrelation“)

15

Korrelation
Kovarianz

Korrelation: Beziehung zwischen zwei oder mehr Merkmalen zueinander
Kovarianz: Zusammenhänge (Streuungsverbund) zweier Merkmale in einer Zahl zusammengefasst
s_xy=1/n ∑ _(i=1) ^n (x_i-x ̅ )(y_j-y ̅ )
positiv, wenn beide Merkmale mit demselben Vorzeichen vom Mittelwert abweichen

16

Qualitätsregelkarte

• dienen der Überwachung des zeitlichen Verlaufs eines Prozesses
• Warngrenzen: im Abstand der zweifachen Standardabweichung zum Mittelwert (entspricht 95,45%)
• Eingriffsgrenzen: im Abstand der dreifachen Standardabweichung vom Mittelwert (entspricht 99,73%)

17

Natürliche Streuung
Systematische vs. spezielle Einflüsse

Natürliche Streuung: Ergebnis vieler, kleiner, statistisch verteilter Einflussgrößen (Normalverteilung), 99% der Werte liegen in einem Bereich von ±3σ
Systematische Einflüsse: näherungsweise feste Verschiebung der Prozesslage
Spezielle Einflüsse: im Allgemeinen nicht vorhersehbar

18

SPC

SPC = Statistische Prozesskontrolle (Statistical Process Control): Anwendung statistischer Methoden zur Kontrolle und Optimierung von Produktions- und Serviceprozessen
• Prüfung von Prozessen
• Erfassung von Prozessabweichungen
• Vermeidung von Prozessproblemen und ihren Auswirkungen
• Überwachung von Prozessverbesserungen
Veranschaulichung: Trichterexperiment (Deming)

19

Langfristige Fähigkeitsindizes

• Berechnung analog zu kurzfristigen Fähigkeitsindizes
• Können nie größer sein als cp und cpk
• Ein Prozess ist langfristig bis zu 1,5s schlechter als bei Betrachtung einzelner Messreihen (zusätzliche Einflussfaktoren)

20

Kurzfristige Fähigkeitsindizes
(cp-Wert, cpk-Wert)

c_p=Toleranz/Prozessstreuung=(OGW-UGW)/6σ
-> cp = 1, wenn die Prozessstreubreite der Toleranzbreite entspricht
-> nicht für einseitig tolerierte Merkmale geeignet
c_pk=(min. Prozessgrenznähe)/(halbe Prozessstreuung)=(min⁡{OGW-x ̅ ̅;x ̅ ̅-UGW})/3σ
-> cpk berücksichtigt auch die Lage der Prozessparameter
-> cpk = cp, wenn der Prozess in der Toleranzmitte zentriert ist, ansonsten cpk < cp
-> beide Fähigkeitindizes >1 (= 2699 dpmo) -> fähiger Prozess

21

Stabilität
Prozessfähigkeit

Stabilität (=beherrschter Prozess): Prozessmittelwert und Prozessstandardabweichung ändern sich zeitlich nicht oder nur in einem definierten Rahmen
-> Notwendige Bedingung
Prozessfähigkeit: Prozess bewegt sich zu einer hohen, vorher definierten Wahrscheinlichkeit innerhalb der Toleranzen
-> Hinreichende Bedingung