Föreläsning 6 - Tobit, Quartile Och Hazard Key Consepts Flashcards

1
Q

How quantile regression on censured data?

A

När man jobbar med censurerade beroendevaribler kan kvartilregressioner användas för att estimera effekten av kovariat på konditional-kvartiler som är under censurerings-punkten (om vi har top-censurering). Dvs, det spelar ingen för medianen exakt vilka värden den övre delen av distributionen har! So om topkodningen påverkar relativt få personer så har inte censureringen någon effekt på estimaten av medianen eller till och med β för τ =.75 (där τ är kvartilen/percentilen).

Så länge det finns tillräckligt med oicensurerad data kommer estimaten ge oss de kvartilregressioner,

(Givet Badie Kappa theorem kan vi använda IV på kvartil regressioner också. Vilket är bra för vi kan då få en LATE effekt., alltså effeckten för compliers. )

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

How can vi look at the effect on limited dependent variables?

A

Effekten bryts upp i två delar. Partision effekt och COP effekt. Där partition effekt skillnaden i sannolikhetet att t.ex utgifterna är positiva (alltså att man köper varan) samt skillnaden i genomsnittligt utfall givet att man deltar (conditional on positive effekt = COP)

COP effekten innehåller en causal del samt en selection bias. En lösning på den icke-kausala delen är att exempelvis använda en Tobit modell.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Hur kan man tänka fel när det gäller censurerad data och hur man ska agera?

A

AP säger dock att t.ex negativa kostnader för sjukhus besök är ett konstigt koncept. Vissa spenderar verkligen 0 på något och har ingen negativ efterfrågan. Därför är negartiva värden på den latenta variablen Y. Det finns ingen data på Y och det kommer aldrig att finnas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Vad är Tobit känsligt för?

Vad vara bättre att använda än tobit?

A

Ett annat problem med tobit modelen är att β1vilar på starka antaganden av den latenta variabeln, Normalitet och Homiskedasticiteti fel termen!.

Om man har en skev distribution är det inte rimligt att analysera medelvärden, vilket motiverrar vissa att använda tobit. MEn AP hävdar att man istället ska studera distibutionen. Ett alternativ är att kolla direkt på effekten vid distibutionen eller kvartiler. VI kan då använda kvartil-regressioner.

Tobit är bara rimlig om vi har ”riktig” censurerad data! T.ex vid top kodning.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Vad gör kvartilregretioner?

A

Se koncept 6.

Estimates effects for different quantiles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Varför använder vi inte OLS med durationen som beroende variabel när vi har durations data?

A
  1. Censurering = Vi följer inte individer i oändlighet. Vi har bara data över en viss tid.
  2. Time-varying covariants -> t.ex replacement-rate förändras över tid. Viss karaktäristik förändras också
  3. Mindre detalj är att duration data generellt inte är normalfördelad utan skev (många observationer som håller på en längre tid. framförallt i small samples.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Förklara length-biased sampling och left- right censuring.

A

Length-biased sampling: Underrepresentation of short spells in the sample. Alltså folk som är arbetslösa en kort tid osv, de synns inte (har för mig att jag har läst detta någonstans.)

Right-censured = date of spell termination not observed… alltså vi slutar observera innan personen egentligen slutar sin aktivitet (t.ex dör)

Left censured = vi observerar inte begining of spell, dvs starten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad är hazard rate?

A

• λ(t) - hazard rate. Probability of an event (terminition of spell), conditional on survial untill time t.

”The probability that a duration wilk end after t given that it has lasted untill t. ”

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ge exempel på konstant hazard och duration dependence.

A
  • Exempel: När vi följer ett sportlag under en turnering är lages livslängd ”duration dependen” då tävlingen blir svårare och svårare med tiden fram till finalen. Alltså inte konstant hazard. Probability of losing in the first round is lower in the begining than in the finals.
  • Exempel. Skulle lagen istället vara exakt lika bra, och turneringen därför inte blir svårare och svårare kan vi istället beräkna unconditional hazard. Då är tex f(t) = λ(1-λ)^(t-1) -> rond 6 = f(6) = λ(1-λ)^5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad är defenitionen för Survival function och Hazard function?

A

Cumukative distribution function F(t)

PDF = f(t)

Survival function = S(t) = 1 - F(t) (alltså 1 - CDF. Sannolikheten att överleva)

Hazard function = change in the survival function = PDF/(1-CDF) = f(t)/S(t). Detta verkar också vara samma som tidsderivatan av ln(S(t)).
Det är alltså ratiot mellan unconditional probability funktionen och survival.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad är Kaplan Meyer Estimator?

A

Se komncept 6.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

VAd är positiv och negativ duration dependance?

A

Positiv = Sannolikheten at eventet inträffar ökar med tiden.

Negativ = Sannolikheten att eventet inträffar minskar med tiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

What are three types of parametric Hazard models?

A

Se koncept 4.

  • Exponential = konstant
  • Weibull = duration dependence = monoton
  • Log logistic = duration dependance = non-monotonic
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vilket test använder man på Hazard modeller?

A

Log rank test = Wilcoxon test = icke parametriskt test för durationsdata.
Säg att vi har r-antal grupper. Vi jömflr behandlingsgruppen med kontrollgruppen. Är överlevnaden i behandlingsgruppen förbättrad? Eller om recovery snabbare. Man vill inte impose någon modell eller antaganden.
Man gör då en log-rank test.
H0 = överlevnaden i alla grupper lika. Vi kan då räkna ut hur den observerade daten skiljer sig från detta.

Vi räknar expected number of failures i varje grupp och ser hur datan skiljer sig från detta. Vi får då en test statistic. Om test statistiken skiljer sig mycket från noll, kan vi förkasta antagndet av samma survival rate mellan grupperna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Vilket är den mest använda icke-parametriska Hazard modellen?

A

Kaplan Meier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

What is Dynamic selection?

A

Dynamic selection: Most employable workers dissappears first from the unemployment pool. Alltså, de bästa individerna som har lättast att skaffa jobb får jobb snabbast, medan de sämre individerna som inte är lika attraktiva på arbetsmarknaden blir kvar i arbetslösheten. Då är det snarare en fråga om selektion än negative duration. Det är alltså oobserverad hetrogenitet.