Kendall's Tau (II) - Hva det er, definisjon og konsept

Det er et ikke-parametrisk avhengighetsmål som identifiserer de samsvarende og uoverensstemmende parene med to variabler. Når de er identifisert, beregnes totalene og kvotienten blir laget.

Med andre ord tildeler vi en rangering til observasjonene til hver variabel og studerer avhengighetsforholdet mellom to gitte variabler.

Det er to måter å beregne Kendalls Tau på; vi velger å beregne avhengighetsforholdet når observasjonene til hver variabel er bestilt. I vårt eksempel vil vi se at vi sorterer rangeringen i kolonne X i stigende rekkefølge.

Klassifiserte korrelasjoner er et ikke-parametrisk alternativ som et mål på avhengighet mellom to variabler når vi ikke kan bruke Pearsons korrelasjonskoeffisient.

Dette er resultatene vi har referert til i den første artikkelen -> Kendalls Tau (I):

Skianlegg (Jeg) X Z C NC
TIL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OG 5 7 4 1
F 6 6 4 1
G 7 5 43 3 TOTAL
  • BC-CB-paret er et uoverensstemmende par. Vi skriver inn 1 i NC-kolonnen og fryser telleren i siste posisjon til vi finner et matchende par igjen. I dette tilfellet har vi frosset antall matchende par ved 5 opp til stasjon D. Stasjon D kan bare danne 4 matchende par: AD-DA, DE-ED, DF-FD, DG-GD.

Et annet uoverensstemmende par vil være EF-FE:

  • EF-FE-paret er et uoverensstemmende par. Vi skriver 1 i NC-kolonnen og fortsetter å trekke tallet 4 av samsvarende par som kan dannes. De samsvarende parene til stasjon E vil være: EA-AE, EB-BE, EC-CE, ED-DE fordi EF-FE er uoverensstemmende.
    • FG-GF-paret er et uoverensstemmende par. Vi skriver 1 i NC-kolonnen og fortsetter å trekke tallet 4 av samsvarende par som kan dannes. De konkordante parene til stasjonen F s (vi har ikke variert i stedet for 4. De konkordante parene vi kunne vise før (vi har ikke variert det ville være: FA-AF, FB-BF, FC-CF, FD-DF fordi FG-GF skriker.

Vi beregner Kendalls Tau

Kendalls Tau har ingen hemmelighet utover å være kvotienten til de samsvarende og uoverensstemmende parene i et utvalg observasjoner.

Tolkning

Vårt første spørsmål var: er det et avhengighetsforhold mellom innfartsløpere og nordiske skiløpere på gitt skisteder?

I dette tilfellet har vi en avhengighet mellom de to variablene på 0,8695. Et resultat veldig nær øvre grense. Dette resultatet forteller oss at alpine skiløpere (X) og nordiske skiløpere (Z) har klassifisert feriestedene med lignende klassifiseringer.

Uten å måtte gjøre noen form for beregning, kan vi se at de første stasjonene (A, B, C) får de beste poengene fra de to gruppene. Med andre ord følger rangeringene til skiløperne samme retning.

Sammenligning: Pearson vs Kendall

Hvis vi beregner Pearsons korrelasjonskoeffisient gitt tidligere observasjoner og sammenligner den med Kendalls Tau, får vi:

I dette tilfellet forteller Kendalls Tau oss at det er et sterkere avhengighetsforhold mellom variablene X og Z sammenlignet med Pearsons korrelasjonskoeffisient: 0,8695> 0,75.

Hvis avvikerne hadde stor innflytelse på resultatene, ville vi finne en stor forskjell mellom Pearson og Spearman, og derfor bør vi bruke Spearman som et mål på avhengighet.