Kendall's Tau (I) - Hva det er, definisjon og konsept

Innholdsfortegnelse

Det er et ikke-parametrisk avhengighetsmål som identifiserer de samsvarende og uoverensstemmende parene med to variabler. Når de er identifisert, beregnes totalene og kvotienten blir laget.

Klassifiserte korrelasjoner er et ikke-parametrisk alternativ som et mål på avhengighet mellom to variabler når vi ikke kan bruke Pearsons korrelasjonskoeffisient.

Med andre ord tildeler vi en rangering til observasjonene til hver variabel og studerer avhengighetsforholdet mellom to gitte variabler. Det er to måter å beregne Kendalls Tau på; vi velger å beregne avhengighetsforholdet når observasjonene til hver variabel er bestilt. I vårt eksempel vil vi se at vi har sortert rangeringene i kolonne X i stigende rekkefølge.

Matematisk,

Vi definerer:

Cn = totalt antall matchende par.

NCn = totalt antall ikke-samsvarende (uoverensstemmende) par.

Prosedyre og praktisk eksempel

For å oppnå Kendalls Tau, må vi først vite hvordan vi kan identifisere de samsvarende og uoverensstemmende parene med to variabler.

Vi vil bruke skiløpernes preferanser. I dette eksemplet antar vi at vi ønsker å evaluere om skiløpere klassifiserer sine preferanser for alpint eller langrenn i samme rekkefølge i en stasjon i. Rangeringene deres kan variere fra 1 (veldig å foretrekke) til 7 (veldig lite å foretrekke).

Spørsmålet vårt ville være: er det en avhengighet mellom innfartsløpere og nordiske skiløpere på de gitte skistedene?

Vi definerer:

X = vurdering av skiløperne for alpint i stasjon i.

Y = vurdering av skiløperne for langrenn på stasjon i.

C = samsvarende par.

NC = uoverensstemmende / uoverensstemmende par.

OGJeg = skianlegg i.

Prosess

  • Vi starter fra et utvalg av n = 7 skianleggsobservasjoner. Hver rad på bordet er klassifiseringer gitt av skiløperne. Hvert par stasjoner kan være samsvarende eller uoverensstemmende. I kolonnene C og NC teller vi bare parene i en retning. For eksempel telles paret AB og BA som et enkelt par for å unngå repetisjoner.

Observasjonene som er oppnådd er:

Skianlegg (Jeg) X Z
TIL 1 1
B 2 3
C 3 4
D 4 2
OG 5 7
F 6 6
G 7 5
  1. Vi har sortert elementene i kolonne X i stigende rekkefølge for å kunne sammenligne dem med elementene i kolonne Z
  2. Vi finner de samsvarende parene og de uoverensstemmende parene.
Skianlegg (Jeg) X Z CNC
TIL 1 1 6 0
B 2 3 5 0
C 3 4 5 1
D 4 2 4 0
OG 5 7 4 1
F 6 6 4 1
G 7 5 43 3 Total
  • Først ser vi på kolonne Z siden kolonne X allerede er sortert i stigende rekkefølge. Følgelig vil alle klassifiseringer i kolonne Z som ikke stiger, være uoverensstemmende stasjonspar.
    • Når vi ser etter par stasjoner (concordant og non-concordant), vil vi alltid ha den siste raden med observasjoner fordi vi leter etter par (sett med to observasjoner).
    • Alle de som er under en referanseklassifisering vil være samsvarende par. I det første tilfellet fastslår begge skiløpere at referanseklassifiseringen er 1. Alle klassifiseringer under 1 vil være par i samsvar med A. Totalt har vi 7 stasjoner å klassifisere. Så det vil være 6 samsvarende par av A. Siden vi ikke har noen uoverensstemmende par knyttet til A, vil vi sette null.

Les andre del av Kendall's Tau (II)