Hvad er Covariance?
Måling af forholdet mellem de to tilfældige variabler kaldes kovarians. Som navnet antyder, fortæller kovariansen mellem de to variabler, hvordan den ene variabel varierer, når den anden variabel ændres. Kovarians definerer ikke afhængigheden af en variabel på en anden. Der er to typer kovarianseberegninger. Først er populationens kovarians, og den anden er prøvens kovarians. I denne artikel lærer vi, hvordan man beregner kovariansen af befolkningen i excel.
Kovariansværdien kan være en negativ eller positiv værdi. En negativ værdi betyder, at begge variabler bevæger sig i den modsatte retning. Og du gættede det rigtigt, en positiv kovarians betyder, at de to variabler bevæger sig i samme retning.
Det lyder måske som en korrelationskoefficient, men det er anderledes. Vi vil tale om det i sidste ende.
Hvordan finder man kovarians af befolkningen i Excel?
Excel giver en funktion COVARIANCE.P til let at beregne kovarians af data. Det blev introduceret i Excel 2010, og siden den version er det blevet brugt i vid udstrækning. Jeg bruger det i Excel 2016. Der er en anden version af denne metode ved navn COVARIANCE.S. Det bruges til at beregne kovariansen af prøvedatasættet. En anden metode er at bruge analyseværktøjspakke til at beregne kovariansen af befolkningen i excel.
Syntaksen for COVARIANCE.P:
= COVARIANCE.P (array1, array2) |
Array1:Værdierne for den første variabel.
Array2:Værdierne for den anden variabel.
Bemærk:Disse arrays kan sættes i enhver rækkefølge. Længden af de to arrays skal være den samme. Hvis de to arrays er af to forskellige længder, viser excel #N/A fejl.
Nu hvor vi ved om kovariansen, lad os få et eksempel for at gøre tingene endnu tydeligere.
Eksempel: Beregn befolkningens kovarians i Excel
Her har jeg et eksempel på datasæt. I område A2: A7 har jeg en variabel X og i område B2: B7 en anden variabel Y. Forudsat at dette er dataene for den samlede befolkning. Lad os nu beregne kovarianserne af disse data og se, hvordan disse to variabler påvirker hinanden.
Lad os bruge Excel COVARAINCE.P -funktionen:
= COVARIANCE.P (A2: A7, B2: B7) |
Dette returnerer en værdi på 5.444444444.
Fortolkning af Covariance
Den kovariansværdi, vi fik, er en positiv værdi. Den fortæller, at X og Y bevæger sig i samme retning. Med andre ord vil Y stige, hvis X stiger og omvendt. Hvis kovarians var en negativ værdi, ville det modsatte være sandt.
Hvordan beregnes COVARIANCE.P?
Den matematiske formel til beregning af befolkningens kovarians er som følger:
Her Xjeger en hvilken som helst værdi i variabel X, hvor X bar er prøve middelværdi af variabel X.
Yjeg er en hvilken som helst værdi i variabel Y, hvor Y bar er prøveværdien af variablen Y.
n er antallet af observationer.
Hvis du forsøger at beregne kovariansen af befolkningen i excel manuelt, er det sådan du ville gøre det.
- Beregn først det aritmetiske gennemsnit af X- og Y -variablerne i cellen. Du kan bruge AVERAGE -funktionen.
= Gennemsnit (A4: A9) - Træk middelværdien af X fra hver værdi på X. Gør det samme for Y.
= A4- $ A $ 13 - Nu flere X-middelværdi X og Y-middelværdi Y-område. Se billedet ovenfor.
= D4*C4 - Nu summeres de værdier, der opnås ved multiplikation.
= SUM (E4: E9) - Endelig opdel den opnåede sum med et antal observationer. I vores tilfælde er det 6.
= E10/TÆL (A4: A9)
Tallet vi får er 5.444444444, hvilket er nøjagtigt det samme som det vi fik fra Excel COVARIANCE.P -funktionen.
Forskellen i kovarians og korrelationskoefficient
Den første og store forskel er formlen. Korrelationskoefficienten beregnes ved at dividere kovarians med produktet af standardafvigelsen for Xs og Ys.
Kovariansen fortæller os retningen for to tilfældige variabler, uanset om de bevæger sig i samme retning eller forskellige. Det fortæller ikke styrken af forholdet mellem to variabler. Hvor korrelation viser styrken af forholdet mellem to variabler i området -100% til 100%.
Så ja fyre, det er sådan du bruger COVARIANCE.P i Excel. I denne artikel lærte vi ikke kun om COVARIANCE.P -funktionen, men vi lærte også, hvordan vi beregner det manuelt, og hvordan vi udleder det. Jeg håber, jeg var forklarende nok. Hvis du er i tvivl om denne statiske funktion eller en anden statisk Excel -funktion, så kommenter det i kommentarfeltet herunder.
Sådan finder du korrelationskoefficient i Excel
Beregn INTERCEPT i Excel
Beregning af SLOPE i Excel
Sådan bruges Excel NORMDIST -funktion
Regressioner i excel 2010
Pareto -diagram og analyse
Populære artikler:
50 Excel -genvej til at øge din produktivitet
VLOOKUP -funktionen i Excel
COUNTIF i Excel 2016
Sådan bruges SUMIF -funktionen i Excel