Hvad er variation?
Vi bruger variansen af data til at estimere rækkevidden af fremtidig værdi i serier. Variansen fortæller, hvor meget data der kan variere fra betyde af datasættet. Varians kaldes ofte fejlværdi. Det er ikke den mest pålidelige statistik, og vi bruger den ikke alene til at forudsige fremtidig værdi.
Hvis man taler matematisk, er variation et gennemsnit af kvadratforskellen mellem datapunkter og gennemsnittet af dataene. Varians er kvadratværdien af standardafvigelse. Nedenfor er de to variansformler.
Vi behøver ikke at bruge disse formler til at beregne varians i Excel. Excel har to formler VAR.P og VAR.S til at gøre det. Hvis du bare vil vide, hvordan du beregner varians i Excel, skal du bruge formlerne som beskrevet nedenfor. Hvis du vil vide, hvad der er varians, og hvornår du skal bruge hvilken variansformel, skal du læse hele artiklen.
Hvordan finder man variation i Excel?
Lad os tage et eksempel.
Jeg lancerede mit websted i januar 2019. Her har jeg data om nye brugere, der er tilsluttet hver måned på mit websted. Jeg vil gerne vide variansen af disse data.
Dette er komplette data. Når vi indsamler komplette data (hele befolkningen) beregner vi populationsvariansen (hvorfor? Jeg forklarer det senere i artiklen). Excel -funktionen til beregning af populationsvarians er VAR.P. Syntaksen for VAR.P er
= VAR.P (nummer1, [nummer2],…)
Nummer1, nummer2,… : det er de tal, du vil beregne varians for.
Det første nummer er obligatorisk.
Lad os bruge denne formel til at beregne variansen af vores data. Vi har data i celle C2: C15. Så formlen vil være:
= VAR.P (C2: C15) |
Dette returnerer en værdi 186.4285714, hvilket er en ganske stor varians givet vores data.
Siden mit websted blev lanceret fra januar 2019, har jeg alle data. Forudsat at jeg lancerede mit websted for længe siden, men de data, jeg har, er kun fra januar 2019 til februar 2020. Jeg har ikke komplette data. Det er da kun eksempeldata. I så fald vil jeg ikke bruge VAR.P i stedet vil jeg bruge funktionen VAR.S til at beregne variansen.
= VAR.S (C2: C15) |
Funktionen VAR.S returnerer en større varians end VAR.P. Den returnerer 200.7692308.
Hvordan beregnes varians manuelt i Excel?
Så ja, det er sådan du beregner variation i Excel. Men hvordan beregner disse variansfunktioner disse tal? Hvis du ved det, kan du forstå disse tal mere og bruge det klogt. Ellers er disse tal bare tilfældige tal. For at forstå det skal vi beregne variansen manuelt.
Beregn variation af befolkning manuelt i Excel
Vi vil bruge de samme data, som vi brugte i ovenstående eksempel. Den matematiske formel for variation i befolkningen er:
For at beregne varians er vi nødt til at beregne middelværdi (Gennemsnit) af data, forskel for hver værdi fra middelværdi, summe dem op og til sidst dividere denne sum med det samlede antal observationer.
Trin 1. Beregn gennemsnitsdata
For at beregne gennemsnittet af data i Excel bruger vi GENNEMSNIT -funktionen.
Brug denne formel i celle C17 (eller hvor du vil).
= Gennemsnit (C2: C15) |
Dette returnerer 233,0.
Trin 2: Find forskellen mellem hvert datapunkt fra middelværdien
Gå nu til celle D2 og træk middelværdi (C17) fra C2 (x). Brug denne formel i D2 og træk den ned til D15.
= C2- $ C $ 17 |
Trin 3: Forklar hver forskel.
Nu skal vi kvadrere hver forskel, vi har her. Skriv formlen herunder i celle E2 og træk ned til E15:
= POWER (D2,2) |
Trin 4: Sum firkanterne
Nu skal vi opsummere disse kvadratiske forskelle. Så brug denne formel i celle C18:
= SUM (E2: E13) |
Sidste trin: Opdel summen af firkanter med antal observationer.
Jeg har 14 observationer. Du kan beregne ved hjælp af COUNT -funktionen, hvis du vil.
Brug denne formel i celle C19 til at beregne populationsvariansen.
= C18/COUNT (C2: C15) |
Dette returnerer værdien 186.429 … som er nøjagtig den samme som variansen returneret af Excel -variansformlen VAR.P ovenfor.
Nu hvor du ved, hvordan populationsvarians beregnes manuelt i Excel, vil du kunne vide, hvordan du bruger den i faktisk analyse.
Beregn varians af prøve manuelt i Excel
I de fleste tilfælde er det umuligt at fange alle data til analyse. Vi vælger normalt en tilfældig stikprøve fra dataene og analyserer dem for at fortolke dataens art. I så fald kan vi, hvis vi bruger populationsvariansen, være destruktiv analyse. For at være på den sikre side bruger vi formlen Variance of Sample. Formlen for variansen af prøve er:
Den eneste forskel i stikprøve og populationsvarians er nævneren. I prøvevarians trækker vi en fra antallet af observationer (n-1). Dette kaldes upartisk analyse. Dette sikrer, at dataene ikke undervurderes, og det mulige fejlområde er en smule bredere.
For at beregne variansen af prøve manuelt i Excel skal vi gentage trin 1 til 4 af populationsvarians. I det sidste trin skal du bruge nedenstående formel:
= C18/(COUNT (C2: C15) -1) |
Dette returnerer 200.769. Dette er nøjagtigt det samme som variansen, der returneres af funktionen VAR.S. Det kræver et større fejlområde end VAR.P for at sikre mindre chance for fejl i forudsigelsen.
Afvigelsen af data er ikke så betroet til forudsigelse. Vi beregner standardafvigelse, som er kvadratroden af varians og mange andre statistikker for at minimere chancerne for fejl i forudsigelse.
Så ja fyre, sådan kan du beregne varians i excel. Jeg håber, det var forklarende og nyttigt. Hvis du er i tvivl om denne variation i excel eller andre statistikker, er kommentarfeltet helt dit.
Sådan beregnes standardafvigelse i Excel : For at beregne standardafvigelsen har vi flere formler. Standardafvigelsen er ganske enkelt kvadratroden af variansen. Det fortæller mere om dataene end varians.
Sådan bruges funktionen VAR.P i Excel : Beregn variansen for populationsdatatallene i excel ved hjælp af VAR.P -funktionen
Sådan bruges funktionen STDEV.P i Excel : Beregn standardafvigelsen for befolkningsdatatallene i excel ved hjælp af funktionen VAR.P
Sådan bruges DSTDEVP -funktionen i Excel : Beregn standardafvigelsen for eksempeldatatallene med flere kriterier i excel ved hjælp af DSTDEVP -funktionen
Sådan bruges VAR -funktionen i Excel : Beregn variansen for eksempeldatatallene i excel ved hjælp af VAR -funktionen.
Regressionsanalyse i Excel: Regression er et analyseværktøj, som vi bruger til at analysere store datamængder og lave prognoser og forudsigelser i Microsoft Excel.
Sådan oprettes en standardafvigelsesgraf : Standardafvigelsen fortæller, hvor meget dataene er grupperet omkring middelværdien af dataene.
Populære artikler:
50 Excel -genveje til at øge din produktivitet | Få hurtigere til din opgave. Disse 50 genveje får dig til at arbejde endnu hurtigere i Excel.
VLOOKUP -funktionen i Excel | Dette er en af de mest anvendte og populære funktioner i excel, der bruges til at slå værdi op fra forskellige områder og ark.
COUNTIF i Excel 2016 | Tæl værdier med betingelser ved hjælp af denne fantastiske funktion. Du behøver ikke at filtrere dine data for at tælle bestemte værdier. Countif -funktion er afgørende for at forberede dit dashboard.
Sådan bruges SUMIF -funktionen i Excel | Dette er endnu en vigtig instrumentbrætfunktion. Dette hjælper dig med at opsummere værdier på bestemte betingelser.