Så här gör du grundläggande dataanalys i Excel

Så här gör du grundläggande dataanalys i Excel

För det mesta när du kör statistik vill du använda statistisk programvara. Dessa verktyg är byggda för att göra beräkningar som t -tester, chi-square-tester, korrelationer och så vidare. Excel är inte avsett för dataanalys. Men det betyder inte att du inte kan göra det.





Tyvärr är Excel: s statistiska funktioner inte alltid intuitiva. Och de ger dig vanligtvis esoteriska resultat. Så istället för att använda statistikfunktioner ska vi använda tillägget till Excel-statistik: the Dataanalys Toolpak.





Toolpaket innehåller, trots sin ganska olyckliga stavning, ett brett utbud av användbara statistikfunktioner. Låt oss se vad vi kan göra med Excel -statistik.





Lägga till Excel Data Analysis Toolpak

Medan du burk göra statistik utan Data Analysis Toolpak, det är mycket lättare med det. För att installera Toolpak i Excel 2016, gå till Arkiv> Alternativ> Tillägg .

Klick bredvid 'Hantera: Excel-tillägg'.



Markera rutan bredvid i det resulterande fönstret Analys Toolpak och klicka sedan på OK .

Om du korrekt lade till dataanalysverktygspaketet i Excel ser du en Dataanalys knappen i Data fliken, grupperad i Analys sektion:





Om du vill ha ännu mer kraft, var noga med att kolla in Excel: s andra tillägg.

Beskrivande statistik i Excel

Oavsett vilket statistiskt test du kör, vill du förmodligen först få Excel: s beskrivande statistik. Detta kommer att ge dig information om medel, medianer, varians, standardavvikelse och fel, kurtosis, skevhet och en mängd andra siffror.





Det är enkelt att köra beskrivande statistik i Excel. Klick Dataanalys på fliken Data, välj Beskrivande statistik, och välj ditt inmatningsområde. Klicka på pilen bredvid fältet för inmatningsintervall, klicka och dra för att välja dina data och tryck på Stiga på (eller klicka på motsvarande nedåtpilen), som i GIF nedan.

Efter det, se till att berätta för Excel om dina data har etiketter, om du vill ha utmatningen i ett nytt blad eller på samma, och om du vill ha sammanfattande statistik och andra alternativ.

Efter det, slå OK , och du får din beskrivande statistik:

Studentens t-test i Excel

De t -test är ett av de mest grundläggande statistiska testerna, och det är enkelt att beräkna i Excel med Toolpak. Klicka på Dataanalys och rulla nedåt tills du ser t -testalternativ.

Du har tre val:

  • t-Test: Parat två prov för medel ska användas när dina mätningar eller observationer var parade. Använd detta när du tog två mätningar av samma ämnen, till exempel mätning av blodtryck före och efter ett ingrepp.
  • t-Test: Två-prov Antagande av lika variationer bör användas när dina mätningar är oberoende (vilket vanligtvis betyder att de gjordes på två olika ämnesgrupper). Vi kommer att diskutera delen 'lika varianser' om ett ögonblick.
  • t-Test: Två-prov Antagande Ojämlika variationer är också för oberoende mätningar, men används när dina avvikelser är ojämlika.

För att testa om avvikelserna i dina två prover är lika måste du köra ett F-test. Hitta F-test två-prov för variationer i listan Analysverktyg, markera den och klicka på OK .

Ange dina två datamängder i rutorna för inmatningsintervall. Lämna alfa -värdet på 0,05 om du inte har anledning att ändra det - om du inte vet vad det betyder, lämna det bara. Slutligen, klicka OK .

Excel ger dig resultaten i ett nytt blad (om du inte valde Utgångsområde och en cell i ditt nuvarande blad):

Du tittar på P-värdet här. Om det är mindre än 0,05 har du ojämlika avvikelser . Så att köra t -test, du bör använda alternativet ojämlika varianser.

Att köra a t -test, välj lämpligt test från fönstret Analysverktyg och välj båda uppsättningarna med dina data på samma sätt som du gjorde för F-testet. Lämna alfa -värdet vid 0,05 och slå OK .

Resultaten inkluderar allt du behöver rapportera för en t -test: medelvärdet, frihetsgrader (df), t-statistik och P-värden för både en- och tvåsidiga tester. Om P-värdet är mindre än 0,05 är de två proverna väsentligt olika.

Om du inte är säker på om du ska använda en- eller tvåstjärtad t -prov, kolla in den här förklararen från UCLA .

ANOVA i Excel

Excel Data Analysis Toolpak erbjuder tre typer av variansanalyser (ANOVA). Tyvärr ger det dig inte möjlighet att köra nödvändiga uppföljningstester som Tukey eller Bonferroni. Men du kan se om det finns ett samband mellan några olika variabler.

Här är de tre ANOVA -testerna i Excel:

  • ANOVA: Single Factor analyserar varians med en beroende variabel och en oberoende variabel. Det är att föredra framför att använda flera t -prover när du har mer än två grupper.
  • ANOVA: Tvåfaktor med replikering liknar det parade t -testa; det innebär flera mätningar på enstaka ämnen. Tvåfaktorsdelen av detta test indikerar att det finns två oberoende variabler.
  • ANOVA: Tvåfaktor utan replikering involverar två oberoende variabler, men ingen replikation i mätning.

Vi kommer att gå igenom enfaktoranalysen här. I vårt exempel kommer vi att titta på tre uppsättningar siffror, märkta 'Intervention 1,' 'Intervention 2' och 'Intervention 3.' Klicka på för att köra en ANOVA Dataanalys och välj sedan ANOVA: Single Factor .

Välj inmatningsintervall och se till att berätta för Excel om dina grupper finns i kolumner eller rader. Jag har också valt 'Etiketter i första raden' här så att gruppnamnen visas i resultaten.

Efter att ha slagit OK får vi följande resultat:

Observera att P-värdet är mindre än 0,05, så vi har ett signifikant resultat. Det betyder att det finns en signifikant skillnad mellan minst två av grupperna i testet. Men eftersom Excel inte tillhandahåller tester för att avgöra som grupper skiljer sig åt, det bästa du kan göra är att titta på genomsnitten som visas i sammanfattningen. I vårt exempel ser Intervention 3 ut som det är förmodligen den som skiljer sig åt.

Det här är inte statistiskt sant. Men om du bara vill se om det är någon skillnad och se vilken grupp som förmodligen orsakar det, kommer det att fungera.

Tvåfaktors ANOVA är mer komplicerat. Om du vill lära dig mer om när du ska använda tvåfaktormetoden, se denna video från Sophia.org och den ' utan replikering 'och' med replikering 'exempel från verklig statistik.

Korrelation i Excel

Att beräkna korrelation i Excel är mycket enklare än t -test eller en ANOVA. Använd Dataanalys -knappen för att öppna fönstret Analysverktyg och välj Korrelation .

Välj ditt inmatningsintervall, identifiera dina grupper som kolumner eller rader och berätta för Excel om du har etiketter. Efter det, slå OK .

Du får inga mått av betydelse, men du kan se hur varje grupp är korrelerad med de andra. Ett värde på ett är en absolut korrelation, vilket indikerar att värdena är exakt desamma. Ju närmare ett korrelationsvärdet är, desto starkare är korrelationen.

Regression i Excel

Regression är en av de mest använda statistiska testerna inom industrin, och Excel har en överraskande mängd kraft för denna beräkning. Vi kör en snabb multipel regression i Excel här. Om du inte känner till regression, kolla in HBR: s guide för att använda regression för företag .

Låt oss säga att vår beroende variabel är blodtryck, och våra två oberoende variabler är vikt och saltintag. Vi vill se vilken som är en bättre förutsägare för blodtryck (eller om de båda är bra).

Klick Dataanalys och välj Regression . Du måste vara försiktig när du fyller i inmatningsområdesrutor den här gången. De Ingång Y -område box bör innehålla din enda beroende variabel. De Ingång X Område box kan innehålla flera oberoende variabler. För en enkel regression, oroa dig inte för resten (men kom ihåg att berätta för Excel om du valde etiketter).

Så här ser vår beräkning ut:

Efter att ha slagit OK får du en stor lista med resultat. Jag har markerat P-värdet här för både vikt och saltintag:

Som du kan se är P-värdet för vikt större än 0,05, så det finns inget signifikant samband där. P-värdet för salt är dock under 0,05, vilket indikerar att det är en bra förutsägare för blodtryck.

Om du planerar att presentera dina regressionsdata, kom ihåg att du kan lägga till en regressionsrad till en scatterplot i Excel. Det är en bra visuellt hjälpmedel för denna analys.

Excel -statistik: överraskande kapabel

Även om Excel inte är känt för sin statistiska kraft, innehåller det faktiskt en riktigt användbar funktionalitet, t.ex. PowerQuery -verktyget , vilket är praktiskt för uppgifter som att kombinera datamängder. (Lär dig hur du skapar ditt första Microsoft Power Query Script.) Det finns också statistiktillägget Data Analysis Toolpak, som verkligen tar fram några av Excels bästa funktioner. Jag hoppas att du har lärt dig hur du använder Toolpak, och att du nu kan leka på egen hand för att ta reda på hur du använder fler av dess funktioner.

bästa virtual reality -appar för Android

Med detta nu under ditt bälte, ta dina Excel -färdigheter till nästa nivå med våra artiklar om med hjälp av Excel: s målsökningsfunktion för mer datakrossning och söker efter värden med vlookup . Någon gång kanske du också vill lära dig hur du importerar Excel -data till Python.

Dela med sig Dela med sig Tweet E-post Ta bort dessa Windows -filer och mappar för att frigöra diskutrymme

Behöver du rensa diskutrymme på din Windows -dator? Här är Windows -filer och mappar som säkert kan raderas för att frigöra diskutrymme.

Läs Nästa
Relaterade ämnen
  • Produktivitet
  • Kalkylark
  • Microsoft excel
Om författaren Sedan Albright(506 artiklar publicerade)

Dann är en innehållsstrategi och marknadskonsult som hjälper företag att skapa efterfrågan och leads. Han bloggar också om strategi och innehållsmarknadsföring på dannalbright.com.

Mer från Dann Albright

Prenumerera på vårt nyhetsbrev

Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e -böcker och exklusiva erbjudanden!

Klicka här för att prenumerera