Ako vykonať základnú analýzu údajov v programe Excel

Ako vykonať základnú analýzu údajov v programe Excel

Väčšinu času, keď spustíte štatistiku, chcete použiť štatistický softvér. Tieto nástroje sú navrhnuté tak, aby robili výpočty ako t -testy, chí-kvadrát testy, korelácie a podobne. Excel nie je určený na analýzu údajov. To však neznamená, že to nemôžete urobiť.





Štatistické funkcie programu Excel bohužiaľ nie sú vždy intuitívne. A zvyčajne vám poskytnú ezoterické výsledky. Takže namiesto použitia funkcií štatistiky použijeme doplnok štatistiky prechodu na program Excel: Analýza dát Toolpak.





Toolpak napriek svojmu dosť nešťastnému pravopisu obsahuje širokú škálu užitočných funkcií štatistiky. Pozrime sa, čo môžeme urobiť so štatistikou programu Excel.





Pridanie balíka nástrojov na analýzu údajov programu Excel

Zatiaľ čo vy môcť robte štatistiky bez nástroja Data Analysis Toolpak, je to s ním oveľa jednoduchšie. Ak chcete nainštalovať Toolpak v programe Excel 2016, prejdite na Súbor> Možnosti> Doplnky .

Kliknite Choď vedľa položky „Spravovať: Doplnky programu Excel“.



Vo výslednom okne začiarknite políčko vedľa Nástroj na analýzu a potom kliknite na OK .

Ak ste správne pridali nástroj na analýzu údajov do Excelu, zobrazí sa a Analýza dát tlačidlo v Údaje karta, zoskupená do Analýza sekcia:





Ak chcete ešte viac výkonu, pozrite sa na ďalšie doplnky programu Excel.

Popisná štatistika v programe Excel

Bez ohľadu na to, aký štatistický test spustíte, pravdepodobne budete chcieť najskôr získať popisnú štatistiku programu Excel. To vám poskytne informácie o priemeroch, mediánoch, rozptyle, štandardnej odchýlke a chybe, zakrivení, šikmosti a mnohých ďalších údajoch.





Spustenie popisnej štatistiky v programe Excel je jednoduché. Kliknite Analýza dát na karte Údaje vyberte Deskriptívna štatistika, a zvoľte svoj vstupný rozsah. Kliknite na šípku vedľa poľa rozsahu vstupu, kliknutím a potiahnutím vyberte údaje a kliknite na tlačidlo Zadajte (alebo kliknite na zodpovedajúcu šípku nadol), ako v nižšie uvedenom obrázku GIF.

Potom nezabudnite Excelu povedať, či vaše údaje majú štítky, či chcete výstup v novom hárku alebo na tom istom a či chcete súhrnnú štatistiku a ďalšie možnosti.

Po tom, hit OK a získate popisné štatistiky:

Študentský t-test v Exceli

The t -test je jedným z najzákladnejších štatistických testov a v programe Excel sa dá ľahko vypočítať pomocou súboru Toolpak. Kliknite na Analýza dát tlačidlo a posuňte sa nadol, kým sa nezobrazí t -možnosti testovania.

Máte tri možnosti:

  • t-test: Spárované dve vzorky pre prostriedky by sa mali použiť, keď boli vaše merania alebo pozorovania spárované. Použite to, keď ste vykonali dve merania rovnakých subjektov, napríklad meranie krvného tlaku pred a po intervencii.
  • t-test: Dve vzorky za predpokladu rovnakých odchýlok by sa mali používať, ak sú vaše merania nezávislé (čo zvyčajne znamená, že boli vykonané na dvoch rôznych skupinách subjektov). O chvíli budeme diskutovať o časti „rovnakých odchýlok“.
  • t-test: Dve vzorky za predpokladu nerovnakých odchýlok je tiež pre nezávislé merania, ale používa sa, ak sú vaše odchýlky nerovnaké.

Ak chcete otestovať, či sú odchýlky vašich dvoch vzoriek rovnaké, spustite F-test. Nájsť F-test dvoch vzoriek na odchýlky v zozname Nástroje na analýzu ho vyberte a kliknite na OK .

Zadajte svoje dve sady údajov do polí vstupného rozsahu. Nechajte alfa hodnotu 0,05, pokiaľ nemáte dôvod ho meniť - ak neviete, čo to znamená, jednoducho odíďte. Nakoniec kliknite OK .

Excel vám poskytne výsledky v novom hárku (pokiaľ ste nevybrali Výstupný rozsah a bunka v aktuálnom hárku):

Tu sa pozeráte na hodnotu P. Ak je to menej ako 0,05, máte nerovnaké odchýlky . Takže spustiť t -test, mali by ste použiť možnosť nerovnakých odchýlok.

Spustiť a t -test, vyberte príslušný test z okna Analysis Tools a vyberte obe sady vašich údajov rovnakým spôsobom ako pre F-test. Nechajte hodnotu alfa na 0,05 a stlačte OK .

Výsledky obsahujú všetko, čo potrebujete na hlásenie pre t -test: priemer, stupne voľnosti (df), t štatistika a hodnoty P pre testy s jedným alebo dvoma chvostmi. Ak je hodnota P nižšia ako 0,05, tieto dve vzorky sa výrazne líšia.

Ak si nie ste istí, či použiť jednostranný alebo dvojchvostý t -test, vyskúšaj toto vysvetlenie od UCLA .

ANOVA v Exceli

Nástroj Excel Data Analysis Toolpak ponúka tri typy analýzy rozptylu (ANOVA). Bohužiaľ vám to neposkytuje možnosť vykonať potrebné následné testy ako Tukey alebo Bonferroni. Môžete však zistiť, či existuje vzťah medzi niekoľkými rôznymi premennými.

Tu sú tri testy ANOVA v programe Excel:

  • ANOVA: Jediný faktor analyzuje rozptyl s jednou závislou premennou a jednou nezávislou premennou. Je lepšie používať viacnásobné t -testy, ak máte viac ako dve skupiny.
  • ANOVA: Dvojfaktorový s replikáciou je podobný spárovanému t -test; zahŕňa viacnásobné meranie na jednotlivých predmetoch. „Dvojfaktorová“ časť tohto testu naznačuje, že existujú dve nezávislé premenné.
  • ANOVA: Dvojfaktorový bez replikácie zahŕňa dve nezávislé premenné, ale pri meraní nedochádza k replikácii.

Tu sa pozrieme na jednofaktorovú analýzu. V našom prípade sa pozrieme na tri sady čísel s označením „Intervencia 1“, „Intervencia 2“ a „Intervencia 3“. Ak chcete spustiť ANOVA, kliknite na Analýza dát , potom vyberte ANOVA: Jediný faktor .

Vyberte vstupný rozsah a nezabudnite aplikácii Excel povedať, či sú vaše skupiny v stĺpcoch alebo riadkoch. Tiež som tu vybral „Menovky v prvom riadku“, aby sa vo výsledkoch zobrazovali názvy skupín.

Po zasiahnutí OK , získame nasledujúce výsledky:

Všimnite si toho, že hodnota P je menšia ako 0,05, takže máme významný výsledok. To znamená, že medzi najmenej dvoma skupinami v teste je významný rozdiel. Ale pretože Excel neposkytuje testy na stanovenie ktoré skupiny sa líšia, najlepšie, čo môžete urobiť, je pozrieť sa na priemery zobrazené v súhrne. V našom prípade Intervencia 3 vyzerá, že je pravdepodobne ten, ktorý sa líši.

To nie je štatisticky zdravé. Ale ak chcete len zistiť, či je v tom rozdiel, a zistiť, ktorá skupina to pravdepodobne spôsobuje, bude to fungovať.

Dvojfaktorová ANOVA je komplikovanejšia. Ak sa chcete dozvedieť viac o tom, kedy použiť dvojfaktorovú metódu, pozri toto video zo serveru Sophia.org a ' bez replikácie 'a' s replikáciou „Príklady zo skutočnej štatistiky.

Korelácia v programe Excel

Výpočet korelácie v programe Excel je oveľa jednoduchší ako t -test alebo ANOVA. Použi Analýza dát tlačidlo, čím sa otvorí okno Analytické nástroje a zvoľte Korelácia .

Vyberte rozsah vstupov, identifikujte svoje skupiny ako stĺpce alebo riadky a povedzte Excelu, či máte štítky. Po tom, hit OK .

Nezískate žiadne opatrenia významnosti, ale môžete vidieť, ako každá skupina súvisí s ostatnými. Hodnota jedna je absolútna korelácia, čo naznačuje, že hodnoty sú úplne rovnaké. Čím bližšie k jednej je hodnota korelácie, tým je korelácia silnejšia.

Regresia v programe Excel

Regresia je jedným z najčastejšie používaných štatistických testov v priemysle a Excel na tento výpočet obsahuje prekvapivo veľa energie. Tu v programe Excel spustíme rýchlu viacnásobnú regresiu. Ak nie ste oboznámení s regresiou, pozrite sa na to Príručka HBR k využívaniu regresie na podnikanie .

Povedzme, že našou závislou premennou je krvný tlak a našimi dvoma nezávislými premennými sú hmotnosť a príjem soli. Chceme zistiť, ktorý je lepší prediktor krvného tlaku (alebo či sú obaja dobrí).

Kliknite Analýza dát a vyberte Regresia . Pri vyplňovaní polí vstupného rozsahu tentokrát musíte byť opatrní. The Vstup Y Rozsah pole by malo obsahovať vašu jedinú závislú premennú. The Vstup X Rozsah box môže obsahovať viacero nezávislých premenných. Kvôli jednoduchej regresii sa o ostatné nestarajte (nezabudnite však povedať Excelu, ak ste vybrali štítky).

Náš výpočet vyzerá takto:

Po zasiahnutí OK , získate veľký zoznam výsledkov. Tu som vyzdvihol hodnotu P pre hmotnosť aj príjem soli:

Ako vidíte, hodnota P pre hmotnosť je väčšia ako 0,05, takže tam neexistuje žiadny významný vzťah. P-hodnota soli je však nižšia ako 0,05, čo naznačuje, že je dobrým prediktorom krvného tlaku.

Ak plánujete prezentovať svoje regresné údaje, pamätajte na to, že do bodového diagramu v programe Excel môžete pridať regresný riadok. To je a skvelá vizuálna pomôcka pre túto analýzu.

Štatistiky programu Excel: Prekvapivo schopné

Aj keď Excel nie je známy svojou štatistickou silou, v skutočnosti obsahuje niekoľko skutočne užitočných funkcií, ako napr nástroj PowerQuery , čo je praktické pri úlohách, ako je kombinovanie množín údajov. (Prečítajte si, ako vygenerovať prvý skript Microsoft Power Query.) K dispozícii je tiež štatistický doplnok Nástroj na analýzu údajov, ktorý skutočne prináša niektoré z najlepších funkcií programu Excel. Dúfam, že ste sa naučili používať Toolpak a že sa teraz môžete hrať sami a prísť na to, ako používať ďalšie jeho funkcie.

aká pieseň je v tomto videu

Keď to budete mať teraz pod palcom, posuňte svoje znalosti Excelu na vyššiu úroveň s našimi článkami o pomocou funkcie Hľadanie cieľa v Exceli na ďalšie skríženie dát a hľadanie hodnôt pomocou vlookup . V určitom okamihu sa možno budete chcieť naučiť importovať údaje programu Excel do Pythonu.

zdieľam zdieľam Tweet E -mail Odstráňte tieto súbory a priečinky systému Windows, aby ste uvoľnili miesto na disku

Potrebujete uvoľniť miesto na disku v počítači so systémom Windows? Tu sú súbory a priečinky Windows, ktoré je možné bezpečne odstrániť, aby sa uvoľnilo miesto na disku.

Čítajte ďalej
Súvisiace témy
  • Produktivita
  • Tabuľka
  • Microsoft Excel
O autorovi Potom Albright(506 publikovaných článkov)

Dann je poradca pre stratégiu obsahu a marketing, ktorý pomáha spoločnostiam vytvárať dopyt a potenciálnych zákazníkov. Píše tiež blogy o stratégii a obsahovom marketingu na dannalbright.com.

Viac od Danna Albrighta

prihlásiť sa ku odberu noviniek

Pripojte sa k nášmu bulletinu a získajte technické tipy, recenzie, bezplatné elektronické knihy a exkluzívne ponuky!

Kliknutím sem sa prihlásite na odber