Origin w analizie wariancji (analysis of variance - ANOVA)


Zanim przystąpi się do analizy wariancji ANOVA, konieczne jest:

  • zapoznanie się z rodzajami danych grupowanych;
  • przeprowadzenie testu normalności.

Rodzaje danych grupowanych

Obliczenia statystyczne są często wykonywane na danych grupowanych. W jednym arkuszu są gromadzone dane opisujące różne obiekty analizy. Dane tego typu mogą być ułożone w jednej kolumnie, jednakże wówczas konieczna jest druga kolumna zawierająca informacje indeksujące, przypisujące określony wiersz arkusza do określonej grupy.


Tego typu dane nazywane są indeksowanymi (indexed). Drugim wariantem zapisu danych jest ich układ kolumnowy - każda grupa w niezależnej kolumnie. Wiersze nagłówkowe w kolumnach są wykorzystywane do identyfikacji grup. Ten typ danych w środowisku programu Origin nazywany jest raw data, a w niniejszym tekście określany będzie, jako dane proste.
Origin może prowadzić analizy zarówno na danych indeksowanych jak i na danych pierwotnych, separowanych do poszczególnych kolumn. Tak też jest w przypadku analizy wariancji ANOVA. Jeśli używane są dane w formie indeksowanej, to jedna kolumna musi zawierać dane liczbowe zmiennej zależnej (objaśnianej), a w drugiej kolumnie powinien się znajdować czynnik grupujący (zmienna objaśniająca). Jeśli będzie użyta forma danych prostych, to poziom czynnika grupującego stanowi jeden z wierszy nagłówkowych kolumny danych. Jedna kolumna danych odpowiada jednemu poziomowi zmiennej
objaśniającej.


Test normalności

Analiza ANOVA może być prowadzona na danych o rozkładzie normalnym. Dlatego pierwszym krokiem musi być przeprowadzenie testu normalności dla danych każdej grupy. Dla przeprowadzenia testu normalności należy - w przypadku pracy na danych indeksowanych - posortować dane względem kolumny zmiennej objaśniającej, aby pogrupować zawartość arkusza.




Origin pozwala wykonać trzy rodzaje testów normalności: test Shapiro-Wilka, test Kołmogorowa - Smirnowa oraz test Lillieforsa. W jednej procedurze testowania mogą być uruchomione wszystkie trzy testy, ale użytkownik ma możliwość indywidualnego wyboru jednego z nich. Poziom istotności domyślnie ustawiany jest na wartość 0.05, ale możliwa jest zmiana tego parametru. Za pomocą testu normalności należy przetestować niezależnie dane w każdej grupie i dopiero, gdy można przyjąć hipotezę o normalności rozkładu dla każdej grupy, można prowadzić analizę wariancji ANOVA. Dla danych w formie prostej - separowanych do poszczególnych kolumn - test normalności może być przeprowadzony jednocześnie dla wszystkich grup danych (kolumn arkusza).





Analiza ANOVA

Okno dialogowe analizy ANOVA (jednoczynnikowa analiza wariancji - One-way ANOVA) pozwala na wybór formatu danych wejściowych, pomiędzy formatem indeksowanym (indexed) i formatem pierwotnym, grupowanym do poszczególnych kolumn (raw). Pozostałe sekcje parametrów pozwalają wybrać zakres analizy (Means Comparison, Test for Equal Variance, Power Analysis) oraz formę raportu wyjściowego z zestawem jej wyników (Output Settings, Plots).
W zależności od wybranych opcji procedura analizy w środowisku programu Origin pozwala na porównywanie średnich, testowanie równości wariancji oraz na sprawdzanie mocy testu. Procedura porównywania średnich (Means Comparison) oddaje do dyspozycji użytkownika szereg algorytmów z tego



zakresu. Dostępne są procedury: Tukey, Bonferroni, Dunn-Sidak, Fisher LSD, Scheffe, Holm-Bonferroni oraz Holm-Sidak, z czego tylko procedury Tukey, Bonferroni i Scheffe dostępne są w podstawowej wersji programu Origin, natomiast pozostałe zawarte są w Origin . Do porównywania średnich w środowisku programu Origin wykorzystywane są procedury numeryczne NAG. Testy na równość wariancji (Test for Equal Variance) przeznaczone są do sprawdzania założenia o jednorodności wariancji (homogenity of variance). Analiza ANOVA zakłada, że

poszczególne próby mają taką samą wariancję. Testy Levene’a i Browna-Forsyte’a pozwalają zweryfikować to założenie, w odniesieniu do analizowanych danych.


W prezentacji graficznej może być przedstawiony wykres słupkowy
wartości średnich dla każdej grupy (Bar Chart), wykres typu "skrzynka z wąsami: niezależnie dla każdej grupy, pozwalający porównać parametry grup (Box Chart), wykres liniowo-punktowy wartości średnich dla każdej grupy, z wartością odchylenia standardowego (SD – Standard Deviation) w formie słupków błędów (Means Plot - SD as Error) lub formę słupków błędów może przyjąć

odchylenie standardowe średniej (SE - Standard Error of Mean) (Means Plot - SD as Error). Ostatnią możliwą do wyboru pozycję w opcjach prezentacji graficznych stanowi wykres porównywania wartości średnich (Means Comparison Plot).

Analiza ANOVA występuje w środowisku programu Origin w kilku wariantach. Poza analizą jednoczynnikową (One-way ANOVA) można prowadzić obliczenia z wykorzystaniem procedury dwuczynnikowej (Two-way ANOVA) lub analizy jednoczynnikowej i dwuczynnikowej z powtarzaniem pomiarów Repeated Measures ANOVA.