Książka jest monografią poświęcona metodom statystycznej analizy
danych jakościowych, nazywanych bardziej precyzyjnie danymi niemetrycznymi, oraz danych
symbolicznych o bardziej złożonej strukturze.
Ma charakter teoretyczno-empiryczny – poza wyczerpującym omówieniem takich
metod, jak: analiza korespondencji, modele logitowe i probitowe, analiza wariancji, modele
klas ukrytych itd., zawiera przykłady ich wykorzystania do rozwiązania rzeczywistych
problemów występujących w analizie danych.
Rozwiązania tych problemów zostały przygotowane w postaci procedur w
języku R, których działanie Czytelnik może samodzielnie zweryfikować.
Publikacja może być przydatna dla badaczy i praktyków, którzy zajmują się
problematyką analizy danych niemetrycznych, nieprecyzyjnych i nieostrych. Zainteresuje
więc z pewnością ekonomistów, psychologów, socjologów, biologów, botaników,
archeologów, lekarzy i innych badaczy i praktyków. Polecamy ją studentom takich
kierunków, jak: informatyka i ekonometria, analityka gospodarcza, informatyka,
matematyka, ekonomia.
Na stronach internetowych http://keii.ue.wroc.pl znajdują się pliki zawierające
wszystkie wykorzystywane dane oraz procedury realizujące zastosowania zamieszczone w
książce.
Spis treści:
Wstęp
Rozdział 1. Wprowadzenie do analizy danych jakościowych i symbolicznych
1.1. Macierz danych i tablica danych
1.2. Miary odległości
1.2.1. Dane porządkowe
1.2.2. Dane symboliczne
1.3. Dyskretyzacja zmiennych ilościowych
1.4. Wybrane rozkłady prawdopodobieństwa zmiennych dyskretnych
1.5. Wizualizacja danych
Rozdział 2. Analiza korespondencji
2.1. Wprowadzenie
2.2. Tablice kontyngencji
2.3. Analiza zależności miedzy zmiennymi
2.4. Analiza korespondencji dwu i wielu zmiennych
2.5. Wizualizacja wyników klasycznej i wielowymiarowej analizy korespondencji
2.6. Zastosowania z wykorzystaniem programu R
Rozdział 3. Modele logarytmiczno-liniowe
3.1. Wprowadzenie
3.2. Klasyczny model logarytmiczno-liniowy
3.3. Hierarchiczne modele logarytmiczno-liniowe
3.4. Miary dopasowania modeli logarytmiczno-liniowych
3.5. Zastosowania z wykorzystaniem programu R
Rozdział 4. Modelowanie i prognozowanie zmiennych dwumianowych
4.1. Wprowadzenie
4.2. Liniowy model prawdopodobieństwa (LMP)
4.3. Modele logitowe i probitowe
4.4. Prognozy na podstawie modeli dwumianowych
4.5. Zastosowania z wykorzystaniem programu R
Rozdział 5. Modelowanie zmiennych wielomianowych
5.1. Wprowadzenie
5.2. Wielomianowy model logitowy
5.3. Warunkowy model logitowy
5.4. Analiza historii zdarzeń
5.5. Zastosowania z wykorzystaniem programu R
Rozdział 6. Analiza wariancji
6.1. Podstawy teoretyczne
6.1.1. Jednoczynnikowa analiza wariancji
6.1.2. Dwuczynnikowa analiza wariancji
6.1.3. Założenia analizy wariancji
6.1.4. Testy post hoc
6.2. Podstawowe schematy badań
6.3. Zastosowania z wykorzystaniem programu R
Rozdział 7. Analiza skupień i porządkowanie liniowe na podstawie danych
porządkowych
7.1. Wprowadzenie
7.2. Analiza skupień na podstawie danych porządkowych
7.3. Porządkowanie liniowe na podstawie danych porządkowych
7.4. Zastosowania z wykorzystaniem programu R
Rozdział 8. Drzewa klasyfikacyjne i regresyjne dla jakościowych zmiennych
objaśniających
8.1. Podstawy teoretyczne
8.2. Drzewa klasyfikacyjne i regresyjne
8.3. Dobór jakościowych zmiennych objaśniających
8.4. Określenie optymalnej postaci modelu
8.5. Zastosowania z wykorzystaniem programu R
Rozdział 9. Modele klas ukrytych dla danych jakościowych
9.1. Wprowadzenie
9.2. Model klas ukrytych dla zmiennych binarnych i wielomianowych
9.3. Model regresji klas ukrytych
9.4. Zastosowania z wykorzystaniem programu R
Rozdział 10. Modele mieszanek dla danych jakościowych
10.1. Wprowadzenie
10.2. Model GLM
10.3. Modele mieszanek – podstawy teoretyczne
10.4. Modele mieszanek rozkładów dwumianowych
10.5. Modele mieszanek rozkładów Poissona
10.6. Zastosowania z wykorzystaniem programu R
Rozdział 11. Skalowanie wielowymiarowe na podstawie danych jakościowych i
symbolicznych
11.1. Procedury skalowania wielowymiarowego na podstawie danych jakościowych
11.2. Analiza unfolding
11.3. Skalowanie wielowymiarowe na podstawie danych symbolicznych
11.4. Zastosowania z wykorzystaniem programu R
Rozdział 12. Analiza skupień na podstawie danych symbolicznych
12.1. Wprowadzenie
12.2. Podejścia i metody klasyfikacji danych symbolicznych
12.3. Procedura klasyfikacji danych symbolicznych
12.4. Zastosowania z wykorzystaniem programu R
Rozdział 13. Analiza dyskryminacyjna i drzewa klasyfikacyjne na podstawie danych
symbolicznych
13.1. Analiza dyskryminacyjna bazująca na estymatorach intensywności
13.2. Drzewa klasyfikacyjne bazujące na optymalnym podziale
13.3. Bayesowskie drzewa klasyfikacyjne
13.4. Zastosowania z wykorzystaniem programu R
Dodatek A. Format danych symbolicznych
Bibliografia
Indeks
310 stron, miękka oprawa