Statystyka

Article

February 7, 2023

Statystyka to nauka zajmująca się planowaniem, gromadzeniem, analizowaniem, interpretacją i prezentacją danych. Krótko mówiąc, statystyka jest nauką zajmującą się danymi. Termin statystyka różni się od statystyki. Statystyka zasadniczo działa na podstawie danych liczbowych, które są wynikiem obliczeń lub wyników pomiarów, które są przeprowadzane przy użyciu danych kategorycznych, które są klasyfikowane według określonych kryteriów.Statystyka jest nauką związaną z danymi. Statystyka to same dane, informacje lub wynik zastosowania algorytmów statystycznych do tych danych. Ze zbioru danych statystyki można wykorzystać do podsumowania lub opisania danych; To się nazywa statystyka opisowa. Informacje są wówczas rejestrowane i gromadzone zarówno w postaci informacji liczbowych, jak i informacji kategorycznych, które określane są jako obserwacja. Większość podstawowych pojęć statystyki zawiera założenia dotyczące teorii prawdopodobieństwa. Niektóre terminy statystyczne obejmują: populacja, próba, jednostka próby, prawdopodobieństwo. Statystyka znalazła również szerokie zastosowanie w różnych dyscyplinach naukowych, zarówno w naukach przyrodniczych (np. astronomia i biologia, jak i społecznych (w tym socjologia i psychologia), a także w biznesie (dot. produktów itp.), ekonomii i przemyśle. Statystyka Jest również używany w rządzie do osiągnięcia różnych celów; spis ludności jest jedną z najbardziej znanych procedur. Popularne są też inne aplikacje statystyczne, a mianowicie sondaże lub procedury sondażowe (przeprowadzane np. przed wyborami powszechnymi), a także quick counts (szybkie obliczenie wyników wyborów) lub Quick counts. W dziedzinie informatyki statystyka może być również stosowana w rozpoznawaniu wzorców i sztucznej inteligencji („AI”).

Historia

Rozwój statystyki następował równolegle z rozwojem historii ludzkości. Dane statystyczne były wykorzystywane przez ludy Mezopotamii, Egiptu i Chin w epoce przed Chrystusem. Korzystają ze statystyk, aby uzyskać informacje o wysokości podatków, które musi zapłacić każdy mieszkaniec i ilości produktów rolnych. W czasach starożytnej Grecji Arystoteles posługiwał się statystyką w swojej książce zatytułowanej Politea. Arystoteles używa statystyki do wyjaśnienia danych o stanie 158 krajów. W średniowieczu w Kościele rozwinęła się statystyka, która służyła do rejestrowania liczby urodzeń, zgonów i ślubów. W XVII wieku statystyka była stosowana w Anglii jako arytmetyka polityczna. Termin statystyka został następnie zaproponowany przez niemieckiego matematyka Gottfrieda Achenwalla (1719-1772), aw XVIII wieku spopularyzowany przez Johna Sinclaira (1791-1799) w jego książce Statistical Account of Scotland. W XIX i na początku XX wieku statystyka zaczęła szeroko wykorzystywać dziedziny matematyki, zwłaszcza prawdopodobieństwo. Gałąź statystyki, która jest obecnie najszerzej wykorzystywana do wspierania metody naukowej, wnioskowanie statystyczne, została opracowana w drugiej połowie XIX i na początku XX wieku przez Karla Pearsona (wprowadzenie metody regresji liniowej i terminu odchylenia standardowego w 1894 r.), Ronald Fisher (ojcowie założyciele statystyki inferencyjnej i publikujący Projekt eksperymentów w 1935 r.) oraz William Sealey Gosset (badający problemy małych próbek). Można powiedzieć, że dzisiejsze wykorzystanie statystyki dotknęło wszystkich dziedzin nauki, od astronomii po językoznawstwo. Dziedziny ekonomii, biologii i jej gałęzi stosowanych, a także psychologii są w swojej metodologii pod silnym wpływem statystyki. W rezultacie narodziły się nauki łączone, takie jak ekonometria, biometria (lub biostatystyka) i psychometria. Chociaż są tacy, którzy uważają statystykę za gałąź matematyki, inni uważają statystykę za dziedzinę, która ma wiele wspólnego z matematyką, patrząc na jej historię i zastosowania. W Indonezji większość opracowań statystycznych obejmuje wydziały matematyki i nauk przyrodniczych, zarówno na odrębnych wydziałach, jak iw powiązaniu z matematyką. biologia i jej gałęzie stosowane, a także psychologia są w swojej metodologii pod silnym wpływem statystyki. W rezultacie narodziły się nauki łączone, takie jak ekonometria, biometria (lub biostatystyka) i psychometria. Chociaż są tacy, którzy uważają statystykę za gałąź matematyki, inni uważają statystykę za dziedzinę, która ma wiele wspólnego z matematyką, patrząc na jej historię i zastosowania. W Indonezji większość opracowań statystycznych obejmuje wydziały matematyki i nauk przyrodniczych, zarówno na odrębnych wydziałach, jak iw powiązaniu z matematyką. biologia i jej gałęzie stosowane, a także psychologia są w swojej metodologii pod silnym wpływem statystyki. W rezultacie narodziły się nauki łączone, takie jak ekonometria, biometria (lub biostatystyka) i psychometria. Chociaż są tacy, którzy uważają statystykę za gałąź matematyki, inni uważają statystykę za dziedzinę, która ma wiele wspólnego z matematyką, patrząc na jej historię i zastosowania. W Indonezji większość opracowań statystycznych obejmuje wydziały matematyki i nauk przyrodniczych, zarówno na odrębnych wydziałach, jak iw powiązaniu z matematyką. Chociaż są tacy, którzy uważają statystykę za gałąź matematyki, inni uważają statystykę za dziedzinę, która ma wiele wspólnego z matematyką, patrząc na jej historię i zastosowania. W Indonezji większość opracowań statystycznych obejmuje wydziały matematyki i nauk przyrodniczych, zarówno na odrębnych wydziałach, jak iw powiązaniu z matematyką. Chociaż są tacy, którzy uważają statystykę za gałąź matematyki, inni uważają statystykę za dziedzinę, która ma wiele wspólnego z matematyką, patrząc na jej historię i zastosowania. W Indonezji większość opracowań statystycznych obejmuje wydziały matematyki i nauk przyrodniczych, zarówno na odrębnych wydziałach, jak iw powiązaniu z matematyką.

Kilku statystów

Carl Gauss Blaise Pascal Sir Francis Galton William Sealey Gosset (dikenal dengan sebutan „Student”) Karl Pearson Sir Ronald Fisher Gertrude Cox Charles Spearman Pafnuty Chebyshev Aleksandr Lyapunov Isaac Newton Abraham De Moivre Adolphe Quetelet Florence Nightingale John Tukey George Dantzig Thomas Bayes

Podstawowe koncepcje

Korelacja

Korelacja w statystyce to związek między dwiema lub więcej zmiennymi. Dwie zmienne, które są ze sobą powiązane, nazywane są korelacjami dwuwymiarowymi, podczas gdy związek między więcej niż dwiema zmiennymi nazywany jest korelacją wielowymiarową.

Typ

Istnieją dwa rodzaje statystyk, a mianowicie statystyki opisowe i statystyki inferencyjne. Podział na statystyki opisowe i statystyki wnioskowania dokonywany jest na podstawie wykonanych czynności. Statystyki opisowe dotyczą opisu danych, na przykład z obliczania średniej i wariancji surowych danych; opisać za pomocą tabel lub wykresów, aby surowe dane były łatwiejsze do „odczytania” i bardziej znaczące. Tymczasem statystyki wnioskowania wykraczają poza to, na przykład testując hipotezy, przewidując przyszłe obserwacje lub tworząc modele regresji.

Na podstawie sposobu prezentacji

Opisowe statystyki

Statystyki opisowe to statystyki, które zbierają informacje w formie opisów. Uzyskane informacje dzielą się na dwa rodzaje, a mianowicie koncentrację danych i dystrybucję danych. Scentralizowanie danych dostarcza informacji o średnich, średnich i najwyższych wartościach zbioru danych. Natomiast rozkład danych dostarcza informacji o zakresie danych, odchyleniu średnim, wariancji i odchyleniu standardowym. Statystyki opisowe dotyczące sposobu, w jaki dane mogą być opisywane lub sumowane, liczbowo lub graficznie, aby uzyskać wgląd w dane, ułatwiając ich odczytanie i zwiększenie znaczenia. Statystyka opisowa to metoda związana ze zbieraniem lub prezentacją danych w celu dostarczenia użytecznych informacji.

Statystyki inferencyjne

Statystyka inferencyjna zajmuje się modelowaniem danych i podejmowaniem decyzji na podstawie analizy danych, na przykład testowaniem hipotez, szacowaniem przyszłych obserwacji (estymacja lub predykcja), modelowaniem zależności (korelacja, regresja, ANOVA, szeregi czasowe) i tak dalej. Statystyka inferencyjna to metoda, której można użyć do analizy małych grup danych rodzicielskich lub próbek pobranych z populacji. Tak, że w prognozowaniu, a także może wyciągać wnioski na temat macierzystej grupy danych lub populacji. Ta statystyka inferencyjna jest podsumowaniem wszystkich metod lub sposobów związanych z analizą niektórych danych. Które następnie doprowadzą do prognozowania lub wyciągania wniosków na temat ogólnych danych rodziców z tej populacji. Uogólnienia, które mają powiązania ze statystyką wnioskowania, mają niepewne właściwości. Dzieje się tak dlatego, że opiera się na częściowych informacjach uzyskanych z niektórych danych, więc uzyskiwane są jedynie prognozy.

Na podstawie poziomu użyteczności

Statystyki stosowane

Niektóre nauki używają statystyki stosowanej, więc mają specyficzną terminologię. Dyscypliny te obejmują: Aktuarialne (zastosowanie statystyki w dziedzinie ubezpieczeń) Biostatystyka lub biometria (zastosowanie statystyki w biologii) Statystyka biznesowa Ekonometria Psychometria Statystyka społeczna Statystyka inżynierska lub technometria Fizyka statystyczna Demografia Eksploracja danych (rozpoznawanie wzorców) Znajomość statystyki Analiza procesu i chemometria (do analizy danych chemicznych, analizy i inżynierii chemicznej) Statistics udostępnia narzędzia do analizy danych dla różnych dyscyplin. Jego zastosowania są wielorakie: badanie zmian wynikających z pomiarów, kontrolowanie procesów, formułowanie informacji na podstawie danych i wspomaganie podejmowania decyzji na podstawie danych. Statystyka, ze względu na swój obiektywny charakter,

Statystyki zdrowia

Statystyki zdrowotne to rodzaj statystyki stosowanej, która wykorzystuje metody statystyczne do rozwiązywania problemów zdrowotnych. Dziedzina statystyki zdrowia omawia komponenty cyklu życia, takie jak statystyka zgonów, urodzeń i małżeństw. Ponadto statystyka zdrowotna obejmuje również statystyki służby zdrowia, które obejmują wyniki działalności służby zdrowia. Statystyka zdrowia została po raz pierwszy zastosowana przez Johna Graunta w 1662 roku, kiedy odnotował śmierć. Stosowanie i rozwój statystyk zdrowotnych było następnie kontynuowane przez innych uczonych, takich jak William Farr i Karl Pearson.

Statystyka metody

Istnieją dwa główne rodzaje badań, a mianowicie eksperymenty i ankiety. Obaj badali wpływ zmian na zmienne objaśniające i zachowanie zmiennych odpowiedzi w wyniku tych zmian. Różnica między nimi polega na sposobie przeprowadzania badania.Eksperyment polega na pomiarze badanego systemu, poddaniu go obróbce, a następnie (ponownemu) pomiarowi w ten sam sposób w systemie, który został poddany obróbce, aby sprawdzić, czy zabieg zmienia wartość pomiaru. Kurację można również stosować jednocześnie i jednocześnie mierzyć efekt. Metody statystyczne związane z realizacją eksperymentu badano w układzie eksperymentalnym (projekt eksperymentalny), natomiast w badaniach ankietowych nie przeprowadzano manipulacji badanym systemem. Zbierane są dane i badany jest związek (korelacja) między różnymi zmiennymi, aby uzyskać przegląd obiektu badawczego. Technik ankietowych uczy się w metodzie ankietowej. Badania typu eksperymentalnego przeprowadza się głównie w naukach inżynierskich, na przykład inżynierii, naukach o żywności, agronomii, farmacji, marketingu i psychologii eksperymentalnej. Badania typu obserwacyjnego najczęściej prowadzi się w naukach społecznych lub związanych z codziennymi zachowaniami, np. w ekonomii, psychologii i pedagogice, medycynie społecznej, przemyśle.

Skala pomiarowa

Istnieją cztery rodzaje skal pomiarowych stosowanych w statystyce, a mianowicie nominalna, porządkowa, przedziałowa i ilorazowa. Cztery skale pomiarowe mają różne poziomy wykorzystania w przetwarzaniu statystycznym.

Nominalna skala

Skala nominalna to skala pomiarowa, która określa wartość pomiaru na podstawie kategorii lub grupy podmiotu. Każdej grupie w ramach kategorii przypisany jest kod numeryczny, który działa jak etykieta kategorii. Każda etykieta nie ma żadnego znaczenia i nie ma wartości wewnętrznej. Na skali nominalnej nie oblicza się wartości średniej i odchylenia standardowego. Etykietowanie służy tylko do rozróżnienia każdej istniejącej kategorii podczas obliczania całkowitej liczby kategorii. W skali nominalnej zastosowany test statystyczny jest testem statystycznym opartym na obliczeniach z rozkładem modów i częstotliwości. Skala nominalna również nie wykorzystuje struktury poziomów ilościowych ani jakościowych w prezentowanych danych.

Skala porządkowa

Skala porządkowa to skala, która kategoryzuje zmienne w grupy i klasyfikuje kategorie. Każdej kategorii przypisywana jest inna wartość, aby określić kolejność wszystkich istniejących kategorii. Różnica w wartości preferencji każdej kategorii nie jest określona przez podobieństwo różnicy w liczbach z każdej oznaczonej kategorii. Dane uzyskane ze skali nominalnej nazywane są danymi porządkowymi. Skala porządkowa wykorzystuje testy statystyczne w postaci modalnej, mediany, rozkładu częstości oraz statystyki nieparametrycznej. W skali nominalnej mierzona zmienna nazywana jest zmienną nieparametryczną.

Interwał skali

Skala interwałowa jest liczbą ilościową, ale nie ma wartości zera bezwzględnego, dzięki czemu punkt zerowy można przesunąć w miarę jak osoba go mierzy, na przykład rok i temperaturę w stopniach Celsjusza.

Skala proporcji

Skala ilorazowa to liczba ilościowa, która ma wartość zera bezwzględnego i nie można jej dowolnie przesuwać, na przykład temperatura w kelwinach, długość i masa.

Technika analizy

Istnieją różne techniki statystyczne stosowane w badaniach, zwłaszcza w testowaniu hipotez. Stosując statystykę do problemów naukowych, przemysłowych lub społecznych, należy zacząć od badania populacji. Znaczenie populacji w statystyce może oznaczać populację istot żywych, obiektów nieożywionych lub obiektów abstrakcyjnych. Populacja może być również miarą procesu w różnych momentach, co jest znane jako szereg czasowy. Zbieranie danych (zbieranie danych) dla całej populacji nazywa się spisem powszechnym. Spis z pewnością wymaga czasu i wysokich kosztów. Z tego powodu w statystyce często przeprowadza się dobór próby, a mianowicie niewielką część populacji, która może reprezentować całą populację. Analiza danych z próby posłuży do uogólnienia całej populacji. Jeśli pobrana próba jest wystarczająco reprezentatywna, wnioskowanie (podejmowanie decyzji) i wnioski wyciągnięte z próby można wykorzystać do opisania populacji jako całości. Statystyczna metoda pobierania właściwej próbki nazywana jest techniką pobierania próbek. Analiza statystyczna wykorzystuje duże prawdopodobieństwo jako swoją podstawową koncepcję.Można zauważyć, że wiele testów statystycznych opiera się na rozkładzie szans. Tymczasem matematyka statystyczna jest gałęzią matematyki stosowanej, która wykorzystuje teorię prawdopodobieństwa i analizę matematyczną do uzyskania podstaw teorii statystycznej. Statystyczna metoda pobierania właściwej próbki nazywana jest techniką pobierania próbek. Analiza statystyczna wykorzystuje duże prawdopodobieństwo jako swoją podstawową koncepcję.Można zauważyć, że wiele testów statystycznych opiera się na rozkładzie szans. Tymczasem matematyka statystyczna jest gałęzią matematyki stosowanej, która wykorzystuje teorię prawdopodobieństwa i analizę matematyczną do uzyskania podstaw teorii statystycznej. Statystyczna metoda pobierania właściwej próbki nazywana jest techniką pobierania próbek. Analiza statystyczna wykorzystuje duże prawdopodobieństwo jako swoją podstawową koncepcję.Można zauważyć, że wiele testów statystycznych opiera się na rozkładzie szans. Tymczasem matematyka statystyczna jest gałęzią matematyki stosowanej, która wykorzystuje teorię prawdopodobieństwa i analizę matematyczną do uzyskania podstaw teorii statystycznej.

Analiza wielowymiarowa

Analiza wielowymiarowa to technika analizy przeprowadzana jednocześnie na wielu zmiennych badawczych. Minimalna liczba zmiennych do przeprowadzenia analizy wielowymiarowej to więcej niż dwie zmienne. Analiza wielowymiarowa to rozwinięcie analizy jednowymiarowej i analizy dwuwymiarowej. Zastosowanie analizy wielowymiarowej przeprowadza się, gdy pojawiają się problemy spowodowane brakiem zgodności oczekiwań z rzeczywistością. Analiza wielowymiarowa jest stosowana przy założeniu, że każdy problem musi mieć więcej niż jeden czynnik sprawczy. Istnieją trzy rodzaje technik analizy wielowymiarowej, a mianowicie techniki zależne, techniki współzależne i techniki równań strukturalnych. Technikę zależną stosuje się, gdy na zmienną zależną wpływa zmienna niezależna. Technika współzależności jest stosowana, jeśli wszystkie zmienne są zmiennymi niezależnymi.

Analiza regresji

Celem wykorzystania analizy regresji w statystyce jest wyznaczenie równania regresji, którego można użyć do oszacowania wartości zmiennej zależnej.Kilka testów i procedur szeroko stosowanych w badaniach obejmuje: analizę regresji i korelacji analizę chi-kwadrat wariancji ( ANOVA) Test t-Studenta

Analiza porównawcza

Analiza porównawcza to testowanie parametrów populacji w formie porównań. Test jest przeprowadzany na próbie wielkości, która ma również formę porównania. Hipoteza jest testowana w celu ustalenia istnienia różnic między badanymi zmiennymi. Stwierdzone rozbieżności ustala się następnie przyczynę ich wystąpienia. Uzyskane wnioski mogą mieć postać zależności między zmiennymi lub mogą wystąpić przypadkowo.

Oprogramowanie

Większość współczesnych obliczeń statystycznych jest wykonywana przez komputery, a nawet niektóre obliczenia mogą być wykonywane tylko przez szybkie komputery, takie jak sztuczne sieci neuronowe. Rewolucja komputerowa ma implikacje dla przyszłego rozwoju statystyki, z nowym naciskiem na statystykę eksperymentalną i empiryczną.

Spójrz na to

Analiza wariancji (ANOVA) Analiza regresji Lista krajowych i międzynarodowych agencji statystycznych Lista publikacji statystycznych dotyczących rozwoju regionalnego Lista tematów statystycznych Lista statystyków Nadużycia statystyki Statystyki wielowymiarowe

Odniesienie

bibliografia

Anwar Ali (2009). Statystyki dla badań edukacyjnych i ich zastosowań z SPSS i Excel (PDF). Kediri: IAIT Press. ISBN 978-979-18633-2-2 . Haryono, Siswono (2016). Metody SEM do badań zarządzania z AMOS LISREL PLS (PDF) . Bekasi: Agencja Wydawnicza PT Intermedia Personalia Utama. ISBN 978-979-99568-3-5 . Nuryadi i in. (2017). Podstawy statystyki badawczej (PDF) . Yogyakarta: Gramasurya. ISBN 978-602-6558-04-6 . Prime K., Echo (2016). Przetwarzanie danych pracy dyplomowej za pomocą SPSS 22 (PDF). Bangka: Management Computer Laboratory, Wydział Ekonomii, University of Bangka Belitung. ISBN 978-602-60185-0-2 . Yuantari, C. i Handayani, S. (2017). Biostatystyka opisowa i inferencyjna. Semarang: Agencja wydawnicza Uniwersytetu Dian Nuswantoro. ISBN 979-26-0282-8 . CS1 maint: Wiele nazwisk: lista autorów ( link )

Dalsza lektura

Lindley, D. Podejmowanie decyzji. Johna Wileya. Wydanie drugie 1985. ISBN 0-471-90808-8

Linki zewnętrzne

(Indonezja) Wyjaśnienie rozkładu statystycznego dla uczniów szkół średnich (Indonezja) Wyższa Szkoła Statystyczna (STIS) (Indonezja) Centralne Biuro Statystyczne (BPS) Indonezja (Indonezja) Indonezyjskie Stowarzyszenie Statystyki (Wielka Brytania) Międzynarodowy Instytut Statystyczny (Wielka Brytania) Witryna dotycząca prawdopodobieństwa

Original article in Indonesian language