Hvordan beregner jeg denne statistikken?

stemmer
12

Jeg skriver en app for å bidra noen undersøkelser, og en del av dette innebærer å gjøre noen statistiske beregninger. Akkurat nå er forskerne ved hjelp av et program kalt SPSS . En del av produksjonen som de bryr seg om utseende som dette:

[En

De er egentlig bare bekymret Fog Sig.verdier. Mitt problem er at jeg ikke har noen bakgrunn i statistikk, og jeg kan ikke finne ut hva testene er kalt, eller hvordan man skal beregne dem.

Jeg trodde Fverdien kan være et resultat av F-test , men etter trinnene gitt på Wikipedia, jeg fikk et resultat som var forskjellig fra hva SPSSgir.

Publisert på 04/08/2008 klokken 22:56
kilden bruker
På andre språk...                            


6 svar

stemmer
4

Dette nettstedet kan hjelpe deg ut litt mer. Også dette en .

Jeg jobber fra en ganske rusten minne om en statistikk kurs, men her går ingenting:

Når du gjør variansanalyse (ANOVA), du faktisk beregne F-statistikken som forholdet fra middelkvadrat avvik "mellom grupper" og middelkvadratavvik "innen gruppene". Den andre linken over virker ganske bra for denne beregningen.

Dette gjør F-statistikken måle nøyaktig hvor kraftig modellen din er fordi avviket "mellom gruppene" er forklaringskraft, og "innenfor gruppene" varians er tilfeldige feil. Høy F innebærer en meget betydelig modell.

Som i mange statistiske operasjoner, deg tilbake bestemme Sig. ved hjelp av F-statistikken. Her er hvor Wikipedia informasjonen kommer i litt hendig. Hva du ønsker å gjøre er - ved hjelp av frihetsgrader gitt til deg av SPSS - finne den riktige P verdien som en F bordet vil gi deg F-statistikken du beregnet. P-verdien hvor dette skjer [F (tabell) = F (beregnet)] er den betydning.

Begrepsmessig viser en lavere verdi betydning en meget sterk evne til å forkaste nullhypotesen (som for dette formål vil si å bestemme modellen har forklaringskraft).

Beklager til alle matematiske folk hvis noe av dette er feil. Jeg skal sjekke tilbake for å gjøre endringer !!!

Lykke til. Statistikk er gøy, bare kanskje ikke denne delen. =)

Svarte 04/08/2008 kl. 23:32
kilden bruker

stemmer
3

Jeg antar fra spørsmålet ditt at forskerkolleger ønsker å automatisere prosessen der visse statistiske analysene er utført (dvs. de ønsker å batch prosess datasett). Du har to alternativer:

1) SPSS er nå prosedyre gjennom python (fra versjon 15) - gå til spss.com og søke etter python. Du kan skrive python skript for å automatisere dataanalyser og trekke ut nøkkelverdier fra pivottabeller, og deretter behandle svarene slik du vil. Dette har i kraft av å tillate en nøyaktig sammenligning mellom resultatene fra Python-skript og hånd beregnet innsats i SPSS dine samarbeidspartnere. Dermed trenger du ikke å virkelig vite noen statistikk å gjøre dette arbeidet (som er en viktig fordel)

2) Du kan gjøre dette i R, en gratis statistikk miljø, som trolig kan bli regisserte. Dette har den ulempen at du må lære statistikk for å sikre at du gjør det riktig.

Svarte 22/09/2008 kl. 03:29
kilden bruker

stemmer
2

Kort sagt: ikke gjør dette for hånd, link / bruk eksisterende programvare. Og sain_grocen svar er feil. :(

Disse er alle tester for betydningen av parameterestimatene som vanligvis brukes i multivariat-respons flere regresjoner. Disse vil ikke være enkle ting å gjøre utenfor en statistisk programmeringsmiljø. Jeg foreslår enten å få resultatet fra en pre-eksisterende statistikkprogrammet, eller bruke en som du kan koble til og bruke denne koden.

Jeg er redd for at det første svaret (sain_grocen s) vil føre deg ned på feil bane. Hans forklaring er trolig av et spesialtilfelle av hva du faktisk arbeider med. Anova forklart i sine koblinger er for en enkelt varians respons på en balansert design. Dette er ikke de F statistikken du ser. Navnene i utskriften (Pillai sin Trace, Ling sin Trace, ...) er noen av de tilgjengelige multivariate versjoner. De har F fordelinger under visse forutsetninger. Jeg kan ikke forklare en lærebøker verdt av materiale her, vil jeg råde deg til å begynne med å se på "Applied Multivariate Statistical Analysis" av Johnson og Wichern

Svarte 16/09/2008 kl. 23:17
kilden bruker

stemmer
2

Statistikk er vanskelig :-). Etter et år med lesing og re-lese bøker og papirer og kan bare si med sikkerhet at jeg forstår det grunnleggende av det.

Du ønsker kanskje å undersøke ferdige biblioteker for hvilken programmeringsspråk du bruker, fordi de er mange fikser sin i matematikk generelt og statistikk spesielt (avrundingsfeil er et opplagt eksempel).

Som et eksempel kan du ta en titt på R-prosjektet , som er både et interaktivt miljø, og et bibliotek som du kan bruke fra C ++ kode, distribueres under GPL (dvs. hvis du bruker det kun internt og publisere bare resultatene, trenger du ikke å åpne koden).

Svarte 18/08/2008 kl. 06:01
kilden bruker

stemmer
0

Her er en forklaring på MANOVA ouptput, fra en veldig god side på statistikk og på SPSS:

Utgang med forklaring: http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Hvordan og hvorfor å gjøre MANOVA eller multivariate GLM: (samme bane som ovenfor, men ender i '/manova.htm')

Skrive programvare fra bunnen av for å beregne disse utgangene ville være både lang og vanskelig, det er massevis av numeriske problemer og matrise inversjoner å gjøre.

Som Henry sa, bruker Python-skript eller R. Jeg vil foreslå å jobbe med noen som vet SPSS hvis scripting. I tillegg SPSS selv er i stand til å eksportere utgangs bord til filer ved hjelp av noe som kalles OMS. Et skript innen SPSS kan gjøre dette.

Finn ut hvem i forskningsgruppen vet SPSS og arbeide med dem.

Svarte 22/12/2009 kl. 01:56
kilden bruker

stemmer
0

Kan du forklare mer hvorfor SPSS seg selv er ikke en fin løsning på problemet? Er det at den genererer pivottabeller som utgang som er vanskelig å manipulere? Er det kostnaden for programmet?

F-statistikken kan oppstå fra en rekke spesielle tester. F er bare en fordeling (løst: en beskrivelse av "frekvensene" av grupper av verdier), som en normal (Gauss), eller uniform. Vanligvis oppstår de fra prosenter av avvik. Opinion: mange statistikere (meg selv inkludert), finner F-baserte tester for å være ustabil (sjargong: ikke- robust ).

Den spesielle utgangs statistikk (Pillai største spor, etc.) antyder at den opprinnelige analysen er en Manova eksempel, som i andre plakater beskriver er en komplisert og vanskelig å få riktig prosedyre.

Jeg tror også at, basert på MANOVA, og bruk av SPSS, er dette en psykologi eller sosiologi prosjekt ... hvis ikke må du opplyse. Det kan være at andre, enklere modeller kan faktisk være enklere å forstå og mer repeterbare. Ta kontakt med din lokale universitetet statistisk Consulting Group, hvis du har en.

Lykke til!

Svarte 17/09/2008 kl. 13:48
kilden bruker

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more