Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (2024)

Tietojen tulkitseminen: boxplots ja taulukot

Täydennysvaatimukset

Näytä asiakirjan kaikki osat

Tulosta

Tulostettava sivu luotu keskiviikkona 26. heinäkuuta 2023, 20.03
Käytä "Tulostuksen esikatselua" tarkistaaksesi sivujen määrän ja tulostimen asetukset.
Tulostustoiminnot vaihtelevat selaimen välillä.

Ellei toisin mainita, tekijänoikeus © 2023 The Open University, kaikki oikeudet pidätetään.
Tulostettava sivu luotu keskiviikkona 26. heinäkuuta 2023, 20.03

◀︎Tietojen tulkitseminen: laatikkokaaviot ja taulukot

Johdanto

Tämä kurssi käsittelee kahta pääaihetta. Osassa 1 opit toisesta graafisesta näytöstä,boxplot. Boxplotit ovat erityisen hyödyllisiä arvioitaessa nopeasti tietojoukon sijaintia, hajontaa ja symmetriaa tai vinoutumista sekä näiden ominaisuuksien vertailua kahdessa tai useammassa tietojoukossa. Toinen aihe on taulukkomuodossa esitettyjen tietojen käsittely. Tunnet epäilemättä tällaiset taulukot: ne ovat yleisiä tiedotusvälineissä ja raporteissa ja muissa asiakirjoissa. Ei ole aina yksinkertaista nähdä ensi silmäyksellä, mitä tietoa tietotaulukko tarjoaa, ja usein se auttaa suorittamaan tiettyjä laskelmia ja/tai piirtämään asianmukaisia ​​kaavioita tämän selventämiseksi.

Tämä OpenLearn-kurssi on muokattu ote avoimen yliopiston kurssistaM248Tietojen analysointi.

Oppimistulokset

Tämän kurssin opiskelun jälkeen sinun pitäisi pystyä:

  • ymmärtää ja käyttää seuraavia termejä: boxplots, box, whisker, ylempi ja alempi vierekkäinen arvo, nopeus, aikasarja, viivakaavio

  • osoittavat tietoisuutta siitä ajatuksesta, että tietojoukon yleinen kuvio sijainnin, hajonnan ja vinouden suhteen voidaan esittää graafisesti boxplotissa

  • ymmärtää, että boxplot-kuvia voidaan käyttää nopeaan ja yksinkertaiseen datajoukkojen vertailuun

  • ymmärtää, että taulukkotietojen kuvioita voidaan selventää jättämällä pois hyödytöntä tietoa, sisällyttämällä ylimääräisiä hyödyllisiä tietoja tai piirtämällä sopivat kaaviot

  • kuvailla ja vertailla tietojoukkoja boxplot-kaavioiden perusteella.

Yleiskatsaus

On yleinen havainto, että tietojen kartoitus tulisi aina aloittaa katsomalla tietojen graafista näyttöä. Kun tarkastellaan tietojoukkoja, joissa on vain yksi muuttuja, käytettävissä ovat näytöt, kuten pylväskaaviot ja histogrammit. Yksi ongelma näissä on, että ne voivat sisältää liian paljon yksityiskohtia. Ne eivät myöskään ole kovin hyödyllisiä kahden tai useamman datanäytteen vertailussa. Tässä osiossa esitellään graafinen näyttö, joka näyttää tietyt yhteenvetotilastot visuaalisesti houkuttelevalla ja tulkittavissa olevalla tavalla. Tämä onboxplot.

1 Boxplots

Tässä ensimmäisessä osassa opit muodostamaan boxplot yhdelle tietojoukolle. Sitten keskustellaan boxplotien käytöstä kahden tai useamman tietojoukon vertaamiseen.

1.1 Yksinkertaiset boxplots

Boxplot on yksinkertainen rakentaa. Seuraavaa esimerkkiä romahtaneiden juoksijoiden β-endorfiinipitoisuuksista käytetään osoittamaan, kuinka tämä tehdään.

Esimerkki 1.1 Endorfiinipitoisuudet romahtaneille juoksijoille

β-endorfiinipitoisuudet (pmol/l), jotka on kirjattu yhdelletoista juoksijalle, jotka romahtivat Great North Run -juoksun jälkeen, ovat seuraavat (kirjoitettu koon kasvavassa järjestyksessä).

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (1)

Näiden tietojen laatikkokaavio on esitetty kuvassa 1.1.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (2)

Kuva 1.1 Kokoonpantujen juoksijoiden laatikkokaavio

Näytä kuvaus|Piilota kuvaus

Kuva 1.1 Kokoonpantujen juoksijoiden laatikkokaavio

Kuva 1.1 Kokoonpantujen juoksijoiden laatikkokaavio

(Tiedot peräisin Dale, G., Fleetwood, J.A., Weddell, A., Ellis, R.D. ja Sainsbury, J.R.C. (1987) Beta-endorfiini: tekijä "fun run" romahduksessa?British Medical Journal,294, 1004.)

Helpoin tapa ymmärtää tarkalleen, mitä boxplot edustaa ja miten se on rakennettu, on miettiä, kuinka piirtäisit sellaisen käsin. Vaiheet, jotka liittyvät β-endorfiinipitoisuuksien tietosarjan kuvan 1.1 boxplot-kaavion muodostamiseen, ovat seuraavat.

Ensin piirretään kätevä asteikko, joka kattaa datan laajuuden. Koska minimi on 66 ja maksimi 414, asteikko 0 - 500 (esim.) on sopiva tässä tapauksessa. Laatikkokaavio piirretään tätä asteikkoa vasten.

Mediaania ja kvartiileja käytetään "laatikon" rakentamiseen. Tämän tietojoukon mediaani on 110, ja alempi ja ylempi kvartiili ovat 79 ja 162. Laatikko näkyy kuvassa 1.2.

"Laatikko" on suorakulmio, jonka reunat määrittävät alemman ja ylemmän kvartiilin; joten se osoittaa, mistä "keski 50%" tiedoista löytyy. Pystysuora viiva laatikon sisällä sijaitsee mediaanissa.

Seuraavaksi rakennetaan "viikset". Nämä ovat asteikon suuntaisia ​​viivoja (joten ne ovat vaakasuuntaisia ​​tällä kurssilla). Pohjimmiltaan jokainen viiksi ulottuu ulospäin laatikon reunasta äärimmäisimpään havaintoon asti. Kuitenkin, kuten näet seuraavassa vaiheessa, jotkin havainnot voidaan luokitella mahdollisiksi poikkeaviksi; ja itse asiassa viikset kattavat vain havainnot, joita ei luokitella mahdollisiksi poikkeaviksi. Viikset vedetään ulospäin niin pitkälle kuin havaintoja kutsutaanviereisiä arvoja. Thepienempi viereinen arvoon kauimpana havainto, joka on puolentoista sisälläiqr(neljännesten välinen alue) laatikon alapäässä; jaylempi viereinen arvoon kauimpana havainto, joka on puolentoista sisälläiqrlaatikon yläpäästä. Joten interkvartiilialue tarvitaan viiksien rakentamiseen.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (3)

Kuva 1.2 Tiivistettyjen juoksujen boxplot: laatikko

Näytä kuvaus|Piilota kuvaus

Kuva 1.2 Tiivistettyjen juoksujen boxplot: laatikko

Kuva 1.2 Tiivistettyjen juoksujen boxplot: laatikko

Näille tiedoille kvartiiliväli on 162−79=83. Niin

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (4)

Korkein havainto, joka ei ylitä arvoa 286,5, on 169, joten ylempi viereinen arvo on 169, ja siten oikeanpuoleinen viiksi ulottuu havaintoon 169 asti.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (5)

Alin havainto, 66, on tätä suurempi, joten alempi viereinen arvo on 66 ja vasemmanpuoleinen viiksi ulottuu arvoon 66. Huomaa, että tässä esimerkissä alempi viereinen arvo on sama kuin näytteen minimiarvo 66. Kuvassa 1.3 näkyy laatikko, jossa viikset ulottuvat ylempään ja alempaan vierekkäiseen arvoon.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (6)

Kuva 1.3 Tiivistettyjen juoksujen boxplot: vierekkäiset arvot

Näytä kuvaus|Piilota kuvaus

Kuva 1.3

Kuva 1.3 Tiivistettyjen juoksujen boxplot: vierekkäiset arvot

Lopuksi kaikki arvot, joita viikset eivät kata, on merkitty erikseen. Joissakin olosuhteissa niitä voidaan pitää poikkeavina. Ainakin ne ovat mahdollisia poikkeamia ja ansaitsevat erityistä huomiota.

Tässä tapauksessa ainoa havainto, jota viikset eivät kata, on maksimihavainto 414. Tämä näkyy kuvassa 1.4.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (7)

Kuva 1.4 Valmis boxplot romahtaneille juoksijoille

Näytä kuvaus|Piilota kuvaus

Kuva 1.4

Kuva 1.4 Valmis boxplot romahtaneille juoksijoille

On korostettava, että boxplot-rakentaminen on alue, jolla ei ole yleisesti hyväksyttyjä sääntöjä. Kaikki boxplotit näyttävät kolme kvartiilia, mutta viiksien laajuutta määrittävät käytännöt vaihtelevat tekstistä tekstiin ja tietokonepaketista toiseen. Viikset voivat ulottua niinkin alas kuin yksi tai jopa kaksi kvartiilialuetta laatikon molemmin puolin. Jotkut lähestymistavat jopa erottavat kohtalaiset ja vakavat poikkeamat käyttämällä niille erilaisia ​​symboleja. Jotkut oppikirjat ja ohjelmistot piirtävät aina viikset suoraan minimi- ja maksimiarvoihin, eivätkä merkitse (mahdollisia) poikkeamia erikseen. Tässä käytetty lähestymistapa on yksi yksinkertaisimmista ja luultavasti yleisin.

Voit nähdä, kuinka boxplot antaa nopean visuaalisen arvion tiedoista. Laatikon pituus edustaa kvartiiliväliä ja viiksien pituudet suhteessa laatikon pituuteen antavat kuvan siitä, kuinka venyneet muut arvot ovat. Siten nämä kaavion aspektit antavat käsityksen tietojoukon hajoamisesta. Tämän aineiston epätavallisen suuri arvo näkyy selvästi ja mediaani antaa arvion keskuksesta.

Jonkinlainen symmetrian arviointi on mahdollista, koska symmetrinen data tuottaa boxplotin, joka on symmetrinen mediaanin suhteen. Nämä tiedot eivät ole symmetrisiä; ne ovat oikealle vinoja, ja itse asiassa näytteen vinous on 2,572. Vastaava symmetrian puute näkyy boxplotissa: laatikon oikea osa on pidempi kuin vasen. On kuitenkin pidettävä mielessä, että tällä tiedolla on vain yksitoista arvoa, ja tämä on liian pieni määrä päätelläkseen mitään varmaa taustalla olevasta rakenteesta.

Sinun tulisi nyt varmistaa, että ymmärrät yksinkertaiset laatikkokaaviot rakentamalla sellaisen itsellesi.

Laatikkokaavio näyttää mediaanin, kvartiilit, datan kattamien arvojen alueen ja mahdolliset poikkeamat. Se antaa selkeän kuvan kaikista näistä ominaisuuksista ja, kuten näet, mahdollistaa visuaalisen käsityksen symmetrian puutteesta.

1.2 Boxplot-toiminta

Tehtävä 1 Piirrä laatikkokaavio: kondriittimeteorit

Taulukko 1.1sisältää tietoja 22 kondriittimeteorista löydetyn piidioksidin prosenttiosuudesta. Tiedot on annettu kasvavassa järjestyksessä.

Taulukko 1.1 Kondriittimeteorien piidioksidipitoisuus
20.7722.5622.7122.6926.3927.0827.3227.33
27.5727.8128.6929.3630.2531.8932.8833.23
33.2833.4033.5233,8333,9534,82

(Lähde: Good, I.J. ja Gaskins, R.A. (1980) Tiheyden estimointi ja törmäysmetsästys rangaistun todennäköisyyden menetelmällä, esimerkkinä sironta- ja meteoriittitiedot.J. American Statistical Association,75, 42-56.)

Tämän tietojoukon mediaani on 29,025; alempi ja ylempi kvartiili ovat noin 26,91 ja 33,31. Interkvartiilialue on 6,40.

  • (a) Rakenna näille tiedoille laatikkokaavio kynällä ja viivaimella.

  • (b) Näiden tietojen otoksen vinous on −0,446. Onko tämä arvo boxplotin muodon mukainen?

Vastaus
Ratkaisu

(a) Tiedot ovat 20.77–34.82. Kätevä asteikko tämän arvoalueen kattamiseksi on 20-40. Tässä tapauksessa

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (8)

Tämä on pienempi kuin otosminimi, joten vasen viiksi ulottuu minimihavaintoon 20.77 asti. (Toisin sanoen alempi viereinen arvo on yhtä suuri kuin otosminimi.) Samoin,

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (9)

Tämä on suurempi kuin näytteen maksimi, joten ylempi viereinen arvo on sama kuin näytteen maksimi. Joten tällä tietojoukolla ei ole ääriarvoja, jotka olisi piirrettävä erikseen. Laatikkokuva näkyy kuvassaKuva 3.1.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (10)

Kuva 1.5a Kondriittimeteorien piidioksidipitoisuuden laatikkodiagrammi

Näytä kuvaus|Piilota kuvaus

Kuva 1.5a

Kuva 1.5a Kondriittimeteorien piidioksidipitoisuuden laatikkodiagrammi

(b) Otoksen vinous on negatiivinen, mikä osoittaa, että tiedot ovat vasemmalle vinoja. Jossain määrin boxplot heijastaa tätä: vasen viiksi on huomattavasti pidempi kuin oikea, mikä osoittaa, että pienemmät arvot ovat hajautetumpia kuin suuret arvot. Laatikko antaa kuitenkin toisenlaisen vaikutelman. Laatikko vastaa data-arvojen keskipuoliskoa, ja mediaania osoittava viiva jakaa sen kahteen osaan, joista kumpikin vastaa neljäsosaa tiedoista. Tässä tapauksessa laatikon vasen osa on lyhyempi kuin oikea osa. Toisin sanoen laatikko ehdottaa, että tiedot voivat olla oikealle vinossa vasemmanpuoleisen sijaan. Joten näiden tietojen epäsymmetriamalli ei ole suoraviivainen.

Arvioidessasi vinoumakuvioita boxplotista tarkastelet viittä eri arvoa: ylempää ja alempaa vierekkäistä arvoa, ylempää ja alempaa kvartiilia ja mediaania. Näin ollen on mahdollista, ainakin joissain tapauksissa, havaita hieman monimutkaisia ​​vinouskuvioita. Toisaalta näytteen vinouden laskeminen edellyttää tietojen keittämistä yhdeksi arvoksi; ja siten näytteen vinouma antaa melko vähemmän tietoa kuin boxplot antaa tietojoukon muodosta.

Sisään tulevien tietojen boxplotTaulukko 1.1, joka sinua pyydettiin piirtämään tehtävässä 1, näkyy kuvassa 1.5.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (11)

Kuva 1.5b Kondriittimeteorien piidioksidipitoisuuden laatikkokaavio

Näytä kuvaus|Piilota kuvaus

Kuva 1.5b

Kuva 1.5b Kondriittimeteorien piidioksidipitoisuuden laatikkokaavio

Tämä boxplot ei selvästikään ole symmetrinen. Sen vinoutumisen kuvio ei kuitenkaan ole suoraviivainen. Keskimmäistä 50 % tiedoista vastaava laatikko näyttää olevan oikealle vinossa, koska mediaania merkitsevä viiva on kohti laatikon vasenta puolta (niin laatikon oikea osa on pidempi kuin vasen). Pidempi viiksi on kuitenkin vasemmalla, mikä osoittaa pidempää häntää kohti pienempiä arvoja, mikä puolestaan ​​viittaa siihen, että tiedot ovat vasemmalle vinoja.

Tässä esimerkissä näytteen vinous (-0,446) on sopusoinnussa boxplotin viiksien ehdottaman kuvion kanssa (vasen vino), ei laatikon ehdottaman kaavan kanssa. Pohjimmiltaan tämä tapahtuu, koska kaikkia tietojoukon arvoja käytetään näytteen vinouden laskemiseen; ja laskentaan liittyy arvojen potenssien summa, joten otoksen vinouteen vaikuttavat erityisesti tietojoukon äärimmäisemmät arvot. Boxplotissa viikset vastaavat äärimmäisempiä arvoja. Kuvassa 1.5 viikset viittaavat siihen, että tiedot ovat vasemmalle vinoja, mikä vastaa näytteen vinoutta.

1.3 Tietojoukkojen vertailu boxplots-tekniikalla

Esimerkki 1.2 Lapset, joilla on SIRDS: boxplots

Boxplotit ovat erityisen hyödyllisiä nopeiden vertailujen tekemiseen. Seuraava esimerkki koskee niiden imeväisten syntymäpainoja, joilla on vakava idiopaattinen hengitysvaikeusoireyhtymä (SIRDS) ja kysymys "Onko mahdollista yhdistää mahdolliset eloonjäämismahdollisuudet syntymäpainoon?" Taulukon 1.3 tiedot ovat vauvojen kirjattuja syntymäpainoja. jolla ilmeni syndrooma.

Taulukko 1.3 Vakavaa idiopaattista hengitysvaikeusoireyhtymää sairastavien imeväisten syntymäpainot (kg)
1.050*2 500*1,890*1,7602.830
1,175*1.030*1,940*1.9301.410
1,230*1.100*2.200*2.0151,715
1,310*1,185*2,270*2.0901,720
1 500*1,225*2,440*2.6002.040
1 600*1,262*2,560*2.7002.200
1,720*1,295*2,730*2.9502.400
1,750*1.300*1.1303.1602.550
1,770*1550*1,5753.4002,570
2,275*1,820*1,6803.6403.005
*lapsi kuoli

van Vliet, P.K. ja Gupta, J.M. (1973) Natriumbikarbonaatti idiopaattisessa hengitysvaikeusoireyhtymässä.Kaari. Sairaus lapsuudessa,48, 249–255.

Kysymyksen alustava tutkiminen voi sisältää kahden syntymäpainosarjan histogrammit sekä niiden otoskeskiarvojen, keskihajonnan ja vinoutumisen laskemisen. Tulokset osoittaisivat tässä tapauksessa, että eloonjääneiden vauvojen keskimääräinen syntymäpaino on huomattavasti suurempi kuin kuolleiden vastasyntyneiden keskimääräinen syntymäpaino ja että myös eloonjääneiden vauvojen syntymäpainojen keskihajonta on suurempi. Boksiplottien avulla voimme nyt edetä kysymyksessä eteenpäin.

Selviytyneiden vastasyntyneiden syntymäpainoille (kg) alempi kvartiili, mediaani ja ylempi kvartiili ovat vastaavasti 1,72, 2,20 ja 2,83. Kuolleiden imeväisten vastaavat kvartiilit ovat 1,23, 1,60 ja 2,20. Käyttämällä näitä lukuja yhdessä alkuperäisten tietojen kanssaTaulukko 1.3edellä, kahdesta tietojoukosta voidaan muodostaa boxplotit. Huomaa, että molemmissa tapauksissa (kuten aktiviteetissa 1) vierekkäiset arvot ovat yhtä suuret kuin näytteen maksimi ja minimi, joten viikset ulottuvat näytealueen päihin. Kun molemmat boxplotit piirretään samaa mittakaavaa vasten, saadaan kuvan 1.6 kaavio.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (12)

Kuva 1.6 Vertailevat laatikkodiagrammit: SIRDS-vauvojen syntymäpainot

Näytä kuvaus|Piilota kuvaus

Kuva 1.6

Kuva 1.6 Vertailevat laatikkodiagrammit: SIRDS-vauvojen syntymäpainot

Kuten alaosiossa 1.1 näit, boxplot antaa graafista tietoasijainti,dispersiojavinoustietojoukosta – toisin sanoen niistä tietojoukon kolmesta osa-alueesta, joiden osalta tiivistelmät otettiin käyttöönYksikkö A1. Lisäksi boxplot kiinnittää huomion tiettyihinmahdolliset poikkeamat. Näin ollen vertailevia boxplotteja, kuten kuvassa 1.6, voidaan käyttää näiden neljän ominaisuuden vertaamiseen näytetyissä tietosarjoissa. Tämä on tehty seuraavan SIRDS-tietojen keskustelun tuottamisessa.

Sijainnin vertailu:Kuva 1.6 osoittaa, että eloonjääneiden vauvojen mediaanipaino on suurempi kuin kuolleiden.

Hajautusvertailu:Kvartiilivälit ovat melko samankaltaisia ​​(kuten laatikoiden pituudet osoittavat), vaikka tietojoukon kokonaisalue on suurempi eloonjääneiden vauvojen osalta (kuten kahden viiksen päiden väliset etäisyydet kussakin boxplotissa osoittavat).

Vinoutumisen vertailu:Vaikka molemmat tietoerät näyttävät olevan vinossa ja kuolleiden vauvojen erä on hieman vinoutunut kuin eloonjääneiden, vinous ei ole erityisen merkittävä kummassakaan tapauksessa. (Itse asiassa eloonjääneiden vauvojen syntymäpainojen näytteen vinouma on 0,25; ja kuolleiden vastasyntyneiden osalta se on 0,53. Molemmat vinoudet ovat positiivisia; kuolleiden pikkulasten arvo on melko suurempi, mikä vastaa enemmän selvä symmetrian puute, mutta kumpikaan vino ei ole erityisen suuri.)

Mahdollisten poikkeamien vertailu:Kummassakaan tietojoukossa ei näy epäilyttävän kaukana olevia arvoja, jotka vaatisivat tarkempaa tarkastelua.

Yleiset johtopäätökset:Kaiken kaikkiaan nämä kaksi tietoerää näyttävät siltä, ​​että ne olisi yleensä jaettu samalla tavalla, mutta toinen erä sijaitsee toisen oikealla (suuremmalla paikalla). Näet heti, että kuolleiden vauvojen syntymäpainon mediaani on pienempi kuin eloonjääneiden vauvojen syntymäpainon alempi kvartiili (eli yli kolme neljäsosaa eloonjääneistä oli painavampia kuin kuolleiden syntymäpainon mediaani). . Joten näyttää siltä, ​​​​että voimme turvallisesti sanoa, että eloonjääminen liittyy syntymäpainoon.

Voit nähdä, kuinka vertailevat boxplotit antavat kompaktin, nopeasti omaksuttavan yhteenvedon tiedoista, mikä viittaa siihen, että hengissä selviävillä vauvoilla ja lapsilla, jotka eivät selviä, voi tyypillisesti olla eri syntymäpaino.

Kun käytetään boxplotteja kahden tai useamman tietoerän vertaamiseen, on yleensä parasta verrata yksittäisiä ominaisuuksia metodisesti. Seuraavista ohjeista voi olla apua.

Ohjeita boxplottien vertailuun

  1. Vertaa vastaavia mediaaneja sijainnin vertailua varten.

  2. Vertaa kvartiilialueita (eli laatikoiden pituuksia) dispersion vertaamiseksi.

  3. Katso yleistä eroa viereisten arvojen osoittamalla tavalla. (Tämä on toinen osa hajauttamisesta.)

  4. Etsi vinouden merkkejä. Jos tiedot eivät näytä olevan symmetrisiä, onko jokaisessa erässä samanlainen epäsymmetria?

  5. Etsi mahdollisia poikkeavuuksia.

Näiden ominaisuuksien käsittelyn jälkeen yleiset johtopäätökset tulisi tehdä lyhyesti.

Katsotaanpa toista esimerkkiä. Tällä kertaa sinua pyydetään tekemään työ!

1.4 Boxplot-toiminta 2

Tehtävä 2 Perhekokoisia laatikoita

Alla oleva taulukko sisältää tiedot kahden Ontariossa olevien äitien valmistuneiden perheiden koosta (lasten lukumäärästä). Yhdellä äitiotoksella oli ollut vähemmän koulutusvuosia kuin toisella (ensimmäisen otoksen äideillä kuusi vuotta tai vähemmän ja toiseen otokseen kuuluvilla äideillä vähintään seitsemän vuotta).

Taulukko 1.4 Perheen koko: 15–19-vuotiaat naimisissa olevat äidit
Äiti on koulutettu kuusi vuotta tai vähemmän
14 13 4 14 10 2 13 5 0 0 13 3 9 2 10 11 13 5 14
Äiti on koulutettu seitsemän vuotta tai enemmän
0 4 0 2 3 3 0 4 7 1 9 4 3 2 3 2 16 6 0 13 6 6 5 9 10 5 4 3 3 5 2 3 5 15 5

Keyfitz, N. (1953) Perheen koon vertailujen tekijäjärjestely.American J. Sociology,53, 470–480.

Perhekokotiedon vertailevat boxplotit on esitetty kuvassa 1.7.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (13)

Kuva 1.7 Vertailevat laatikkodiagrammit: perhekoot kahdelle äitiryhmälle

Näytä kuvaus|Piilota kuvaus

Kuva 1.7

Kuva 1.7 Vertailevat laatikkodiagrammit: perhekoot kahdelle äitiryhmälle

Vertaa kahta datanäytettä käyttämällä juuri tekstissä esitettyä systemaattista lähestymistapaa. Mitä johtopäätöksiä voit tehdä koulutuksen ja perheen koon välisestä yhteydestä?

Vastaus
Ratkaisu

Noudattamalla tekstissä esitettyjä viittä vaihetta laatikkokaavioiden vertaamiseksi aloitamme mediaaneista (vaihe 1). Nämä ovat hyvin erotettuja toisistaan, ja vähemmän koulutettujen äitien mediaani on korkeampi, hämmästyttävän 10. Näiden äitien laatikon pituus on yli kaksi kertaa toisen laatikon pituus (vaihe 2). Kokonaishajoitukset (viereisten arvojen väliset etäisyydet) ovat suunnilleen samanlaiset kahdelle tietojoukolle (vaihe 3). Tämä vertailu on kuitenkin ehkä vähemmän informatiivinen hajoamisen suhteen kuin laatikoiden pituuksien vertailu, koska tiedoissa voi olla poikkeavuuksia enemmän koulutetuille äideille. Korkeasti koulutettujen äitien yleinen vaihteluväli on suurempi, jos nämä "poikkeamat" otetaan mukaan. Kuitenkin, jos näiden arvojen epätyypillisyys nähdään syynä niiden pois jättämiseen, vähemmän koulutettujen äitien vaihteluväli olisi suurempi. Riippumatta siitä, jätetäänkö ne pois, vaihteluväli ei ole valtava.

Vähiten koulutettujen äitien laatikkokaavio osoittaa hieman vasemmalle vinoutumista: vasen viiksi on pidempi kuin oikea (vaihe 4). Suurin osa äideistä, joilla on enemmän koulutusta, näyttää symmetriseltä, mutta on olemassa kolme suurta mahdollista poikkeavaa, jotka epäilemättä vaikuttaisivat vinoutumista koskeviin laskelmiin (vaihe 5).

Nämä kaksi tietoerää näyttävät jakautuvan eri tavalla tavalla, joka ei johdu pelkästään sijainnin eroista. Vähemmän koulutettujen äitien mediaani on lähellä korkeasti koulutettujen äitien ylempää vierekkäistä arvoa, mikä johtaa johtopäätökseen, että äidin koulutus vaihtelee perheen koon mukaan. Suurin ero ryhmien välillä on niiden erilaisissa pitoisuuksissa mediaanin ympärillä pikemminkin kuin niiden yleisessä arvojen hajoamisessa. Koulutetuimpien äitien mahdolliset poikkeamat eivät ole kovin kaukana toisen otoksen ylemmästä viereisestä arvosta, ja ne on merkitty poikkeaviksi pääosin sen otoksen suhteellisen alhaisen kvartiilivälin vuoksi, johon he kuuluvat.

Johtopäätös on, että äidin koulutus vaihtelee perheen koon mukaan, sillä kuusi vuotta tai vähemmän muodollista koulutusta saavilla äideillä on keskimäärin suurempi perhe.

Yksi asia boxplotit ovat myös osoittaneet, että kolme data-arvoa yhdessä näytteessä ei ehkä ole tyypillisiä; joten keskiarvon, keskihajonnan ja vinouden laskelmiin tulee suhtautua tietyllä tavalla skeptisesti.

1.5 Yhteenveto

Tässä osiossa olet tutustunut boxplotiin. Tämä on grafiikka, joka edustaa tietojoukon tärkeimpiä ominaisuuksia. Tyypillinen boxplot on esitetty kuvassa 1.8.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (14)

Kuva 1.8 Tyypillinen boxplot

Näytä kuvaus|Piilota kuvaus

Kuva 1.8

Kuva 1.8 Tyypillinen boxplot

Laatikon päät merkitsevät kvartiileja ja pystysuora viiva laatikon läpi sijaitsee mediaanissa. Boxplotin viikset ulottuvat arvoihin, jotka tunnetaan vierekkäisinä arvoina. Nämä ovat tiedoissa olevia arvoja, jotka ovat kauimpana mediaanista laatikon kummallakin puolella, mutta ovat silti 1,5-kertaisen kvartiilin välisen alueen etäisyydellä laatikon lähimmästä päästä (eli lähimmästä kvartiilista). Monissa tapauksissa viikset itse asiassa ulottuvat tietojoukon äärimmäisimpiin arvoihin asti. Muissa tapauksissa he eivät kuitenkaan tee. Kaikki tietojoukon arvot, jotka ovat äärimmäisempiä kuin viereiset arvot, piirretään erillisinä pisteinä boxplotissa. Tämä tunnistaa ne mahdollisiksi poikkeavuuksiksi, jotka saattavat tarvita lisätutkimuksia.

Laatikkokuvaaja kuvaa vain joitain perusnäkökohtia tietojoukon arvojen jakautumisesta. Mutta usein nämä perusnäkökohdat ovat kiinnostavimpia. On yksinkertaista piirtää laatikkodiagrammit useammasta kuin yhdestä tietojoukosta samassa mittakaavassa ja käyttää niitä sitten tietojoukkojen jakautumisen tärkeiden näkökohtien vertailuun. Järjestelmällinen lähestymistapa tällaisten vertailujen suorittamiseen on kuvattu.

1.6 Harjoitus

Tehtävä 3 Harjoitus 1.1 Muistin palautusajat

Muistin muistamisaikojen tutkimuksessa koehenkilölle näytettiin sarja ärsykkeitä tietokoneen näytöllä. Jokaisen sanan kohdalla koehenkilöä kehotettiin muistamaan joko miellyttävä tai epämiellyttävä sanaan liittyvä muisto. Muistin onnistuneen palauttamisen osoitti, että kohde painaa tietokoneen näppäimistön palkkia.Taulukko 1.5näyttää palautusajat (sekunteina) 20 miellyttävälle ja 20 epämiellyttävälle muistolle.

Taulukko 1.5 Muistin palautusajat (sekunteina)
Miellyttävä muistiEpämiellyttävä muisti
1.071.45
1.171.67
1.221.90
1.422.02
1.632.32
1.982.35
2.122.43
2.322.47
2.562.57
2.703.33
2.933.87
2.974.33
3.035.35
3.155.72
3.226.48
3.426.90
4.638.68
4.709.47
5.5510.00
6.1710.93

Dunn, G. ja Master, D. (1982) Latenssimallit: vasteaikojen tilastollinen analyysi.Psykologinen lääketiede,12, 659–665.

Keskeistä tässä tutkimuksessa oli se, voidaanko miellyttävät muistot muistaa helpommin ja nopeammin kuin epämiellyttävät. Kahden näytteen vertailukelpoiset laatikkokaaviot on esitetty kuvassa 1.9.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (15)

Kuva 1.9 Vertailevat muistin palautusaikojen boxplotit

Näytä kuvaus|Piilota kuvaus

Kuva 1.9

Kuva 1.9 Vertailevat muistin palautusaikojen boxplotit

Käytä boxploteja vertaillaksesi palautusaikojen jakaumia molemmille muistityypeille.

Vastaus
Ratkaisu

Ilmeisin piirre on, että epämiellyttävien muistojen palautusajat ovat kaiken kaikkiaan pitempiä kuin miellyttävien muistojen – mediaani, alempi kvartiili ja ylempi kvartiili 'epämiellyttävälle' otokselle ovat kaikki 'miellyttävien' vastaavien arvojen yläpuolella. näyte. Hajaantuminen on myös huomattavasti suurempi "epämiellyttävän" näytteen kohdalla. (Kvartiilien välinen alue, kuten laatikoiden pituudet osoittavat, on pidempi, ja niin on myös kokonaisalue ja "viiksien" pituudet.)

Molemmat näytteet ovat myös vinossa. Vinomalli on yksinkertaisempi "epämiellyttävälle" näytteelle. Se on selvästi oikealle vino, pitkä häntä oikealle (korkeat arvot), kuten pidempi oikea viiksi osoittaa ja myös se, että laatikon oikea osa (mediaani ylempään kvartiiliin) on pidempi kuin vasen osa. . "Miellyttävä" näyte ei ole symmetrinen, mutta sen vinousmallia on hieman monimutkaisempi kuvata. Ylempi (oikea) viikset on pidempi kuin alempi viikset, mutta laatikon yläosa on lyhyempi kuin alaosa.

Boxplotista poimitaan vain yksi mahdollinen poikkeava arvo – suhteellisen korkea arvo "miellyttävälle" otokselle. Ottaen huomioon, että se ei itse asiassa ole paljon suurempi kuin ylempi viereinen arvo, ehkä tämän arvon ei pitäisi aiheuttaa meille erityistä huolta.

2 Hyödyllisten taulukoiden laatiminen

Suurimman osan tilastotyöstäsi aloitat tietojoukosta, joka esitetään usein taulukon muodossa, ja käytät taulukon tietoja kaavioiden ja/tai yhteenvetotilastojen tuottamiseen, jotka auttavat aineiston tulkinnassa. Käytännössä suuri osa tietojoukkojen tulkinnoista voidaan kuitenkin tehdä suoraan sopivasta tietotaulukosta tai esittämällä tiedot uudelleen melko erilaisessa taulukkomuodossa. Taulukoiden tietojen käsittely on tämän ja seuraavan osan aihe. Kun olet valmis, sinun pitäisi pystyä tuottamaan taulukoita, jotka tekevät tietyistä tiedoista ilmeisempiä.

2.1 Tietojoukot eri taulukkomuodoissa

Esimerkki 2.1 Keuhkosyöpäkuolemat Etelä-Australiassa

Taulukko 2.1 sisältää raakatiedot keuhkosyövän esiintyvyydestä ja kuolleisuudesta Etelä-Australiassa vuonna 1981.

Taulukko 2.1 Ikäryhmä, miehet ja väestön koon mukaan, miesten ja naisten tapaukset, miesten ja naisten kuolemat
0–447589452730000
5–953814506720000
10-1458561556450000
15-1959408577560000
20–2458443572490000
25–2954341533760010
30–3453456529781010
35–3942113419880200
40–4435648355472533
45–49329113179982102
50–543648535333388268
55–5935192355556118438
60–64281313086867165715
65–69244192739088156917
70–74166132140260216121
75–799958145464610469
80–8448529749246234
85+279074777283

O'Neill, T. J., Tallis, G. M. ja Leppard, P. (1985) The epidemiology of a disease using hazard functions.Australian Journal of Satistics,27, 283–297.

Taulukon 2.1 kaltainen taulukko saattaa olla riittävä henkilölle, joka vain vilkaisee tietoja nopeasti, ehkä ennen analyysin suorittamista, mutta se ei ole paras tapa esittää lukuja useimmille lukijoille. Todellisuudessa tiedon välittämiseen käytettävän taulukon valmistamisen tavoitteena on tehdä tiedoista välittömästi selvä ja helpottaa tärkeiden kuvioiden poimimista niistä mahdollisimman vähällä vaivalla. Tätä tarkoitusta varten on olemassa useita taulukoiden tuottamiseen liittyviä ohjeita, jotka on syytä pitää mielessä.

Ohjeita taulukoille

  1. Rivien ja sarakkeiden merkintöjen tulee olla selkeitä ja yksiselitteisiä.

  2. Taulukon tulee sisältää vähimmäismäärä tietoa, joka tarvitaan viestin välittämiseen. Tämä voi tarkoittaa tietojen jakamista useisiin yksinkertaisempiin taulukoihin tai solujen yhdistämistä.

  3. Saattaa olla tarkoituksenmukaista yksinkertaistaa taulukon numeroita nopean ymmärtämisen helpottamiseksi.

  4. Hyödyllisiä yhteenvetotilastoja tai laskentatuloksia tulee tarvittaessa lisätä viestin välittämisen helpottamiseksi.

Näitä ohjeita noudatetaan suhteessa taulukkoon 2.1, jotta nähdään, mitä muutoksia ne ehdottavat.

2.2 Taulukon perusasettelu

KutenTaulukko 2.1on vaikea omaksua tietoa. Itse asiassa ei ole ollenkaan selvää, mitä yksikään numeroista tarkoittaa. Jopa niin yksinkertaisen asian tekeminen kuin sarakkeiden oikean otsikon antaminen ja muutaman rivin piirtäminen erottamaan otsikot muusta tiedosta, kuten taulukossa 2.2, parantaa selkeyttä (ohje 1).

Taulukko 2.2 Etelä-Australia: keuhkosyövän ilmaantuvuus ja kuolleisuus, 1981
IkäryhmäPopulaation kokoUusia tapauksiaKuolemat
UrosNainenUrosNainenUrosNainen
0–447589452730000
5–953814506720000
10-1458561556450000
15-1959408577560000
20–2458443572490000
25–2954341533760010
30–3453456529781010
35–3942113419880200
40–4435648355472533
45–49329113179982102
50–543648535333388268
55–5935192355556118438
60–64281313086867165715
65–69244192739088156917
70–74166132140260216121
75–799958145464610469
80–8448529749246234
85+279074777283

Tietysti on vielä valtava määrä tietoa imetettävänä, mutta merkinnät ovat parempia ja ennen kaikkea taulukko on enemmän tai vähemmän itsestään selvä.

Mutta on tärkeää pohtia, mitä tietoa todella haluamme taulukon välittävän lukijalle. Täällä on usein tehtävä valintoja. Taulukossa 2.2 on tiedot väestön koosta eri ikäryhmissä, ja näiden tietojen avulla voitaisiin selvittää väestön keski-ikää tai sitä, miten eri ikäryhmissä olevien ihmisten osuudet eroavat miesten ja naisten välillä. Jos halutaan välittää tällaista tietoa, olisi järkevää yksinkertaistaa taulukkoa monin eri tavoin – esimerkiksi kaikki tiedot keuhkosyöpätapauksista ja -kuolemista voitaisiin yksinkertaisesti jättää pois! Mutta tämän tietojoukon osalta on paljon todennäköisempää, että olisimme kiinnostuneita ensisijaisesti keuhkosyöpätapauksista ja -kuolemista, ja siinä tapauksessa olisimme kiinnostuneita väestömäärästä vain siltä osin kuin ne liittyvät keuhkosyöpälukuihin. . Siinä tapauksessa on tehtävä välitön ja ilmeinen yksinkertaistaminen. Alle 24-vuotiailla ei ollut keuhkosyöpätapauksia tai kuolemantapauksia, joten voimme yksinkertaisesti koota taulukon viisi ensimmäistä riviä taulukon 2.3 mukaisesti.

Taulukko 2.3 Etelä-Australia: keuhkosyövän ilmaantuvuus ja kuolleisuus, 1981
IkäryhmäPopulaation kokoUusia tapauksiaKuolemat
UrosNainenUrosNainenUrosNainen
0–242778152665950000
25–2954341533760010
30–3453456529781010
35–3942113419880200
40–4435648355472533
45–49329113179982102
50–543648535333388268
55–5935192355556118438
60–64281313086867165715
65–69244192739088156917
70–74166132140260216121
75–799958145464610469
80–8448529749246234
85+279074777283

Tämä ohjeen 2 mukainen yksinkertaistaminen ei ole menettänyt yhtään tietoa keuhkosyövästä, ja taulukko on nyt helpompi ymmärtää.

2.3 Pöytätoiminta

Taulukko 2.4 Etelä-Australia: keuhkosyövän ilmaantuvuus ja kuolleisuus, 1981
IkäryhmäPopulaation kokoUusia tapauksiaKuolemat
UrosNainenUrosNainenUrosNainen
0–394277254149371220
40–4435648355472533
45–49329113179982102
50–543648535333388268
55–5935192355556118438
60–64281313086867165715
65–69244192739088156917
70–74166132140260216121
75–799958145464610469
80–8448529749246234
85+279074777283

Yksinkertaistaa taulukkoa entisestään

Onko mielestäsi järkevää jatkaa tätä yksinkertaistamisprosessia yhdistämällä lisää rivejä? Jos on, mitkä rivit yhdistäisit?

Keskustelu
Kommentti

Koska kaikissa muissa ikäryhmissä oli uusia tapauksia tai kuolemia ja yleensä molempia, rivien yhdistämistä ei voida jatkaa menettämättä joitakin alkuperäisessä taulukossa olevia tietoja. Mutta itse asiassa molemmissa sukupuoliryhmissä on hyvin vähän alle 40-vuotiaita tapauksia. Joten jos vastaavat rivit yhdistetään, saadaanTaulukko 2.4, hyvin vähän tietoa katoaa (eikä luultavasti mitään tärkeää keuhkosyövän suhteen). (Olet saattanut ehdottaa hieman erilaista riviä yhdistettäväksi.)

2.4 Sisältää hyödyllisen laskennan tulokset

VoiTaulukko 2.4yksinkertaistaako lisää rivejä tai sarakkeita yhdistämällä? Ehkä se voi olla, mutta saattaa hyvinkin olla vaara, että menetät tärkeitä tai olennaisia ​​tietoja. Joten ennen kuin harkitsemme lisäyksinkertaistamista, tarkastelemmelisäämällätiedot taulukkoon joidenkin hyödyllisten laskelmien tulosten muodossa (ohje 4).

Jotkin taulukon luvut eivät sinänsä vieläkään merkitse paljon. Miehillä todettiin 61 uutta tapausta 55–59-vuotiaiden ikäryhmässä. Mutta miten tämä eroaa muiden ikäryhmien miehistä ja naisista? Uusia tapauksia todettiin 60 70–74-vuotiaille miehille. Päällisin puolin tämä näyttää hyvin läheltä 55–59-vuotiaiden ryhmän lukua. Mutta Etelä-Australian 55–59-vuotiaita miehiä oli paljon enemmän kuin 70–74-vuotiaita (35192 verrattuna 16613:een). Näyttää todennäköiseltä, että suurin kiinnostus näihin tietoihin on vaihtelevissamahdollisuudetkeuhkosyövän kehittymisestä tai siihen kuolemasta eri iässä ja molemmille sukupuolille. Jos haluat tietää tästä jotain, on hyödyllistä laskeamittasuhteeteri ikäryhmistä, joista tuli uusia keuhkosyöpätapauksia. 55–59-vuotiailla miehillä osuus on 61/35192=0,0017333 eli prosentteina 0,17333 %. 70–74-vuotiailla miehillä vastaava osuus on 60/16613=0,0036116 eli 0,36116 %. On hyvin yleistä ja usein erittäin hyödyllistä laskea sellaisia ​​määriä, jotka usein tunnetaan nimellähinnat.

Toistaiseksi tarkastellaan vain uusia tapauksia ja jätetään pois tiedot kuolemista. Uusien tapausten määrä kussakin ikäryhmässä on laskettu miehille ja naisille; nämä hinnat sisältyvät taulukkoon 2.5. Kuten näette, nämä luvut eivät näytä erityisen käyttäjäystävällisiltä!

Taulukko 2.5 Etelä-Australia: keuhkosyövän ilmaantuvuus, 1981
IkäryhmäPopulaation kokoUusia tapauksiaUudet tapaukset % väestön koosta
UrosNainenUrosNainenUrosNainen
0–39427725414937120,00233800,0048200
40–443564835547250,0561040,014066
45–493291131799820,0243080,062895
50–5436485353333880,104150,022642
55–59351923555561180,173330,050626
60–64281313086867160,238170,051834
65–69244192739088150,360380,054765
70–74166132140260210,361160,098122
75–7999581454646100,461940,068747
80–84485297492460,494640,061545
85+27907477720,250900,026749

Taulukko näyttää edelleen melko kamalalta ja sen sisältämää tietoa on vaikea omaksua, suurelta osin siksi, että epäilyttävän merkityksellisistä tiedoista on liian paljon sotkua, ja myös siksi, että kahdessa viimeisessä sarakkeessa on aivan liian monta desimaalipistettä. Jälkimmäinen ongelma on helposti ratkaistavissa ohjeen 3 mukaisesti. Ensinnäkin on huomattava, että (esimerkiksi) luku 0,098122 % 70–74-vuotiailla naisilla tarkoittaa, että jokaista 100 tämän ikäryhmän naista kohden (Etelä-Australiassa vuonna 1981) , todettiin 0,098122 uutta keuhkosyöpätapausta. Tässä yhteydessä ei ole mitään erityistä laskea prosentti 100:aa naista kohden väestössä. Sen sijaan lasketaan tapausten määrä 100 000 naista kohden väestössä. Tämä tarkoittaa, että kaikki hinnat kerrotaan 1000:lla, mikä poistaa suurimman osan "0,0…" esiintymistä numeroiden alussa ja tekee siten taulukosta helpommin luettavan. Myöskään näiden tietojen pääviestin ymmärtäminen ei vaadi viittä merkitsevää numeroa. Sen sijaan taulukossa 2.6 luvut on annettu yhden desimaalin tarkkuudella.

Taulukko 2.6 Etelä-Australia: keuhkosyövän ilmaantuvuus, 1981
IkäryhmäPopulaation kokoUusia tapauksiaUusia tapauksia 100 000 asukasta kohti
UrosNainenUrosNainenUrosNainen
0–39427725414937120.20.5
40–443564835547255.614.1
45–4932911317998224.36.3
50–543648535333388104.222.6
55–5935192355556118173.350.6
60–6428131308686716238.251.8
65–6924419273908815360,454.8
70–7416613214026021361.298.1
75–799958145464610461,968.7
80–8448529749246494,661.5
85+2790747772250,926.7

Onko nyt järkevää yksinkertaistaa taulukkoa entisestään? Jos haluamme sen avulla välittää tietoa suhteellisista mahdollisuuksista saada diagnosoitu uusi keuhkosyövän tapaus eri ikäisillä ja molemmilla sukupuolilla, 'Population size'- ja 'Uudet tapaukset' -sarakkeet eivät itse asiassa anna kovin olennaista tietoa. . Siksi saattaa olla järkevää jättää ne pois. Lisäksi uusien tapausmäärien yleinen malli eri ikäryhmissä voidaan viestiä melko harvemmille ikäryhmille kuin mitä taulukossa 2.6 käytettiin. Taulukossa 2.7 on käytetty harvempia ja karkeampia ikäryhmiä, ja ainoat luvut ovat uusien tapausten laskennalliset arvot 100 000:ta kohti ja kuolleiden määrä 100 000:ta kohti; nämä on pyöristetty yhteen desimaaliin. (Huomaa, että taulukon 2.7 uusien tapausten lukuja ei voida laskea yksinkertaisesti taulukon 2.6 kahdessa viimeisessä sarakkeessa annetuista luvuista. Asianmukaiset populaation koot ja tapausten lukumäärät on yhdistettävä ja aggregaatteja on käytettävä lukujen laskemiseen.)

Taulukko 2.7 Etelä-Australia: keuhkosyövän ilmaantuvuus ja kuolleisuus, 1981 (luvut 100 000 asukasta kohti)
IkäryhmäUusia tapauksiaKuolemat
UrosNainenUrosNainen
0–492.21.93.01.0
50–59138.136.796.322.6
60–69295,053.2239,854.9
70–79398,986.2402.783.5
80+405,746.4405,740.6

(Kuolemien sarakkeen kokonaisluvut olisivat olleet varsin riittäviä näiden tietojen sanoman ymmärtämiseen. Yhden desimaalin käyttämisellä on se etu, että se tekee selväksi, että nämä ovat lukuja eivätkä yksittäisten tapausten laskelmia.)

Tämä on nopeasti assimiloitu taulukko, joka kertoo keuhkosyövän ilmaantuvuuden ja kuoleman mallin suhteessa väestön kokoon. Miesten ja naisten lukuja on helppo verrata, ja ilmaantuvuutta on yhtä helppo verrata kuolleisuuteen missä tahansa ikäryhmässä.

Tehtävä 4 Tietojen kuvaaminen taulukossa

  • (a) Kuvaile Etelä-Australian keuhkosyöpätietojen päämallit taulukon 2.7 perusteella.

  • (b) Taulukko 2.7 on varmasti paljon yksinkertaisempi kuin tämän osan aikaisemmat taulukot, ja olet todennäköisesti samaa mieltä siitä, että datan kuviot ovat helpompia nähdä. Mutta voitko ajatella taulukon 2.7 esityksen haittoja muihin taulukoihin verrattuna?

Vastaus
Ratkaisu

a) Etelä-Australian miesten keuhkosyövän ilmaantuvuusmalli voidaan kuvata seuraavasti. Alle 50-vuotiailla miehillä on hyvin vähän uusia tapauksia, mutta 50- ja 60-vuotiailla miehillä tapaukset lisääntyvät nopeasti. Kasvu tasoittuu yli 70 vuoden iän. Miesten kuolleisuus on hyvin samanlainen kuin ilmaantuvuus. Naisten ilmaantuvuus ja kuolleisuus ovat jälleen erittäin alhaisia ​​alle 50-vuotiaina ja lisääntyvät sen jälkeen, mutta ilmaantuvuus ja kuolleisuus jäävät paljon miehiä pienemmäksi (miesten tasosta noin neljännes tai viidesosa). Myös naisten ilmaantuvuus ja kuolleisuus laskevat varsin huomattavasti vanhimmissa ikäryhmissä.

(b) Yksi ongelma on, että tiedot siitä, kuinka monta henkilöä oli mukana, on poistettu kokonaan. Eräs kohdassa (a) havaittu kuvio on yli 80-vuotiaiden naisten ilmaantuvuuden ja kuolleisuuden lasku. Taulukosta 2.7 ei kuitenkaan voida päätellä, että näissä ikäryhmissä naisilla olisi itse asiassa vain 8 uutta tapausta ja 7 kuolemaa. Näin pienellä tapausmäärällä, muutama ylimääräinen tapaus vuodessa, kuten voisimme odottaa pelkästään satunnaisvaihtelun perusteella, ilmaantuisi suurena nousuna ilmaantuvuusasteessa. Tietämättä mitään luvuista, joista taulukon 2.7 korot on laskettu, tätä ei voida ottaa huomioon. Siten esimerkiksi näistä asioista kirjoitettaessa olisi hyvä tilastollinen käytäntö sisällyttää tapausten ja kuolleiden määrät jonnekin, vaikka ei samassa taulukossa kuin luvut sisältävä.

Oletko samaa mieltä siitä, että taulukko 2.7 on kaikkien tämän osan alussa annettujen neljän ohjeen mukainen? Kun olet laatinut taulukon itsellesi, on aina hyvä idea tarkistaa se huolellisesti kunkin neljän ohjeen perusteella.

2.5 Varhaiseläkkeelle jääminen Kansallisesta terveyspalvelusta

Esimerkki 2.2: Varhaiseläkkeelle jääminen Kansallisesta terveydenhuoltopalvelusta

Ison-Britannian kansallisesta terveyspalvelusta (NHS) suoritettiin tutkimus, jossa selvitettiin varhaiseläkkeelle siirtymisen eri näkökohtia. Vuosina 1998–1999 5469 NHS:n työntekijää Englannista ja Walesista jäi varhaiseläkkeelle sairauden vuoksi. Tutkijat tutkivat näiden henkilöiden vuoden 1994 otoksen tiedot. Taulukossa 2.8 on tietoja näistä henkilöistä luokiteltuna ammattiryhmittäin ja laajasti eläkkeelle jääneiden terveydellisten syiden mukaan.

Taulukko 2.8 Eläkkeelle siirtymiset NHS:stä sairauden vuoksi, 1998–1999
AmmattiryhmäSyy eläkkeelle sairauden vuoksi
Tuki- ja liikuntaelimistönKardiovaskulaarinenPsykiatrinenMuutKaikki yhteensä
Ambulanssin työntekijät651261295
Terveydenhuollon avustajat tai tuki3396177117594
Sairaanhoitajat tai kätilöt36414470153731
Tekninen tai ammattitaitoinen henkilökunta422542394
Hallinto- tai kiinteistöjen henkilökunta118943166309
Lääkärit tai kirurgit33402028121
Muut22137850
Kaikki yhteensä9833892154071994

Tämä taulukko on mukautettu julkaisuista Pattani, S., Constantinovici, N. ja Williams, S. (2001) Kuka jää varhain eläkkeelle NHS:stä huonon terveyden vuoksi ja mitä se maksaa? Kansallinen poikkileikkaustutkimus.British Medical Journal,322, 208–209.

Tehtävä 5 Varhaiseläkkeelle jääminen Kansallisesta terveyspalvelusta

Oletetaan, että tutkijoiden pääasiallisena kiinnostuksen kohteena oli nähdä, erosivatko (ja jos ovat, miten) eläkkeelle siirtymisen syyt ammattiryhmittäin. Miten taulukko sellaisenaan vastaa tämän osan alussa annettuja ohjeita?

Vastaus
Ratkaisu

Rivien ja sarakkeiden merkinnät ovat nykyisellään kohtuullisen selkeät (ohje 1). Olettaen, että tutkijat olivat erikseen kiinnostuneita kaikista näistä ammattiryhmistä ja kaikista näistä eläkkeelle jäämisen syistä, ei näytä olevan hyviä syitä taulukon hajottamiseen tai solujen yhdistämiseen (ohje 2). Taulukon luvut ovat lukumääriä eivätkä erityisen suuria (enintään kolme numeroa, lukuun ottamatta kokonaissummaa), eikä niitä näytä olevan syytä yksinkertaistaa (ohje 3).

Joidenkin laskentatulosten sisällyttäminen saattaa kuitenkin auttaa (ohje 4). Taulukossa on melko helposti havaittavissa, että (esimerkiksi) kussakin ammattiryhmässä eniten eläkkeelle jääneiden määrä johtui tuki- ja liikuntaelimistöisistä syistä, mutta ei ole helppo verrata, kuinka paljon suurempi määrä on muihin verrattuna. jokaisessa ammattiryhmässä, koska eläkkeelle siirtyneiden kokonaismäärä vaihtelee huomattavasti ammattiryhmittäin. Tällainen vertailu olisi yksinkertaisempaa, jos tietäisimme esimerkiksi tuki- ja liikuntaelimistön takia eläkkeelle jääneiden osuuden tai prosenttiosuuden kussakin ammattiryhmässä.

Tehtävä 6 Terveydenhuollon varhaiseläke: prosentit

  • (a) Laske kunkin ammattiryhmän osalta niiden ihmisten prosenttiosuus, jotka jäivät eläkkeelle kunkin sairauden syyn vuoksi. Käytä näitä prosentteja kommentoidaksesi erilaisia ​​eläkkeelle jäämisen syitä eri ammattiryhmissä.

  • (b) Olettaen, että pidit prosenttiosuuksia hyödyllisinä näiden vertailujen tekemisessä, sano, pitäisikö nämä tiedot esittävän taulukon mielestäsi sisältää vain luvut (kuten taulukossa 2.8), vain laskemasi prosenttiosuudet vai molemmat.

Vastaus
Ratkaisu

(a) Taulukossa 2.9 on esitetty kunkin ammattiryhmän kunkin sairauden syyn vuoksi eläkkeelle jääneiden prosenttiosuus.

Taulukko 2.9 Eläkkeelle siirtymiset NHS:stä sairauden vuoksi, 1998–1999
AmmattiryhmäSyy eläkkeelle sairauden vuoksi (% rivin kokonaismäärästä)
Tuki- ja liikuntaelimistönPsykiatrinenKardiovaskulaarinenMuut
Ambulanssin työntekijät6813613
Terveydenhuollon avustajat tai tuki57101320
Sairaanhoitajat tai kätilöt50201021
Tekninen tai ammattitaitoinen henkilökunta452742
Hallinto- tai kiinteistöjen henkilökunta38301021
Lääkärit tai kirurgit27331723
Muut44261416
Kaikki yhteensä49201120

Esimerkiksi tuki- ja liikuntaelimistön vuoksi eläkkeelle jääneiden ambulanssityöntekijöiden osuus on 65/95=0,68421 eli 68,421 %. Ei kuitenkaan tarvitse lisätä kolmea desimaalin tarkkuutta, jotta datan kuviot näkyvät selkeästi. Kokonaisprosentit ovat riittävän tarkkoja; joten tämä prosenttiosuus on merkitty taulukkoon 68%. Muut prosenttiosuudet laskettiin samalla tavalla.

(Huomaa, että prosenttiosuuksien pyöristyksestä johtuen joidenkin rivien summat ovat 99 % tai 101 % 100 %:n sijaan. Tietojen yleisen mallin ilmoittamisen yhteydessä tällä ei ole merkitystä.)

Ehkä ilmeisin ero ammattiryhmien välillä on se, että tuki- ja liikuntaelimistön syistä eläkkeelle jääneiden osuus oli kahdessa ensimmäisessä ryhmässä huomattavasti suurempi kuin joissakin muissa, erityisesti hallintovirkailijoiden ja lääkäreiden. Sen paperin kirjoittajat, josta nämä tiedot on otettu, katsovat tämän eron johtuvan kahdessa ensimmäisessä kategoriassa olevien työntekijöiden tekemästä suuremmasta manuaalisesta työstä. Ammattiryhmissä, joissa tuki- ja liikuntaelimistön syistä suhteellisen alhainen eläkkeelle jääminen oli myös suhteellisen korkea psykiatrisista syistä johtuvien eläkkeelle jääneiden prosenttiosuudet. Ilman lisätutkimuksia ja erityisesti tarkastelematta, kuinka suuri osuus kussakin ryhmässä olevista työntekijöistä todella jäi eläkkeelle sairauden vuoksi (sen sijaan, että olisivat jatkaneet työskentelyä), on vaikea sanoa enempää näiden mallien syistä.

(b) Kysymykseen siitä, sisällytetäänkö prosenttiosuudet taulukkoon samoin kuin laskelmat vai niiden sijaan, ei ole yksiselitteistä vastausta. Lehden taulukko, josta nämä tiedot on saatu, sisältää molemmat. Tämä tekee taulukosta varsin monimutkaisen, ja eläkkeelle siirtymisen eri syiden kuviot eivät ole yhdellä silmäyksellä täysin selviä. Aineistoa tulkittaessa on kuitenkin tärkeää tietää, että sairauseläkkeelle siirtyneiden määrä ei joissakin näistä ryhmistä ollut erityisen suuri. Hyödyllinen kompromissi olisi ollut ottaa mukaan eläkkeelle siirtyneiden kokonaismäärä, josta kunkin rivin prosenttiosuudet laskettiin, kuten taulukossa 2.10. Yleisesti ottaen, kun tällä tavalla lasketaan taulukon riviprosentteja (tai sarakeprosenttia), on hyvä käytäntö ottaa mukaan myös prosenttiosuuksien laskennassa käytetyt summat.

Taulukko 2.10 Eläkkeelle jäämiset NHS:stä sairauden vuoksi, 1998–1999
AmmattiryhmäSyy eläkkeelle sairauden vuoksi (% rivin kokonaismäärästä)
Tuki- ja liikuntaelimistönPsykiatrinenKardiovaskulaarinenMuutYhteensä (=100 %)
Ambulanssin työntekijät681361395
Terveydenhuollon avustajat tai tuki57101320594
Sairaanhoitajat tai kätilöt50201021731
Tekninen tai ammattitaitoinen henkilökunta45274249
Hallinto- tai kiinteistöjen henkilökunta38301021309
Lääkärit tai kirurgit27331723121
Muut4426141650
Kaikki yhteensä492011201994

2.6 Yhteenveto

Tässä osiossa olet tutustunut ohjeisiin tietojen esittämisestä taulukoissa. Nämä ohjeet pätevät erityisesti silloin, kun taulukon tietoja käytetään havainnollistamaan tiettyä kohtaa tai näyttämään selkeästi tietty kuvio.

Olet huomannut, että joissakin olosuhteissa näiden ohjeiden toisen noudattaminen johtaa johonkin rivien yhdistämiseen. (Muissa tapauksissa se voi olla sarakkeita tai yksittäisiä soluja, jotka yhdistetään.) Kuitenkin on oltava varovainen, kun tällaisia ​​yksinkertaistuksia tehtäessä tietoja katoaa taulukosta. Näkemäsi esimerkit ohjeen 4 soveltamisesta sisältävät asianmukaisten suhteiden tai korkojen laskemisen. Tällaiset laskelmat ovat hyvin yleisiä taulukkomuodossa olevien tietojen käsittelyssä.

3 Taulukon tietojen tulkitseminen

Osassa 2 päähuolenaiheena oli muiden luettavissa olevan tietotaulukon tuottaminen, joka välittää selkeästi datan tärkeät mallit tai viestit. Tässä osiossa tarkennus muuttuu hieman. Sinun roolisi on taulukon tietojen lukija tai käyttäjä, ja opit lähestymistapoja, jotka helpottavat tietojen poimimista taulukosta. Taulukkotietojen muokkaaminen sellaiseen muotoon, joka tekee niistä selkeämpiä muille, tekee siitä kuitenkin hyvin usein selkeämmän myös sinulle. Joten luvussa 2 esitellyt lähestymistavat ovat hyödyllisiä myös tässä osiossa. Sinulla on enemmän käytäntöä valita ja laskea sopivia suhteita ja hintoja taulukkotiedoille. Näet myös esimerkkejä, joissa on tarkoituksenmukaista mennä askeleen pidemmälle kuin osiossa 2: sen sijaan, että jätettäisiin tiedot taulukkomuotoon, myös asiaankuuluvat kaaviot piirretään.

3.1 Terveyshenkilöstö Thaimaassa

Tässä osiossa ei käytännössä ole uusia teorioita tai uusia periaatteita. Käymme läpi joitakin esimerkkejä, ja näet, kuinka jo oppimiasi perustekniikoita ja -lähestymistapoja voidaan yhdistää, jotta voit käyttää taulukkotietoja tehokkaasti.

Esimerkki 3.1 Terveyshenkilöstö Thaimaassa

Taulukossa 3.1 esitetyt tiedot on otettuThaimaan miniterveysprofiili 1988, julkaissut Bangkokin kansanterveysministeriö. Ne osoittavat terveydenhuollon henkilöstömäärät noin viiden vuoden välein.

Taulukko 3.1 Terveyshenkilöstö Thaimaassa, 1966–1984
Kategoria19661971197619811984
Lääkärit36094092521069318058
Hammaslääkärit25353260010571326
Farmaseutit9401586175726803312
Sairaanhoitajat68769760137001959931827
Kätilöt28344989730485778573
Kaikki yhteensä1451220959285713884453096

Mitä nämä tiedot kertovat terveydenhuollon henkilöstön muutoksesta Thaimaassa kyseisellä ajanjaksolla, ja miten voimme työskennellä taulukon tietojen avulla selventääksemme kuvioita?

Ensinnäkin huomaa, että jotkin tietojen ominaisuudet ovat ilmeisiä. Terveydenhuollon henkilöstön kokonaismäärä kasvoi valtavasti vuosien 1966 ja 1984 välillä, alle 15 000:sta noin 53 000:een. Myös koko ajanjakson ajan suurin henkilöstöluokka oli sairaanhoitajat, ja tämä luokka näyttää kasvaneen nopeammin kuin jotkut muista. (Vuonna 1966 sairaanhoitajia oli hyvin karkeasti kaksi kertaa enemmän kuin esimerkiksi lääkäreitä, mutta vuonna 1984 sairaanhoitajia oli lähes neljä kertaa enemmän kuin lääkäreitä.)

Miten jo tunnistettuja malleja voitaisiin selventää? Numeroiden yleisen kasvun kuvio on jo selvä taulukon viimeiseltä riviltä. Ehkä sitä voisi selventää piirtämällä sopiva kaavio; palaamme tähän ajatukseen myöhemmin.

Tehtävässä 6 eri ammattiryhmien eläkkeelle siirtymissyiden kuvioita selvennettiin laskemalla kunkin merkinnän suuruus prosentteina vastaavan rivin kokonaissummasta. Tehtävässä 7 sinua pyydetään pohtimaan, auttaisiko vastaava lähestymistapa tässä.

3.2 Terveydenhuollon henkilöstö Thaimaassa: toiminta

Tehtävä 7 Terveydenhuollon henkilöstö Thaimaassa: prosenttien laskeminen

Olisiko hyödyllistä, kun harkitaan mahdollisia muutoksia tavassa, jolla terveydenhuoltohenkilöstö on jaettu viiteen lueteltuun luokkaan, laskea luvut uudelleenTaulukko 3.1prosentteina joko rivien kokonaissummasta tai sarakkeen kokonaissummasta? Jos uskot, että siitä olisi apua, laske sopivat prosenttiosuudet ja käytä tuloksena olevaa taulukkoa kommentoidaksesi tietoja.

Vastaus

Taulukon rungon lukujen uudelleenlaskeminen prosenttiosuuksina sarakkeiden kokonaissummasta näyttäisi selkeästi, kuinka kunkin vuoden terveydenhuoltohenkilöstön kokonaismäärä jakautuu viiden kategorian kesken. Ei olisi kovin mielekästä laskea prosenttiosuuksia rivien summasta. Tulokset lukujen laskemisesta prosentteina sarakkeen kokonaissummasta on esitetty taulukossa 3.2.

Taulukko 3.2 Terveydenhuoltohenkilöstö Thaimaassa, 1966–1984 (prosenttiosuudet sarakkeen kokonaismäärästä)
Kategoria19661971197619811984
Lääkärit2520181815
Hammaslääkärit23232
Farmaseutit68676
Sairaanhoitajat4747485060
Kätilöt2024262216
Yhteensä (= 100 %)1451220959285713884453096

Nämä prosenttiluvut osoittavat, että hammaslääkäreiden ja proviisorien luvut prosentteina terveydenhuollon kokonaishenkilöstöstä muuttuivat hyvin vähän taulukon kattamana ajanjaksona. Lääkäreiden osuus kuitenkin laski kohtuullisen tasaisesti vuoden 1966 25 %:sta 15 %:iin vuonna 1984. Sairaanhoitajien osuus kasvoi hitaasti vuodesta 1966 vuoteen 1981, mutta nousi sitten nopeasti vuosina 1981-1984. Lopuksi kätilöiden osuus kasvoi. kattaman ajanjakson kymmenen ensimmäisen vuoden aikana, mutta laski sitten takaisin vuoden 1966 tason alapuolelle. Tietysti koko ajan tulee muistaa, että terveydenhuollon henkilöstön kokonaismäärä kasvoi huomattavasti ajanjakson aikana.

Tutkimuksesi tehtävässä 7 selvensi alkuperäisen taulukon kuvioita; mutta on kuitenkin niin, että taulukon näkyvin yksittäinen piirre on terveydenhuollon henkilöstön kokonaismäärän kasvu tarkastelujaksolla. Saattoi kuitenkin tulla mieleen, että myös näiden terveydenhuollon henkilöstön palvelema väestö muuttui kyseisenä ajanjaksona. Thaimaa on loppujen lopuksi kehitysmaa, jonka väestö on saattanut kasvaa huomattavasti vuosina 1966-1984.

Itse asiassa arviot Thaimaan kokonaisväestöstä kattamina vuosinaTaulukko 3.1ovat myös siinä lähteessä, josta taulukko on otettu. Ne on esitetty taulukossa 3.3.

Taulukko 3.3 Thaimaan arvioitu kokonaisväestö 1966–1984
19661971197619811984
Väestö (miljoonia)31.135.440.344.950.7

Näiden lukujen perusteella voidaan laskea eri terveydenhuollon henkilöstöryhmien lukumäärää suhteessa koko väestöön. Nämä osuudet voitaisiin periaatteessa joka tapauksessa esittää prosentteina tai lukuina 100 000 asukasta kohti, kuten esimerkissä 2.1 (katso erityisesti taulukot 2.6 ja 2.7); mutta tässä tapauksessa ne ovat selkeämpiä, jos ne esitetään lukuina miljoonaa asukasta kohti. Tuloksena saadut suhteet on esitetty taulukossa 3.4. Kun olet lukenut taulukon läpi, tarkista, että ymmärrät kuinka näytetyt luvut on laskettu.

Taulukko 3.4 Terveydenhuollon henkilöstö miljoonaa asukasta kohti Thaimaassa, 1966–1984
Kategoria19661971197619811984
Lääkärit116,0115.6129.3154.4158,9
Hammaslääkärit8.115.014.923.526.2
Farmaseutit30.244.843.659.765.3
Sairaanhoitajat221.1275,7340,0436,5627,8
Kätilöt91.1140,9181.2191,0169.1
Kaikki yhteensä466,6592.1709,0865.11047,3

Nämä laskelmat osoittavat selvästi, että Thaimaan terveydenhuollon henkilöstön kokonaismäärä suhteessa väestön kokoon nousi huomattavasti ja tasaisesti vuosina 1966-1984. Toisin sanoen väestö kasvoi tänä aikana, mutta terveydenhuollon henkilöstö nousi paljon nopeammin. Eri luokkien muutoksia suhteessa koko väestöön olisi kohtuullisen yksinkertaista kommentoida taulukon 3.4 lukujen perusteella, mutta tätä tehtävää voidaan helpottaa piirtämällä sopiva graafi.

Taulukon 3.4 kaltaisia ​​tietoja, joissa jokaiselle on arvo useille eri ajoille, kutsutaan nimelläAikasarja.(Tässä tapauksessa on itse asiassa kuusi eri aikasarjaa, yksi kullekin henkilöstöryhmälle ja yksi terveydenhuoltohenkilöstön kokonaistiedoille.) Hyödyllinen graafinen aikasarjatietojen näyttämiseen onviiva juoni.Tämä on sirontakaavio, jossa ajat (tässä tapauksessa vuodet) vaaka-akselilla ja aikasarjan todelliset data-arvot pystyakselilla. Aikasarjatiedoille on tavanomaista yhdistää tuloksena olevat kaaviot suorilla viivoilla. Tämä kiinnittää huomion sarjan arvojen muutosnopeuteen. Aikasarjoista, joissa on suuri määrä erilaisia ​​aikapisteitä, datapisteitä edustavat symbolit (esimerkiksi ristit tai pisteet) jätetään usein pois selvyyden vuoksi. Näissä tiedoissa on kuitenkin vain viisi aikapistettä, joten sitä ei tarvitse tehdä. Voisimme tuottaa tällaiset viivakuvaukset erikseen jokaiselle eri kategorialle ja jopa kokonaisuudelle. Mutta usein on helpompi verrata eri aikasarjojen tasoja piirtämällä ne kaikki samalle kaaviolle. Kuvassa 3.1 on tällainen kaavio, jossa on joukko pisteitä ja viiva jokaiselle luokalle. (Koko henkilöstöä koskeva sarja on jätetty pois. Koska kokonaismäärät ovat välttämättä suurempia kuin yksittäisten ryhmien luvut, niiden sisällyttäminen samaan kaavioon puristaisi kaikki muut viivat kaavion alareunaan ja tekisi niistä vaikea nähdä.)

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (16)

Kuva 3.1 Terveydenhuollon henkilöstö miljoonaa asukasta kohden Thaimaassa

Näytä kuvaus|Piilota kuvaus

Kuva 3.1

Kuva 3.1 Terveydenhuollon henkilöstö miljoonaa asukasta kohden Thaimaassa

Tehtävä 8 Terveydenhuollon henkilöstö: viivakaavioiden tulkinta

Kommentoi tärkeimmät terveydenhuollon henkilöstön muutokset miljoonaa asukasta kohden Thaimaassa vuosina 1966–1984 kuvan 3.1 perusteella. Onko taulukon 3.4 tiedoissa tärkeitä kuvioita, joita kaavio tekee?eitee selväksi?

Vastaus

Kuvasta 3.1 käy selvästi ilmi, että kunkin luokan henkilöstömäärät suhteessa maan koko väestöön nousivat tarkastelujaksolla varsin voimakkaasti. Nousu oli erittäin huomattavaa sairaanhoitajien osalta (jotka olivat suurin luokka koko ajanjakson ajan), erityisesti tarkastelujakson loppupuolella, vuosina 1981–1984. Tähän yleiseen kasvumalliin on joitain poikkeuksia, joista näkyvin on Kätilöiden määrä miljoonaa asukasta kohden laski huomattavasti vuosina 1981-1984.

Kaaviosta käy hyvin selväksi, että hammaslääkäreiden ja proviisorien luvut miljoonaa asukasta kohden ovat huomattavasti pienempiä kuin muiden luokkien vastaavat luvut; ja on melko selvää, että molempien näiden ryhmien luvut nousivat ajanjakson aikana. Koska näiden ryhmien luvut ovat kuitenkin niin paljon pienempiä kuin esimerkiksi sairaanhoitajien luvut, hammaslääkäreiden ja apteekkien rivit ovat melko litistyneet kaavion alareunassa, ja siksi on vaikea arvioida lisäyksen suuruutta. . Taulukosta kuin kaaviosta käy siis selvästi ilmi, että hammaslääkäreiden määrä on yli kolminkertaistunut suhteessa väestön kokoon ajanjakson aikana ja että proviisorien määrä on yli kaksinkertaistunut. Kaaviosta ei myöskään käy selvästi ilmi, että hammaslääkäreiden ja proviisorien luvut laskivat hieman suhteessa väestöön vuosina 1971-1976.

Tehtävä 9 Terveydenhuollon henkilöstö: lisää mittasuhteista

Tehtävässä 7 työssäsi, joka koski terveydenhuollon henkilöstön osuutta eri kategorioissa, ei otettu huomioon Thaimaan kokonaisväestöä. Selitä miksi, jos lasket taulukon 3.4 luvut prosentteina sarakkeen kokonaissummasta, saisit täsmälleen saman prosenttitaulukon kuin tehtävän 7 ratkaisussa. Jos haluat esittää nämä prosentit graafisesti, millainen kaavio sinä piirrät?

Vastaus

Luvut missä tahansa tietyssä sarakkeessaTaulukko 3.4, mukaan lukien sarakkeen kokonaissummat, ovat samat kuin vastaavan sarakkeen luvutTaulukko 3.1jaettuna vastaavan sarakkeen väestöarviollaTaulukko 3.3. Näin ollen jakoa suoritettaessa laskea prosenttiosuusTaulukko 3.4, osoittajassa ja nimittäjässä olevat määrät on laskettuTaulukko 3.1jakamalla samalla väestömäärällä. Joten populaation kokonaismäärä kumoutuu ja jaon tulos on identtinen tuloksen kanssaTaulukko 3.1.

Yksi sopiva kaavio, joka kiinnittäisi erityistä huomiota mittasuhteisiin, on ympyräkaavio. Voisimme piirtää erilliset ympyräkaaviot jokaiselle taulukossa mainitulle vuodelle. Sopivat ympyräkaaviot vuosien 1966 ja 1984 tiedoille on esitetty kuvissa 3.2 ja 3.3. (Teitä ei pyydetty piirtämään näitä tehtävissä!)

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (17)

Kuva 3.2 Ympyräkaavio Thaimaan terveydenhuollon henkilöstöstä vuonna 1966

Näytä kuvaus|Piilota kuvaus

Kuva 3.2

Kuva 3.2 Ympyräkaavio Thaimaan terveydenhuollon henkilöstöstä vuonna 1966

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (18)

Kuva 3.3 Ympyräkaavio Thaimaan terveydenhuollon henkilöstöstä vuonna 1984

Näytä kuvaus|Piilota kuvaus

Kuva 3.3

Kuva 3.3 Ympyräkaavio Thaimaan terveydenhuollon henkilöstöstä vuonna 1984

Nämä ympyräkaaviot kiinnittävät erityistä huomiota sairaanhoitajien määrän suureen kasvuun Thaimaan terveydenhuollon kokonaishenkilöstöstä vuosina 1966–1984.

Esimerkissä 3.1 alkuperäiset tiedot olivat yksilöiden lukumäärää. Asianmukaisten prosenttiosuuksien laskeminen osoittautui hyödylliseksi jakamalla taulukon rungon luvut sarakkeiden kokonaissummalla. Toiminnossa 2.4 laskit samanlaisia ​​prosenttiosuuksia, mutta ne perustuivat rivien summaan. Esimerkissä 3.1 ei olisi ollut kovinkaan järkevää laskea prosenttiosuuksia rivien summasta. Tehtävässä 6 olisi kuitenkin ollut järkevää laskea sarakkeiden kokonaissumman prosenttiosuudet rivien summan sijaan, mutta ne olisivat antaneet tietoja, jotka liittyvät eri kysymykseen kuin tarkastelemasi. Yleisissä lukutaulukoissa on hyvin usein hyödyllistä laskea prosenttiosuudet rivien ja/tai sarakkeiden kokonaissummasta, mutta on tärkeää miettiä tarkkaan, mikä prosenttijoukko on informatiivinen sinua kiinnostavan kysymyksen suhteen. Seuraavan esimerkin tarkoituksena on tehdä tämä selväksi.

3.3 HIV-testaus Saharan eteläpuolisessa Afrikassa

Esimerkki 3.2 HIV-testaus Saharan eteläpuolisessa Afrikassa

Kehittyneissä maissa verikoe on tavallinen tapa testata, onko henkilö HIV-tartunnan saaneessa AIDSia aiheuttavassa viruksessa. Edellyttäen, että tällainen testi suoritetaan riittävän kauan ensimmäisen tartunnan jälkeen, tarkkuus on korkea. Kuitenkin Saharan eteläpuolisessa Afrikassa, jossa useimmissa maissa AIDSin ilmaantuvuus on paljon korkeampi kuin kehittyneissä maissa, verikokeita voi olla vaikea tehdä ja se on kallista käytettävissä oleviin terveysresursseihin nähden. Siten kiinnostaa, voidaanko HIV-infektio ylipäätään diagnosoida luotettavasti paikallisissa olosuhteissa helpommin mitattavissa tai havaittavissa olevien kliinisten ominaisuuksien perusteella. HIV-tartunnan saaneilla ihmisillä on usein suurentuneet imusolmukkeet, ja nämä suurentuneet solmut voidaan tuntea kehon ulkopuolelta yksinkertaisessa fyysisessä tarkastuksessa. On kuitenkin olemassa monia muita syitä, kuten HIV-infektio, että yksilöllä on suurentuneet imusolmukkeet. (Ison-Britannian kaltaisissa maissa suurin osa laajentuneista imusolmukkeista johtuu infektioista, joilla ei ole mitään tekemistä HIV:n tai AIDSin kanssa.)

Zimbabwen tutkijat tutkivat kolmen kuukauden aikana kaikkia Hararen sairaalan akuuttien sairaaloiden osastolle vietettyjä aikuisia potilaita (paitsi yhtä potilasta, joka ei tutkinut HIV-testausta Afrikassa suostuvat osallistumaan). Jokainen potilas testattiin HIV:n varalta käyttämällä standardia (ja tarkkaa) veritestimenetelmää. (Itse asiassa 56 %:lla potilaista osoittautui näiden testien mukaan HIV-infektio.) Lisäksi potilailta tutkittiin (tuntemalla) suurentuneet imusolmukkeet kolmella kehon alueella. Tiedot sisäänTaulukko 3.4antaa tietoa niiden potilaiden lukumäärästä, joilla epitrokleaarinen imusolmuke (olkavarren kyynärpään lähellä oleva solmukohta) on turvonnut yli 1 cm:n kokoiseksi.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (19)

Taulukko 3.4 Mahdolliset HIV-indikaattorit Hararen sairaalapotilailla

Näytä kuvaus|Piilota kuvaus

Taulukko 3.4

Taulukko 3.4 Mahdolliset HIV-indikaattorit Hararen sairaalapotilailla

Tehtävä 10 HIV-testaus: mittasuhteiden laskeminen

  • (a) Oletetaan, että olet lääkäri, joka harjoittelee sairaalassa Saharan eteläpuolisessa Afrikassa paikassa, jossa näkemiesi potilaiden yleiset ominaisuudet ovat todennäköisesti melko samanlaisia ​​kuin taulukossa 3.4. Päätät tutkia näkemiesi potilaiden suurentuneita epitrokleaarisia imusolmukkeita ja, riippuen siitä, löydätkö tällaisen solmukkeen suurentuneena yli 1 cm:n, käytät näitä tietoja yhdessä taulukossa 3.4 olevien tietojen kanssa arvioidaksesi, kuinka todennäköistä on, että potilaalla on HIV. Auttaisiko sinua enemmän taulukon 3.4 rungon lukujen uudelleenlaskeminen prosentteina rivien tai sarakkeiden kokonaissummasta? Laske prosenttijoukko, jonka uskot sopivammaksi. Mitä mieltä olet tulostesi valossa siitä, kuinka todennäköistä on, että potilaalla, jolla on yli 1 cm:n epitrokleaarinen solmu, todella on HIV (verikokeen mukaan). Entä potilas, jolla ei ole tällaista solmua?

  • (b) Oletetaan nyt, että olet tieteellinen tutkija, joka on kiinnostunut fysiologisesta mekanismista, jolla HIV-infektio voi aiheuttaa imusolmukkeiden suurenemista. Auttaisiko tätä aihetta tutkiessasi sinua enemmän laskemaan uudelleen päätekstin numerotTaulukko 3.4prosentteina rivien tai sarakkeen kokonaissummasta? Laske prosenttijoukko, jonka pidät sopivampana, ja kommentoi löytämääsi.

Vastaus

(a) Oletetaan tässä tilanteessa, että jollakin potilaastasi epitrokleaarinen imusolmuke on laajentunut yli 1 cm:iin. Voit sitten kysyä: "Millä osalla tällaisista potilaista todella on HIV (kuten kävisi ilmi, jos heille annettaisiin tavallinen verikoe)?" Eli tiedät, että potilaasi vastaa taulukon 3.4 ensimmäisellä rivillä olevia potilaita. Jos potilaat ovat yleisesti vertailukelpoisia Hararen sairaalan potilaiden kanssa, osuuden voi arvioida laskemalla taulukon 3.4 ensimmäisellä rivillä oleva luku prosentteina rivin kokonaismäärästä. Tästä syystä taulukon lukujen laskeminen prosentteina rivien kokonaissummasta on hyödyllistä, ja sarakkeen kokonaissumman prosenttiosuudet ovat vähemmän tärkeitä. Laskemalla kaikki luvut prosentteina rivien summasta saadaan taulukko 3.5. (Prosenttiosuudet on pyöristetty kokonaisiksi.)

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (20)

Taulukko 3.5: Hararen sairaalapotilaiden rivien kokonaissumman prosenttiosuudet

Näytä kuvaus|Piilota kuvaus

Taulukko 3.5: Hararen sairaalapotilaiden rivien kokonaissumman prosenttiosuudet

Taulukko 3.5: Hararen sairaalapotilaiden rivien kokonaissumman prosenttiosuudet

Tästä taulukosta käy ilmi, että 83 % potilaista, joilla oli yli 1 cm suurentunut epitrokleaarinen imusolmuke, oli todella HIV-tartunnan saaneita (verikokeen mukaan). Tässä yhteydessä on melko todennäköistä, että potilaalla, jolla on tällainen laajentunut solmu, on HIV. (Mutta muista, että nämä luvut eivät päde muissa yhteyksissä. Kuten taulukosta 3.5 jälleen käy ilmi (alarivillä), 56 % kaikista tutkimukseen osallistuneista potilaista oli HIV-positiivisia verikokeessa. Sairaalassa sanotaan, Eurooppa, näin ei tapahdu, ja on paljon todennäköisempää, että laajentuneella epitrokleaarisella imusolmukkeella olisi jokin muu selitys.)

Taulukko osoittaa myös, että 52 % potilaista, joilla ei ole tämän kokoista suurentunutta epitrokleaarista imusolmuketta, ei ollut HIV-positiivinen. Hararessa tämän fyysisen merkin puuttuminen ei itse asiassa kerro paljon potilaan mahdollisuudesta vapautua HIV:stä. Mahdollisuus on enemmän kuin potilailla yleensä, mutta ei paljon suurempi.

(b) Tässä tapauksessa tiedemies on todennäköisesti kiinnostuneempi kysymään: "Millä osuudella potilaista, jotka ovat todellisuudessa HIV-positiivisia verikokeessa, on tämän kokoinen suurentunut epitrokleaarinen imusolmuke?". Toisin sanoen tiedemies olisi kiinnostunut tietämään, kuinka suuria taulukon luvut olivat suhteessa sarakkeiden kokonaissummaan rivien kokonaissumman sijaan. Tuloksena saadut prosenttiosuudet on esitetty taulukossa 3.6.

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (21)

Taulukko 3.6: Hararen sairaalapotilaiden sarakkeen kokonaissumman prosenttiosuudet

Näytä kuvaus|Piilota kuvaus

Taulukko 3.6

Taulukko 3.6: Hararen sairaalapotilaiden sarakkeen kokonaissumman prosenttiosuudet

Tämä taulukko osoittaa, että Harare-potilaista, jotka ovat HIV-positiivisia (verikokeissa), 36 %:lla on tämäntyyppinen imusolmukkeiden suureneminen (eli useimmilla heistä ei sitä ole). Kuitenkin tosiasia, että tämän tyyppisellä suurentuneella imusolmukkeella on diagnostista arvoa, osoittaa se tosiasia, että paljon pienemmällä osalla, vain 10 prosentilla HIV-negatiivisista potilaista, on tämä tietty merkki.

On syytä huomata, että taulukon 3.5 prosenttiosuudet poikkeavat huomattavasti taulukon 3.6 prosenteista. Jos siis olisit kiinnostunut tiedemiehen kysymyksestä, mutta laskisi erehdyksessä lääkärin kannalta merkitykselliset prosenttiosuudet (eli riviprosentit), saatat joutua vakavasti harhaan.

Sisään tuleville tiedoilleTaulukko 3.4, sekä rivi- että sarakeprosentit osoittautuivat hyödyllisiksi määriksi laskettavaksi; mutta kumpi on hyödyllisempi, riippuu kysymyksestä, johon yrität vastata. On erittäin tärkeää, että riviprosentteja ei käytetä sarakkeen prosenttiosuuksiin liittyviin kysymyksiin vastaamiseen tai päinvastoin. Kuten näit tehtävässä 10, nämä kaksi prosenttiosuussarjaa voivat olla huomattavasti erilaisia. Yleisesti ottaen laskelmia tehtäessä taulukoiden tiedoista on aina tärkeää miettiä tarkasti, mitä haluat tietää.

Ennen viimeistä toimintaa vedetään yhteen joitakin grafiikkaan liittyviä säikeitä. Olet nyt tavannut useita erilaisia ​​grafiikoita: ympyräkaavioita, pylväskaavioita, histogrammeja, sironta-, laatikko- ja viivakaavioita aikasarjoista. Olet nähnyt, että eri tyyppiset juonit sopivat erityyppisille tiedoille. Olet myös huomannut, että sopivan graafin valinta tietojen esittämiseen ja tutkimiseen voi riippua kiinnostavasta kysymyksestä. Seuraavat ohjeet kokoavat yhteen tähän mennessä oppimasi asiat.

3.4 Ohjeita grafiikkaa varten

  1. Yksittäisten kokonaisuuksien (esimerkiksi ihmiset, eläimet, voimalaitokset) lukumäärien muodossa olevia tietoja voidaan esittää pylväs- tai ympyrädiagrammeina pienessä joukossa erillisiä luokkia. Useimpiin tarkoituksiin pylväskaaviot ovat parempia. Ympyräkaaviot kiinnittävät erityistä huomiota suhteisiin, joissa kokonaisuudet on jaettu eri luokkiin. He tekevät sen kuitenkin esittämällä mittasuhteet kulmilla, ja vaikka pääasiallinen kiinnostuksen kohteena olisikin mittasuhteet, pylväskaavioita voi hyvinkin olla helpompi "lukea".

  2. Luokkalaskennan muodossa oleville tiedoille, joiden mielenkiinto on kahden tai useamman tietojoukon vertailussa (kuten esimerkissä 2.3Yksikkö A1), voi olla hyödyllistä tuottaa pylväskaavio, jossa eri tietojoukkojen vastaavat palkit on piirretty vierekkäin.

  3. Jatkuvan (mitattavan) muuttujan arvojen jakautumismallin tutkimiseksi histogrammi on sopiva grafiikka. Vaihtoehtona on boxplot. Kumpikaan kaavio ei kuitenkaan anna suoraa tietoa aineiston havaintojen määrästä, ja voi olla riskialtista tehdä varmoja johtopäätöksiä jakauman mallista, kun havaintojen määrä on pieni.

  4. Boxplotit antavat yksinkertaisen esityksen jatkuvan muuttujan arvoista. Niitä voidaan käyttää myös diskreeteille muuttujille, joissa luokat ovat numeroita (kuten perhekokojen määrät kuvassa 1.7. Boxplot näyttää vähemmän yksityiskohtia jakaumasta kuin sopiva histogrammi tai pylväskaavio, mutta laatikkokaavion yksityiskohtien määrä on usein riittävä.

  5. Boxplotit ovat erityisen hyödyllisiä vertailtaessa kahta tai useampaa tietojoukkoa, koska vastaavat laatikkokaaviot voidaan piirtää samaa kaaviota vasten yhteistä mittakaavaa. (Tätä on vaikea tehdä selkeästi useammalla kuin yhdellä histogrammilla.)

  6. Sirontakaavioita käytetään, kun kahden numeerisen muuttujan arvot on saatu kustakin useista yksittäisistä entiteeteista. Kaavion tavoitteena on tutkia näiden kahden muuttujan arvojen välistä suhdetta.

  7. Viivakuvaajat voivat olla hyödyllisiä erityisesti aikasarjatiedoissa, koska ne kiinnittävät huomiota tapaan, jolla yksi tai useampi muuttuja on muuttunut ajan myötä.

  8. Joissain tilanteissa, varsinkin kun tiedot ovat hyvin vinossa, voidaan tuottaa informatiivisempi boxplot tai hajakuvaaja muuttamalla tiedot ensin.

Tämä osio päättyy laajempaan toimintaan. Tämä antaa sinulle lisää kokemusta taulukoiden tietojen käsittelystä. Sinua pyydetään myös tarkastelemaan yhtä tai kahta hieman erilaista lähestymistapaa taulukkotietojen tulkitsemiseen.

3.5 British Crime Survey

Taulukko 3.7 British Crime Surveyn ja poliisin kirjaamien rikosten vertailu
1997 Poliisi1997 BCS% BCS raportoitu% kirjatuista raportoiduista% kirjattu kaikista BCS:istä% muutos 1995-1997% muutos 1981-1997
PoliisiBCSPoliisiBCS
Vandalismi4432917265815−4−151217
Kaikki vastaavat omaisuuden varkaudet (hankintarikollisuus)17516261505628−17−155199
Murtovarkaus5191639644932−19−748119
Yrityksiä & ei tappiota140976502914−17−0,190160
Tappion kanssa379664856757−20−153777
Kaikki ajoneuvovarkaudet10223483476229−15−195799
Varkaus ajoneuvosta5522164435925−16−146368
Ajoneuvon varkaus316375978784−21−251031
Varkausyrityksiä1549433744163−27447425
Polkupyörän varkaus151549644327−18−1719154
Varkaus henkilöltä60590352910−4−127136
Kaikki vastaava väkivalta256102249512511−1315053
Haavoittuva20571445632918−1714341
Ryöstö52307573017−11−218389
Kaikki vertailukelpoisia24501019944542412156756

Mirrlees-Black, C, Budd, T., Partridge, S. ja Mayhew, P. (1998)1998 British Crime Survey Englnd Wales, Sisäministeriön Tilastotiedote 21/98

Tehtävä 11 British Crime Survey

British Crime Survey (BCS) on Englannissa ja Walesissa sisäministeriön suorittama otantatutkimus. Kysely toteutettiin ensimmäisen kerran vuonna 1982 ja tätä kirjoitettaessa (2001) se tehdään kahden vuoden välein. Tavoitteena on mitata ihmisiin kohdistuvien rikosten määrää kotitalouksissa. Tiedot kerätään haastattelemalla edustavasta kotitaloustotuksesta aikuisia vastaajia heidän kokemuksistaan ​​rikoksen uhrina edellisenä vuonna ja joistakin muista rikokseen liittyvistä seikoista. Vuoden 1998 BCS:ää varten haastateltiin vastaaja kustakin noin 15 000 kotitaloudesta.

BCS:n lisäksi Englannin ja Walesin rikollisuuden pääasiallinen tietolähde on poliisin asiakirjat. Poliisirekisterin rikostiedot eivät ole täysin vertailukelpoisia BCS:n tietojen kanssa, pääasiassa siksi, että tietyt rikosluokat eivät kuulu kummankaan tietolähteen piiriin. (Esimerkiksi yrityksiin kohdistuvia petoksia ei kirjata BCS:ään, koska yksityisessä taloudessa ei ole henkilökohtaista uhria.) On kuitenkin olemassa suuri joukko rikosluokkia, joista BCS-tietojen ja poliisitietojen pitäisi (periaatteessa ainakin) olla vertailukelpoisia.Taulukko 3.5on otettu vuoden 1998 BCS:n raportista (ja liittyy siten vuoden 1997 rikoksiin), ja siinä verrataan eri tavoin poliisin kirjaamien ja BCS:n mittaamien rikosten lukumäärää (tuhansina) (näissä vertailukelpoisissa luokissa). (BCS:n luvut ovat otostietoihin perustuvia arvioita näiden luokkien rikosten kokonaismäärästä Englannissa ja Walesissa.) BCS:ssä vastaajilta kysytään mitä tahansa rikosta, jonka uhri he olivat, riippumatta siitä, olivatko he joutuneet vai eivät. siitä ilmoitettiin poliisille. Monista rikoksista ei tehdä ilmoitusta poliisille, eivätkä nämä rikokset selvästikään näy poliisin asiakirjoissa.

Osa tästä toiminnasta liittyy sen ymmärtämiseen, mistä luvut ovat peräisin tässä melko monimutkaisessa taulukossa. Itse asiassa raportin tekstissä on enemmän vihjeitä eri numeroiden välisistä suhteista. Muiden raporttien ja muiden taulukoiden kohdalla tämä ei valitettavasti aina pidä paikkaansa, joten harjoittelu, jonka saat tekemällä tätä toimintaa, kannattaa!

Huomaa myös, että alla oleviin kysymyksiin sinun on vastattavalyhyesti. Kyky tehdä tilastollisia seikkoja ytimekkäästi kirjallisesti on tärkeä taito yleisesti (samoin kuin se on tärkeää kokeessa, jossa aika on rajallinen).

  • (a) Alareunassa oleva rivi "Kaikki vertailukelpoiset".Taulukko 3.5koskee kaikkien vertailukelpoisiin luokkiin kuuluvien rikosten arvoja yhdessä. Selitä lyhyesti, kuinka rivin kolme ensimmäistä prosenttiosuutta (44, 54, 24) liittyvät toisiinsa ja rivin kahteen ensimmäiseen arvoon (2450, 10199).

  • (b) Harkitse saraketta "Vuoden 1997 poliisi". Kuvaile lyhyesti, kuinka tämän sarakkeen arvot liittyvät toisiinsa.

  • (c) Piirrä sopiva kaavio, joka näyttää arvot, jotka liittyvät "vandalismi", "murto", "kaikki ajoneuvovarkaudet", "polkupyörävarkaudet", "varkaus henkilöltä" ja "kaikki vastaava väkivalta" käyttämällä arvoja sarake "1997 BCS".

  • (d) Etsi ja käytä taulukosta sopivat luvut laskeaksesi osan (c) arvoja vastaavat arvot vuonna 1981. Piirrä kaavio näyttääksesi nämä arvot. Kommentoi kaavioidesi ja/tai vastaavien lukujen avulla lyhyesti näiden luokkien rikosten lukumäärien yhtäläisyyksiä ja eroja vuosina 1981 ja 1997.

Vastaus

Tämän toiminnon kysymykset vaativat yleensä sinun vastaamistalyhyesti. Tämä ratkaisu ei ole erityisen lyhyt, koska se sisältää materiaalia, jonka tarkoituksena on selittää sinulle, mitä tapahtuu. Asian selventämiseksi tämä selittävä materiaali on kuitenkin suljettu hakasulkeisiin.

(a) Arvo 44 [% BCS raportoitu -sarakkeessa] on prosenttiosuus BCS:ssä mainituista rikoksista, jotka BCS:n vastaajien mukaan tehtiin poliisille. Sitä ei voida laskea muista taulukon arvoista. Siitä voidaan kuitenkin päätellä, että poliisille ilmoitettujen ”vertailukelpoisten” rikosten määrä oli BCS:n vastaajien mukaan 44 % 10 199 tuhannesta eli 4488 tuhannesta [tuhannen tarkkuudella].

Arvo 54 [% kirjatuista ilmoitetuista -sarakkeessa] on prosenttiosuus rikoksista, jotka BCS-vastaajatsanoiilmoitettiin poliisille, jotka todella näkyvät poliisin rikostilastoissa. On jo laskettu, että BCS:n vastaajien mukaan 4488 tuhatta rikosta näissä luokissa on ilmoitettu poliisille. Poliisin tietojen mukaan heille ilmoitettiin 2450 tuhatta tällaista rikosta. Siten luku 54 % lasketaan suhteeksi 24504488 [ja luvut todellakin täsmäävät, kun otetaan huomioon pyöristysvirhe].

Lopuksi, arvo 24 [sarakkeessa "% kirjattu kaikista BCS:stä"] on poliisille ilmoitettujen rikosten kokonaismäärän (poliisirekisterin mukaan) suhde BCS:ään tallennettujen rikosten määrään. Eli se on 2450/10 199 [ja taas tämä tulee 24 prosenttiin].

(b) [Vuoden 1997 poliisi-sarakkeessa ja itse asiassa vuoden 1997 BCS-sarakkeessa vastaavien rikosten kokonaismäärä on jaettu useiden eri luokkien kesken, ja jotkut luokat on jaettu edelleen alaluokkiin ja joissakin tapaukset jaetaan edelleen.] Arvo 2450 'Kaikki vertailukelpoiset' on lihavoitujen luokkien arvojen summa, eli 'Ilkivalta', 'Kaikki vertailukelpoiset omaisuuden varkaudet' ja 'Kaikki vertailukelpoinen väkivalta'. Arvo "Kaikki vertailukelpoinen väkivalta" on suunnilleen haavojen ja ryöstöjen arvojen summa. [Itse asiassa tuo summa on 257, ei 256, mutta se johtuu oletettavasti pyöristysvirheistä, koska nämä arvot on pyöristetty lähimpään tuhanteen rikokseen.] Arvo 1751 arvolle "Kaikki vertailukelpoiset omaisuusvarkaudet" on pyöristysvirheen sisällä, "Varkaus", "Kaikki ajoneuvovarkaudet", "Pyörävarkaukset" ja "Varkaus henkilöltä" arvojen summa. Lopuksi "murto"- ja "kaikki ajoneuvovarkaudet" -arvot ovat kunkin otsikon alla olevien asianomaisten rivien arvojen summat.

(c) [Nämä tiedot ovat yksittäisten yksiköiden, tässä tapauksessa rikosten, lukumääriä useissa erillisissä luokissa. Grafiikkaohje 1 ehdottaa, että on olemassa kaksi sopivaa kuvaajatyyppiä – pylväskaavio tai ympyräkaavio. Molemmat on annettu tässä, vaikka vain yksi vaaditaan vastaamaan kysymykseen. Ehkä sopivampi on pylväskaavio, jossa pylväiden pituudet osoittavat rikosten lukumäärän kussakin luokassa. Pylväskaavio nimettyjen luokkien rikosten lukumäärästä on esitetty kuvassa 3.4.

Vaihtoehtoisesti olet saattanut ajatella, että tärkein asia tässä oli tapa, jolla vertailukelpoisten rikosten kokonaismäärä jaettiin näiden luokkien kesken, jolloin ympyräkaavio voisi olla sopivampi. Ympyräkaavio ei kuitenkaan näytä suoraan asiaan liittyvien rikosten kokonaismäärää, joten pylväskaavio on luultavasti parempi valinta. Tietojen ympyräkaavio on esitetty kuvassa 3.5.]

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (22)

Kuva 3.4 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1997

Näytä kuvaus|Piilota kuvaus

Kuva 3.4

Kuva 3.4 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1997

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (23)

Kuva 3.5 Ympyräkaavio BCS:n "vertailukelpoisista" rikoksista, 1997

Näytä kuvaus|Piilota kuvaus

Kuva 3.5

Kuva 3.5 Ympyräkaavio BCS:n "vertailukelpoisista" rikoksista, 1997

(d) [Tässä taulukon asiaankuuluvat numerot ovat sarakkeen ”1997 BCS” ja sarakkeen ”% muutos 1981–1997: BCS” numerot. Luokassa "Ilkivalta" oli 2 917 tuhatta rikosta (BCS) vuonna 1997, ja taulukon viimeinen sarake osoittaa, että tämä arvo on 7 % korkeampi kuin vuonna 1981. Siten vuoden 1981 "Ilkivallan" arvo voidaan laskea seuraavasti: seuraa:

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (24)

Niin

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (25)

tuhansissa, lähimpään tuhanteen. Muut luvut voidaan laskea samalla tavalla ja ne on esitetty alla, kaikki pyöristettynä lähimpään tuhanteen.]

Vandalismi[2 917/1,07 =] 2726
Murtovarkaus[1639/2.19=] 748
Kaikki ajoneuvovarkaudet[3 483/1,99 =] 1750
Polkupyörän varkaus[549/2,54 =] 216
Varkaus henkilöltä[590/1,36 =] 434
Kaikki vastaava väkivalta[1022/1.53=] 668

[Näiden tietojen pylväskaavio on esitetty kuvassa 3.6 ja ympyräkaavio kuvassa 3.7. Vain yksi näistä kaavioista tarvitaan vastaamaan kysymykseen.]

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (26)

Kuva 3.6 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1981

Näytä kuvaus|Piilota kuvaus

Kuva 3.6

Kuva 3.6 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1981

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (27)

Kuva 3.7 Ympyräkaavio BCS:n "vertailukelpoisista" rikoksista, 1981

Näytä kuvaus|Piilota kuvaus

Kuva 3.7

Kuva 3.7 Ympyräkaavio BCS:n "vertailukelpoisista" rikoksista, 1981

[Itse asiassa parempi tapa esittää nämä tiedot joko kuvan 3.6 tai 3.7 sijasta vertailua varten, joka sinua pyydetään tekemään, on piirtää sekä vuoden 1981 että 1997 luvut samaan pylväskaavioon (ohje 2). ), kuten kuvassa 3.8.]

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (28)

Kuva 3.8 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1981 ja 1997

Näytä kuvaus|Piilota kuvaus

Kuva 3.8

Kuva 3.8 Pylväskaavio BCS:n "vertailukelpoisista" rikoksista, 1981 ja 1997

[Kumman kaavion piirsitkin, seuraavien pitäisi olla kohtuullisen selkeitä.] Näiden eri luokkien rikosmallit muuttuivat huomattavasti vuosien 1981 ja 1997 välillä. Vuonna 1981 ilkivalta oli selvästi yleisin kategoria, vaikka ajoneuvovarkauksien määrä oli myös suuri. Vuoteen 1997 mennessä rikosten määrät kaikissa luokissa olivat lisääntyneet, vaikka ilkivaltarikosten määrän kasvu oli suhteellisen vähäistä. Ajoneuvovarkauksien, polkupyörävarkauksien ja murtovarkauksien määrä oli kuitenkin lisääntynyt erittäin paljon, ja ajoneuvovarkauksista oli tullut suurin luokka. Kaksi pienintä luokkaa vuonna 1981 olivat henkilövarkaudet ja polkupyörävarkaudet, ja sama tilanne säilyi vuonna 1997, vaikka polkupyörävarkauksien määrä oli kasvanut yli 150 %.

3.6 Yhteenveto osiosta 3

Tässä osiossa olet oppinut sopivista tavoista tulkita tietoja taulukoissa. Esimerkkejä käydessäsi olet huomannut, kuinka voi olla hyödyllistä laskea sopivat mittasuhteet ja suhteet sekä esittää osa tiedoista graafisessa muodossa. Ohjeet grafiikan valintaan on annettu. Kun taulukon tiedot ovat lukujen muodossa, olet huomannut, että voi olla hyödyllistä laskea tietyn rivin tai sarakkeen luvut suhteina (yleensä prosenttiosuuksina) vastaavan rivin tai sarakkeen kokonaissummasta. On kuitenkin tärkeää laskea se osuus, joka liittyy kysymykseen, johon yrität vastata.

4. Johtopäätös

Tällä kurssilla olet oppinut boxploteista ja tavoista käsitellä taulukkomuodossa annettuja tietoja.

Boxplot on tapa esittää tiettyjä yhteenvetotilastoja ja muita tietojoukon ominaisuuksia graafisessa muodossa. Se antaa nopean graafisen kuvan aineiston sijainnista, hajoamisesta ja yleisestä vinoudesta sekä kiinnittää huomion epätavallisen suuriin tai pieniin arvoihin. Verrattaessa kahta tai useampaa tietojoukkoa on usein hyödyllistä piirtää vertailevat boxplots (eli piirtää boxplots tietojoukoille samassa kaaviossa samaa mittakaavaa vastaan). Niiden avulla voidaan verrata tietojoukkoja sijainnin, hajonnan ja symmetrian tai vinouden suhteen. Joillekin tietojoukoille, jotka osoittavat huomattavaa vinoutta, tämä vertailuprosessi helpottuu toisinaan muuttamalla tiedot ensin.

Olet nähnyt, kuinka tietojen esittämistä taulukkomuodossa voidaan usein parantaa noudattamalla tiettyjä ohjeita. Taulukon rivien ja sarakkeiden merkinnän tulee olla selkeä; tarpeettomia tietoja ei pitäisi sisällyttää; voi olla hyödyllistä yksinkertaistaa taulukon numeroita (esimerkiksi vähentämällä esitettyjen merkitsevien lukujen määrää); ja yhteenvetotilastot tai laskentatulokset voidaan usein lisätä taulukkoon.

Kun joudut tulkitsemaan taulukon tietoja, on hyvin usein hyödyllistä laskea sopivat hinnat tai suhteet taulukon viestin selventämiseksi. Tietojen kuviot voivat myös selkiytyä, jos piirretään sopiva kaavio. Graafisen valinnassa on annettu ohjeita. Olet huomannut, että on tärkeää ymmärtää, miten taulukon eri numerot liittyvät toisiinsa.

Älä missaa:

1. Liity yli 200 000 opiskelijan joukkoon,opiskelee parhaillaan avoimessa yliopistossahttp://www.open.ac.uk/ valita/ tai/ avoin sisältö

2. Piditkö tästä?Lue lisää tästä aiheesta tai selaa kaikkia ilmaisia ​​OpenLearn-kurssimateriaalejammehttp://www.open.edu/ openlearn/

3. Iso-Britannian ulkopuolella?Meillä on opiskelijoita yli sadassa maassa, jotka opiskelevat verkkotutkintojahttp://www.openuniversity.edu/mukaan lukien MBA kolminkertaisesti akkreditoidussa Business Schoolissamme.

Kiitokset

Lukuun ottamatta kolmannen osapuolen materiaalia ja muuten ilmoitettua (katsokäyttöehdot), tämä sisältö on saatavilla kohdassa aCreative Commons Nimeä-Ei-kaupallinen-ShareAlike 4.0 -lisenssi

Kurssin kuva:Paul L DineenFlickrissä saatavilla allaCreative Commons Attribution 2.0 -lisenssi.

Älä missaa:

Jos tämän tekstin lukeminen on inspiroinut sinua oppimaan lisää, saatat olla kiinnostunut liittymään niiden miljoonien ihmisten joukkoon, jotka löytävät ilmaisia ​​oppimisresurssejamme ja tutkintojamme vierailemalla avoimessa yliopistossa -www.open.edu/ openlearn/ free-courses

◀︎Tietojen tulkitseminen: laatikkokaaviot ja taulukot

Copyright © 2016 Avoin yliopisto

Tietojen tulkitseminen: boxplots ja taulukot: Näytä yhtenä sivuna (2024)
Top Articles
Latest Posts
Article information

Author: Duane Harber

Last Updated:

Views: 5567

Rating: 4 / 5 (51 voted)

Reviews: 90% of readers found this page helpful

Author information

Name: Duane Harber

Birthday: 1999-10-17

Address: Apt. 404 9899 Magnolia Roads, Port Royceville, ID 78186

Phone: +186911129794335

Job: Human Hospitality Planner

Hobby: Listening to music, Orienteering, Knapping, Dance, Mountain biking, Fishing, Pottery

Introduction: My name is Duane Harber, I am a modern, clever, handsome, fair, agreeable, inexpensive, beautiful person who loves writing and wants to share my knowledge and understanding with you.