Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (2024)

Tämä kaavioilmestyi Twitter-syötteeseeni muutama viikko sitten. Minulla ei ole aavistustakaan, miksi kutsuisin sitä - laatikko-ja-viikset-ja-hajakaavio -kaavioksi? En myöskään ole varma, onko se parempi kuin viulukaavio, joka näyttää koko jakelun, mutta se on varmasti kiehtova.

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (1)

Jakaumien ja epävarmuuden visualisointi on mielestäni suuri datan visualisoinnin haaste. Se voi johtua siitä, että monet ihmiset eivät yksinkertaisesti ymmärrä tilastoja ja jakaumia, eivätkä he ymmärrä epävarmuuden matemaattista käsitettä ja sitä, kuinka se voidaan sisällyttää tietoihin ja matemaattisiin tai tilastollisiin malleihin. Ehkä suuri ongelma jakaumien ja epävarmuuden visualisoinnissa on siksi, että ne vaativat merkittävämpiä merkintöjä, jotka auttavat selittämään kaavion lukemisen lisäksi myös sen, mitä kuvaaja on piirretty.

Joka tapauksessa poikkean. Halusin tehdä tämän kaavion Excelissä. Minulla ei ole vielä ollut hyvää tekosyytä kokeilla uutta laatikko- ja viiksikaaviotyyppiä Excel 2016:ssa, joten ajattelin, että tämä oli tilaisuuteni. Kävi kuitenkin ilmi, että et voi yhdistää sitä muiden kaaviotyyppien kanssa, joten minun piti käyttää erilaista lähestymistapaa, joka yhdistää kolme eri elementtiä:

  1. Pinottu sarakekaavio laatikolle;
  2. Hajakuva viiksille; ja
  3. Tietopisteiden sirontakaavio.

Kuten tavallista, yritän määrittää Excel-tiedostoni niin, että se voidaan myöhemmin helpommin replikoida muiden tietojen kanssa. Alkuperäisen kaavion rakentaminen kestää hieman kauemmin, mutta se maksaa itsensä takaisin ajansäästöllä myöhemmin.

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (2)

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (3)

1. Pinottu sarakekaavio

Aion laskea viisi prosenttipistettä tiedoista suoraan Excelissä. Tämä toimii täällä, koska minulla on vain 50 havaintoa; jos minulla olisi suurempi tietojoukko, tekisin nämä laskelmat Statassa tai R:ssä ja tuoisin ne. Prosenttipisteet lasketaan kuvakaappauksissa oranssin otsikkorivin alapuolella PROSENTILI-kaavalla. Esimerkiksi solussa I3 minulla on:

=PROSENTTIILI($A$2:$A$51,H3)

Tämä etsii tietosarakkeesta (A2:A51) ja etsii solussa H3 määritetyn prosenttipisteen.

Alla olevassa keltaisessa osiossa vedän esiin prosenttipisteet ja luon laatikon luomiseen tarvittavat erot. Tämän kaavion laatikon alaosassa näkyy 25thprosenttipiste; keskellä on mediaani tai 50thprosenttipiste; ja yläosassa näkyy 75thprosenttipiste.

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (4)

Näin ollen pinotun sarakekaavion ala-/perussegmentti on yksinkertaisesti 25thprosenttipiste. Piirrän sen ja asetan sitten täyttövärinEi väriä. Toinen pino on ero 50:n välilläthja 25thprosenttipisteet, ja kolmas / ylin pino on ero 75:n välilläthja 50thprosenttipisteet. Selvyyden vuoksi laatikon keskellä on 50thprosenttipiste, lisään ääriviivat molempien segmenttien ympärille.

2. Viiksien sirontakaavio

Lisätäkseni viikset laatikoiden oikeaan reunaan lisään sirontapisteen ja lisään sitten pystysuoran virhepalkin osoittamaan 10thja 90thprosenttipisteet. Sirontakaaviot vaativatx-jay-arvot, ja ne näkyvät laskentataulukon vihreässä osassa.

They-arvotovat yksinkertaisia ​​- ne ovat yhtä suuria kuin 50thprosenttipiste ja siten yhtälö osoittaa alkuperäiseen oranssissa osassa yllä. Vartenx-arvot, minun on löydettävä jokaisen laatikon oikea reuna, ja vaikka olen varma, että sen löytämiseen on jokin sääntö, kokeilin ja se osoittautui 1,15, 2,15 ja 3,15.

Kun sironneet piirrettiin, lisäsin sitten virhepalkit, joiden tiedot näkyvät sinisellä alueella. Koska viikset ulottuvat jopa 90:eenthprosenttipiste ja alas 10:eenthprosenttipiste, viivojen pituus on yhtä suuri kuin mediaanin ja näiden prosenttipisteiden väliset erot.

3. Datapisteiden sirontakaavio

Viimeinen piirrettävä elementti ovat dataa edustavat pisteet. Tiedot näkyvät laskentataulukon harmaalla alueella, ja alkuperäiset tiedot ovat sarakkeissa isoilla kirjaimilla. Todelliset tiedot koodataany-akselikaaviosta, ja ne on määritettävä eri tavallax-akseliarvot, jotta ne eivät istu toistensa päällä. Pohjimmiltaan tavoitteena on luoda datapisteistä eräänlainen yksikköhistogrammi ja erottaa ne riittävästi, jotta ne näkyvät.

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (5)

Asetan tiedot eri laskentataulukkoon ja aloitan lajittelemalla kukin erikseen (sarakkeet A, F ja L). (Jos minulla olisi enemmän tietoja, tekisin tämän todennäköisesti koodausympäristössä enkä Excelissä). Seuraavassa sarakkeessa tunnistan kunkin tietoryhmän ensimmäisen esiintymisen. Toisin sanoen haluan tunnistaa 4.3:n ensimmäisen esiintymisen, 4.4:n, 4.5:n, 4.6:n ja niin edelleen ensimmäisen esiintymisen. Käytän tätä varten yksinkertaista COUNTIF-kaavaa ja kerron sitten ehdollisen muotoilun päälle korostaakseni ykköset.

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (6)

COUNTIF laskee sarakkeen A solun esiintymisten määrän tarkastelemalla arvoja sarakkeen yläosasta tiettyyn kiinnostavaan soluun. Esimerkiksi solun B3 kaava on =LASKEJOS($A$2:A3,A3), joka laskee, kuinka monta kertaa "4.4" näkyy vain näissä kahdessa solussa. Tarkasteltaessa alemmas, kaava solussa B13 – luvun 4,8 ensimmäinen esiintyminen – on =LASKEJOS($A$2:A13,A13). (Ja kyllä, lisäämällä absoluuttiset viittaukset – dollarimerkit – tähän ensimmäiseen argumenttiin, voin yksinkertaisesti vetää kaavan alas sarakkeessa.)

Seuraava sarake (C) käyttää samanlaista COUNTIF-kaavaa, mutta tässä on järjestettävä sarakkeen B ykkösten lukumäärä. Tällä tavalla tilaan käytännössä kunkin ryhmän ensimmäisen havainnon, jotta voin lopulta piirtää ne yhteen. x-akselilla. Näet kuvion yllä olevassa kuvakaappauksessa laskemalla 1 [4.3], 2 [4.4], 3 [4.5], 4 [4.6] ja niin edelleen.

Tilaussarjan kanssa minun on määritettäväx-akseliarvot jokaiselle pisteelle. Aloitan asettamalla ensin joitain kiinteitä viittauksia. Solussa E1 asetin arvon 1,195, joka on sijainti x-akselilla, joka on juuri viiksen oikealla puolella. Valitsin tämän arvon, koska se näytti olevan hyvä etäisyys linjasta, mutta olisin voinut valita jotain muuta. Solun E2 arvo 0,03 on kunkin pisteen välinen vaakaetäisyys. Muut arvot voisivat toimia, ja leikittelin joidenkin niistä, mutta tämä toimi tässä kaaviossa.

Vedämme sen nyt yhteen ja määritämme hajontakaavion x-aseman sarakkeessa D. Käytän tässä pientä IF-kaavaa sijoittamaan pisteet järjestykseen tai pinoamaan ne. Solun D2 kaava on:

=JOS(B2=1,$E$1,D1+$E$2)

Joten, jos datan arvo onensimmäinenryhmässä annan sille arvon 1,195 - piste, joka on lähinnä viiksiä. Kaikki datapisteet, jotka ovat ensimmäisinä kussakin ryhmässä, saavat saman arvon ja ovat siten pystysuorassa kaaviossa.

Jokaisen ryhmän kaikille myöhemmille pisteille lisään 0,03 edelliseen arvoon. Katso esimerkiksi solua D10, 4thja viimeinen piste arvoryhmässä, joka on yhtä suuri kuin 4,6. Tämän pisteen x-arvo on 1,195 + 0,03 + 0,03 + 0,03 = 1,285.

Tämä koko tietosarja vedetään takaisin päälaskentataulukkoon ja sijoitetaan alkuperäisten tietopisteiden viereen. Voin nyt piirtää tämän sirontakaaviona ja kaikki on valmista. Väritän ja lisään ääriviivat laatikkoon sopivaksi.

Päätelmät

En ole varma, onko tämä parempi lähestymistapa kuin viulujuoni, mutta ytimen tiheysarvioiden laskeminen Excelissä on asia, johon en vielä puutu. Tällä graafisella lähestymistavalla – jossa laatikko ja viikset yhdistetään todellisten tietojen kuvaajaan – on hieno vetovoima, sillä saat sekä koko jakauman että yhteenvedon prosenttipisteet.

En tiedä, kuinka hyvin se toimisi suuremmalla datalla, mutta luulen, että se voi toimia tällaisen pienen asian kanssa. Yleisöstä riippuen se saattaa vaatia enemmän huomautuksia, jotta voidaan selittää, mitä kukin elementti edustaa ja miten se luetaan.

Mitä mieltä sinä olet? Hyvä kaaviotyyppi? Kannattaako kokeilla muualla?

Laatikko- ja viiksi- ja sirontakaavio - PolicyViz (2024)
Top Articles
Latest Posts
Article information

Author: Nathanael Baumbach

Last Updated:

Views: 5575

Rating: 4.4 / 5 (55 voted)

Reviews: 94% of readers found this page helpful

Author information

Name: Nathanael Baumbach

Birthday: 1998-12-02

Address: Apt. 829 751 Glover View, West Orlando, IN 22436

Phone: +901025288581

Job: Internal IT Coordinator

Hobby: Gunsmithing, Motor sports, Flying, Skiing, Hooping, Lego building, Ice skating

Introduction: My name is Nathanael Baumbach, I am a fantastic, nice, victorious, brave, healthy, cute, glorious person who loves writing and wants to share my knowledge and understanding with you.