Hvordan fjerne outliers i Google Sheets
Google Ark Google Google Dokumenter Helt / / June 02, 2023
Publisert
Noen ganger kan regnearket ditt inneholde uvanlig høye eller lave verdier som forvrider resultatene dine. Finn ut hvordan du fjerner uteliggere i Google Regneark her.
Når du analyserer data, får du ett eller to resultater som kan kaste alt ut av spill. Datapunkter som er betydelig høyere eller betydelig lavere enn majoriteten av dataene dine, kan forskyve mål som gjennomsnittlig gjennomsnitt betydelig. I noen tilfeller er det bedre å fjerne disse uteliggere fra dataene dine før du starter analysen.
Hvis du har noen datapunkter som egentlig ikke passer, kan du finne ut hvordan du fjerner uteliggere i Google Regneark nedenfor.
Hva er en Outlier?
En uteligger er et datapunkt som er betydelig større eller mindre enn majoriteten av dataene i settet.
For eksempel, hvis du måler veksten til fem planter, og resultatene var 5 cm, 7 cm, 6 cm, 7 cm og 25 cm, vil det endelige resultatet være en uteligger. De fleste resultatene er rundt samme verdi, og sluttresultatet er betydelig høyere enn resten.
Det finnes metoder for å bestemme hvilke verdier som vil bli betraktet som uteliggere som er basert på rekkevidden eller spredningen av dataene dine.
Hvorfor fjerne uteliggere?
I noen tilfeller kan uteliggere i dataene dine skjeve resultatene når du analyserer dataene dine.
For eksempel, i tilfellet ovenfor, hvis vi tar gjennomsnittet av veksten til alle fem plantene, vil det være (5+7+6+7+25)/5 eller 10 cm. Fire av plantene vokste mye mindre enn dette, med bare én plante som vokste betydelig mer, så gjennomsnittlig gjennomsnitt er egentlig ikke representativt for noen av datapunktene.
Men hvis vi fjerner uteliggeren, vil gjennomsnittlig gjennomsnitt være (5+7+6+7)/4 eller 6,25. Dette er mye mer representativt for de gjenværende verdiene og gir en mer nøyaktig refleksjon av dataene.
Noen statistikker, som medianen, vil være upåvirket av uteliggere, men i mange tilfeller kan uteliggere ha en betydelig innvirkning.
Hvordan finne en uteligger
Det er flere måter å bestemme uteliggere på, basert på rekkevidden eller spredningen av data. En av de enkleste innebærer å bruke interkvartilt område.
En kvartil er ganske enkelt et datapunkt funnet ved å dele dataene dine i fire like deler. Den nedre kvartilen er tallet en fjerdedel av veien gjennom dataene dine når de er oppført i rekkefølge fra laveste til høyeste. Den øvre kvartilen er verdien tre fjerdedeler av veien gjennom dataene dine.
Interkvartilområdet er forskjellen mellom disse to verdiene. Siden det er forskjellen mellom nedre kvartil og øvre kvartil, vil nøyaktig halvparten av verdiene dine ligge innenfor dette interkvartilområdet.
Du kan bestemme den øvre grensen for uteliggere ved å multiplisere interkvartilområdet med 1,5 og legge resultatet til verdien av den øvre kvartilen. Enhver verdi over dette tallet er en uteligger. På samme måte kan du finne den nedre grensen for uteliggere ved å multiplisere interkvartilområdet med 1,5 og trekke dette fra verdien til den nedre kvartilen. Ethvert tall under denne verdien vil være en uteligger.
Slik finner du en uteligger i Google Sheets
Hvis alt det ovennevnte høres ut som litt for mye matematikk for din smak, vær aldri redd. Google Regneark gjør alt det harde arbeidet for deg. Det vil hjelpe deg å beregne øvre kvartil, nedre kvartil og interkvartilområde for dataene dine, og du kan deretter lage en formel for å bestemme om hver verdi er en uteligger eller ikke.
Slik finner du en uteligger i Google Regneark:
- Velg en celle der du vil beregne den nedre kvartilen.
- Skriv inn følgende:
=KVARTIL(
- Velg alle dataene dine.
- Skriv et komma, og deretter en 1, etterfulgt av en lukket parentes.
- trykk Tast inn og den nedre kvartilen vil beregne.
- Velg neste celle ned og skriv inn følgende:
=KVARTIL(
- Velg alle dataene dine.
- Skriv et komma, deretter en 3, etterfulgt av en lukket parentes.
- trykk Tast inn og den øvre kvartilen vil beregne.
- Velg neste rad ned og skriv = og velg deretter cellen som inneholder den øvre kvartilen.
- Skriv et minus (-) og velg cellen som inneholder den nedre kvartilen.
- trykk Tast inn og interkvartilområdet vil beregnes.
- Velg cellen ved siden av den øverste cellen i dataene dine og skriv inn følgende formel, og erstatt C3 med plasseringen til den øverste cellen med data, $C$18 med cellen som inneholder nedre kvartil (pass på at du setter et $-tegn foran bokstaven og tallet), $C$19 med cellen som inneholder den øvre kvartilen, og $C$20 med cellen som inneholder interkvartilen område:
=IF(C3$C$19+1.5*$C$20,"Outlier",""))
- Hvis det første datapunktet ditt er en uteligger, vil formelen returnere tekstutliggeren. Ellers blir det tomt.
- For å bruke formelen på de andre cellene i dataene dine, klikk og hold drahåndtaket nederst i cellen.
- Dra ned over cellene der du vil bruke formelen.
- Gi slipp, og formelen din vil bli kopiert og beregnet. Du kan nå tydelig se alle verdier som er uteliggere.
Slik fjerner du en uteligger i Google Sheets
Du vet nå hvordan du finner uteliggere, men hva med å fjerne dem?
Vi kan gjøre det ved å bruke en enkel HVIS formel som fjerner dataene fra alle celler som er oppført som uteliggere, men returnerer den opprinnelige verdien for alle som ikke er det.
Slik fjerner du uteliggere i Google Regneark:
- Følg trinnene i avsnittet ovenfor for å finne ut hvilke verdier som er uteliggere.
- Velg cellen to kolonner langs fra det øverste datapunktet.
- Skriv inn følgende formel, og bytt ut C3 med posisjonen til den øverste cellen og D3 med posisjonen til cellen til høyre:
=IF(D3="Outlier","",C3)
- trykk Tast inn. Hvis den øverste cellen er en uteligger, vil formelen returnere en blank. Ellers returnerer den verdien til toppcellen din.
- For å bruke formelen på resten av cellene dine, klikk og hold drahåndtaket nederst i cellen.
- Dra ned over cellene der du vil bruke formelen.
- Når du slipper musen, kopieres formelen og Google Sheets beregner sluttresultatet. Eventuelle verdier oppført som uteliggere vil bli fjernet.
Manipulere data i Google Sheets
Når du lærer hvordan du fjerner uteliggere i Google Regneark, sikrer du at dataene dine ikke blir forskjøvet av verdier som er vesentlig utenfor rekkevidden til de fleste dataene dine. I noen tilfeller kan dette ha stor innvirkning på statistikken du bruker til å analysere dataene dine.
Å vite hvordan du fjerner disse verdiene gir deg muligheten til å bli kvitt dem hvis du ønsker det, eller inkludere dem hvis du vil analysere hele datasettet. Du kan til og med prøve begge deler og sammenligne resultatene.
Google Sheets er flott for statistisk analyse, men det kan gjøre mye, mye mer. Du kan samarbeide med andre brukere når du oppretter et Google Sheets-dokument og til og med kommentere og reagere på arbeidet deres. Du kan sett inn Google Regneark-tabeller i Google-dokumentene dine, og du kan til og med opprette QR-koder i Google Sheets.