Näringsliv, myndigheter och akademiska aktiviteter kräver nästan alltid insamling och analys av data. Ett sätt att representera numeriska data är genom grafer, histogram och diagram. Dessa visualiseringstekniker gör det möjligt för människor att få bättre inblick i problem och utforma lösningar. Klyftor, klyftor och outliers är egenskaper för dataset som påverkar matematisk analys och är lätt synliga på visuella representationer.
Hål i data
Klyftor hänvisar till saknade områden i en dataset. Till exempel, om ett vetenskapligt experiment samlar temperaturdata i intervallet 50 grader Fahrenheit till 100 grader Fahrenheit, men ingenting mellan 70 och 80 grader, skulle det representera ett gap i datamängden. En linjekarta för denna dataset skulle ha "x" -märken för temperaturer mellan 50 och 70 och återigen mellan 80 och 100, men det skulle inte finnas något mellan 70 och 80. Forskare kan gräva djupare och utforska varför vissa datapunkter inte dyker upp i ett samlat prov.
Isolerade grupper
Kluster är isolerade grupper av datapunkter. Linjediagram, som är ett av sätten att representera dataset, är rader med "x" -markeringar placerade ovanför specifika tal för att visa deras frekvens av förekomst i datasatsen. Ett kluster är avbildat som en samling av dessa "x" -markeringar i ett litet intervall eller datasubset. Till exempel, om examensresultatet för en klass på 10 elever är 74, 75, 80, 72, 74, 75, 76, 86, 88 och 73, skulle de flesta "x" -markeringarna på en linjekarta vara i 72- till-76 poängintervall. Detta skulle representera ett datakluster. Observera frekvensen för 74 och 75 är två, men för alla andra poäng är det en.
På Extremes
Outliers är extrema värden - datapunkter som ligger betydligt utanför andra värden i en dataset. En outlier måste vara betydligt mindre än eller större än majoriteten av siffrorna i en dataset. Definitionen av "extrema" beror på omständigheterna och samförstånd mellan analytikerna som deltar i forskningen. Outliers kan vara dåliga datapunkter, även kända som buller, eller de kan innehålla värdefull information om fenomenet som undersöks och själva datainsamlingsmetoden. Till exempel, om klassresultat är mestadels i 70-till-80-serien, men ett par poäng är i de låga 50-talen, kan de representera utjämnare.
Sätta allt ihop
Gaps , outliers och kluster i dataset kan påverka resultaten av matematisk analys. Hål och klyftor kan innebära fel i datainsamlingsmetoden. Om exempelvis en telefonundersökning endast avkodar vissa områdenkoder, såsom låginkomsthuskomplex eller avancerade bostadsområden, och inte ett brett tvärsnitt av befolkningen, är det sannolikt att det kommer att finnas luckor och kluster i data . Outliers kan skryta medelvärdet eller medelvärdet för en dataset. Till exempel är medelvärdet eller medelvärdet för en datasats bestående av fyra siffror - 50, 55, 65 och 90 - 65. Utan outlier 90 är medelvärdet ca 57.