Mājas lapa » » Kā (un kāpēc) izmantot Outliers funkciju programmā Excel

    Kā (un kāpēc) izmantot Outliers funkciju programmā Excel

    Izcelsme ir vērtība, kas ir ievērojami augstāka vai zemāka par lielāko daļu jūsu datu vērtību. Izmantojot Excel, lai analizētu datus, izņēmumi var novest pie rezultātiem. Piemēram, vidējais datu kopas vidējais lielums varētu patiesi atspoguļot jūsu vērtības. Excel nodrošina dažas noderīgas funkcijas, lai palīdzētu pārvaldīt jūsu izņēmumus, tāpēc paskatīsimies.

    Ātrs piemērs

    Zemāk redzamajā attēlā izejas ir pietiekami viegli pamanāmas - divu piešķirto vērtību Eric un 173 vērtība, kas piešķirta Ryan. Šādā datu kopā tas ir viegli pamanāms un apstrādāts ar šiem izņēmumiem manuāli.

    Lielākā datu kopumā tas tā nebūs. Ir svarīgi identificēt novirzes un noņemt tos no statistiskiem aprēķiniem, un mēs to aplūkosim, kā rīkoties šajā rakstā.

    Kā atrast savus datus

    Lai atrastu datu kopas izejas, mēs izmantojam šādas darbības:

    1. Aprēķiniet 1. un 3. kvartilus (mēs runāsim par to, kas tie ir tikai nedaudz).
    2. Novērtējiet starpkvartila diapazonu (mēs arī nedaudz izskaidrosim tos tālāk).
    3. Atgrieziet mūsu datu diapazona augšējās un apakšējās robežas.
    4. Izmantojiet šīs robežas, lai identificētu attālākos datu punktus.

    Šo vērtību saglabāšanai izmantos šūnu diapazonu zemāk redzamajā attēlā redzamajā datu kopā.

    Sāksim.

    Pirmais solis: Aprēķiniet kvartilus

    Ja sadalāt savus datus ceturtdaļās, katrs no šiem kopumiem tiek saukts par kvartilu. Zemākais 25% skaitļu diapazons veido 1. kvartilu, nākamie 25% ir 2. kvartils, un tā tālāk. Vispirms mēs izmantojam šo soli, jo visbiežāk izmantotā izejas definīcija ir datu punkts, kas ir vairāk nekā 1,5 starpkvartila diapazoni (IQR) zem 1. kvartila, un 1,5 interkvartili diapazoni virs 3. kvartila. Lai noteiktu šīs vērtības, mums vispirms ir jānoskaidro, kādi kvartili ir.

    Excel nodrošina QUARTILE funkciju, lai aprēķinātu kvartilus. Tam ir nepieciešamas divas informācijas daļas: masīvs un kvarts.

    = QUARTILE (masīvs, kvarts)

    The masīvs ir vērtīgo vērtību diapazons. Un quart ir numurs, kas pārstāv kvartilu, kuru vēlaties atgriezt (piemēram, 1 par 1st kvartils, 2 - 2. kvartilis utt.).

    Piezīme: Programmā Excel 2010 Microsoft izlaida QUARTILE.INC un QUARTILE.EXC funkcijas kā uzlabojumi QUARTILE funkcijai. QUARTILE ir savietojama ar vairākām Excel versijām.

    Atgriezīsimies pie mūsu piemēru tabulas.

    Lai aprēķinātu 1st Kvartils mēs varam izmantot šādu formulu šūnā F2.

    = QUARTILE (B2: B14,1)

    Ievadot formulu, Excel piedāvā sarakstu ar quart argumentu iespējām.

    Lai aprēķinātu 3rd kvartils, mēs varam ievadīt formulu, piemēram, iepriekšējo, F3 šūnā, bet izmantojot vienu, nevis vienu.

    = QUARTILE (B2: B14,3)

    Tagad šūnās ir redzami kvartila datu punkti.

    Otrais solis: Novērtējiet starpkvartila diapazonu

    Intervartila diapazons (vai IQR) ir vidējais 50% no jūsu datu vērtībām. To aprēķina kā starpību starp 1. kvartila vērtību un 3. kvartila vērtību.

    Mēs izmantojam vienkāršu formulu šūnā F4, kas atņem 1st kvartilis no 3rd kvartils:

    = F3-F2

    Tagad mēs varam redzēt mūsu interquartile diapazonu.

    Trešais solis: atgriežiet apakšējās un augšējās robežas

    Apakšējās un augšējās robežas ir mazākās un lielākās datu diapazona vērtības, kuras mēs vēlamies izmantot. Jebkuras vērtības, kas ir mazākas vai lielākas par šīm saistītajām vērtībām, ir izejas.

    Mēs aprēķināsim apakšējo robežu F5 šūnā, reizinot IQR vērtību ar 1,5 un tad atņemot to no Q1 datu punkta:

    = F2- (1,5 * F4)

    Piezīme: Šīs formulas kronšteini nav nepieciešami, jo reizināšanas daļa aprēķinās pirms atņemšanas daļas, taču tie padara šo formulu vieglāk lasāmu.

    Lai aprēķinātu augšējo robežu šūnā F6, IQR reizināsim ar 1,5, bet šoreiz pievienot uz Q3 datu punktu:

    = F3 + (1,5 * F4)

    Ceturtais solis: identificējiet izejas

    Tagad, kad mēs esam ieguvuši visus mūsu pamatā esošos datus, ir pienācis laiks noteikt mūsu attālākos datu punktus - tos, kas ir zemāki par zemāko robežvērtību vai augstāku par augšējo ierobežoto vērtību.

    Mēs izmantosim OR funkciju, lai veiktu šo loģisko pārbaudi un parādītu vērtības, kas atbilst šiem kritērijiem, ievadot šādu formulu šūnā C2:

    = OR (B2 $ F $ 6)

    Pēc tam šo vērtību kopēsim C3-C14 šūnās. TRUE vērtība norāda novirzi, un, kā redzat, mūsu datiem ir divi.

    Neaizmirstot Outliers, aprēķinot vidējo vidējo

    Izmantojot QUARTILE funkciju, ļaujiet mums aprēķināt IQR un strādāt ar visplašāk izmantoto izejas definīciju. Tomēr, aprēķinot vidējo vērtību vērtību diapazonam un ignorējot novirzes, ir ātrāka un vieglāka funkcija. Šī metode netiks identificēta kā iepriekš, bet tas ļaus mums būt elastīgiem ar to, ko mēs varētu uzskatīt par mūsu izejošo daļu.

    Funkcija, kas mums nepieciešama, tiek saukta par TRIMMEAN, un to var redzēt zemāk:

    = TRIMMEAN (masīvs, procenti)

    The masīvs ir vidējo vērtību diapazons. The procentiem ir datu punktu procentuālā daļa, kas jāizslēdz no datu kopas augšējās un apakšējās daļas (to var ievadīt procentos vai decimāldaļās).

    Mēs, piemēram, ievadījām zemāk esošo formulu šūnā D3, lai aprēķinātu vidējo un izslēgtu 20% no izņēmumiem.

    = TRIMMEAN (B2: B14, 20%)


    Tur jums ir divas atšķirīgas funkcijas izņēmumu apstrādei. Neatkarīgi no tā, vai vēlaties tās identificēt dažām ziņošanas vajadzībām vai izslēgt tās no aprēķiniem, piemēram, vidējiem rādītājiem, programmā Excel ir funkcija, kas atbilst jūsu vajadzībām.