ఎక్సెల్ లో అవుట్లర్స్ ఫంక్షన్ ఎలా ఉపయోగించాలి (మరియు ఎందుకు)

అవుట్‌లియర్ అనేది మీ డేటాలోని చాలా విలువల కంటే గణనీయంగా ఎక్కువ లేదా తక్కువగా ఉండే విలువ. డేటాను విశ్లేషించడానికి ఎక్సెల్ ఉపయోగిస్తున్నప్పుడు, అవుట్‌లెర్స్ ఫలితాలను వక్రీకరించవచ్చు. ఉదాహరణకు, డేటా సమితి యొక్క సగటు సగటు మీ విలువలను నిజంగా ప్రతిబింబిస్తుంది. మీ అవుట్‌లర్‌లను నిర్వహించడానికి ఎక్సెల్ కొన్ని ఉపయోగకరమైన విధులను అందిస్తుంది, కాబట్టి చూద్దాం.

త్వరిత ఉదాహరణ

దిగువ చిత్రంలో, li ట్‌లెయిర్‌లను గుర్తించడం చాలా సులభం-ఎరిక్‌కు కేటాయించిన రెండు విలువ మరియు ర్యాన్‌కు కేటాయించిన 173 విలువ. ఈ విధమైన డేటా సెట్‌లో, ఆ అవుట్‌లైయర్‌లను మానవీయంగా గుర్తించడం మరియు పరిష్కరించడం చాలా సులభం.

డేటా యొక్క పెద్ద సమూహంలో, అది అలా ఉండదు. అవుట్‌లైయర్‌లను గుర్తించడం మరియు గణాంక లెక్కల నుండి వారిని తొలగించడం చాలా ముఖ్యం - మరియు ఈ వ్యాసంలో ఎలా చేయాలో మేము చూస్తున్నాము.

మీ డేటాలో అవుట్‌లియర్‌లను ఎలా కనుగొనాలి

డేటా సమితిలో అవుట్‌లర్‌లను కనుగొనడానికి, మేము ఈ క్రింది దశలను ఉపయోగిస్తాము:

  1. 1 వ మరియు 3 వ త్రైమాసికాలను లెక్కించండి (మేము వాటి గురించి కొంచెం మాట్లాడుతాము).
  2. ఇంటర్‌క్వార్టైల్ పరిధిని అంచనా వేయండి (మేము వీటిని కొంచెం క్రిందికి వివరిస్తాము).
  3. మా డేటా పరిధి యొక్క ఎగువ మరియు దిగువ హద్దులను తిరిగి ఇవ్వండి.
  4. బయటి డేటా పాయింట్లను గుర్తించడానికి ఈ హద్దులను ఉపయోగించండి.

ఈ విలువలను నిల్వ చేయడానికి దిగువ చిత్రంలో కనిపించే డేటా సెట్ యొక్క కుడి వైపున ఉన్న సెల్ పరిధి ఉపయోగించబడుతుంది.

ప్రారంభిద్దాం.

మొదటి దశ: క్వార్టైల్స్‌ను లెక్కించండి

మీరు మీ డేటాను క్వార్టర్స్‌గా విభజిస్తే, ఆ ప్రతి సెట్‌ను క్వార్టైల్ అంటారు. పరిధిలోని అతి తక్కువ 25% సంఖ్యలు 1 వ క్వార్టైల్, తరువాతి 25% 2 వ క్వార్టైల్ మరియు మొదలైనవి. మేము మొదట ఈ దశను తీసుకుంటాము ఎందుకంటే lier ట్‌లియర్ యొక్క విస్తృతంగా ఉపయోగించబడే నిర్వచనం 1 వ క్వార్టైల్ కంటే 1.5 కంటే ఎక్కువ ఇంటర్‌క్వార్టైల్ పరిధులు (ఐక్యూఆర్) మరియు 3 వ క్వార్టైల్ పైన 1.5 ఇంటర్‌క్వార్టైల్ పరిధులు. ఆ విలువలను నిర్ణయించడానికి, క్వార్టిల్స్ ఏమిటో మనం మొదట గుర్తించాలి.

క్వార్టైల్స్‌ను లెక్కించడానికి ఎక్సెల్ QUARTILE ఫంక్షన్‌ను అందిస్తుంది. దీనికి రెండు సమాచారం అవసరం: శ్రేణి మరియు క్వార్ట్.

= QUARTILE (శ్రేణి, క్వార్ట్ట్)

ది అమరిక మీరు మదింపు చేస్తున్న విలువల శ్రేణి. ఇంకా క్వార్ట్ట్ మీరు తిరిగి రావాలనుకునే క్వార్టైల్‌ను సూచించే సంఖ్య (ఉదా., 1 వ క్వార్టైల్‌కు 1, 2 వ క్వార్టైల్‌కు 2 మరియు మొదలైనవి).

గమనిక: ఎక్సెల్ 2010 లో, మైక్రోసాఫ్ట్ QUARTILE.INC మరియు QUARTILE.EXC ఫంక్షన్లను QUARTILE ఫంక్షన్‌కు మెరుగుదలలుగా విడుదల చేసింది. ఎక్సెల్ యొక్క బహుళ వెర్షన్లలో పనిచేసేటప్పుడు QUARTILE మరింత వెనుకబడిన అనుకూలంగా ఉంటుంది.

మన ఉదాహరణ పట్టికకు తిరిగి వద్దాం.

1 వ క్వార్టైల్ లెక్కించడానికి మేము సెల్ F2 లో ఈ క్రింది సూత్రాన్ని ఉపయోగించవచ్చు.

= QUARTILE (B2: B14,1)

మీరు ఫార్ములా ఎంటర్ చేసినప్పుడు, ఎక్సెల్ క్వార్ట్ ఆర్గ్యుమెంట్ కోసం ఎంపికల జాబితాను అందిస్తుంది.

3 వ క్వార్టైల్ను లెక్కించడానికి, సెల్ F3 లో మునుపటి మాదిరిగానే ఒక ఫార్ములాను నమోదు చేయవచ్చు, కాని ఒకదానికి బదులుగా మూడింటిని ఉపయోగిస్తాము.

= QUARTILE (B2: B14,3)

ఇప్పుడు, కణాలలో ప్రదర్శించబడిన క్వార్టైల్ డేటా పాయింట్లను మేము పొందాము.

దశ రెండు: ఇంటర్‌క్వార్టైల్ పరిధిని అంచనా వేయండి

ఇంటర్‌క్వార్టైల్ పరిధి (లేదా IQR) మీ డేటాలోని 50% విలువలు. ఇది 1 వ క్వార్టైల్ విలువ మరియు 3 వ క్వార్టైల్ విలువ మధ్య వ్యత్యాసంగా లెక్కించబడుతుంది.

మేము 3 వ క్వార్టైల్ నుండి 1 వ క్వార్టైల్ ను తీసివేసే సెల్ F4 లోకి ఒక సాధారణ సూత్రాన్ని ఉపయోగించబోతున్నాము:

= F3-F2

ఇప్పుడు, మన ఇంటర్‌క్వార్టైల్ పరిధి ప్రదర్శించబడుతుంది.

మూడవ దశ: దిగువ మరియు ఎగువ హద్దులను తిరిగి ఇవ్వండి

దిగువ మరియు ఎగువ హద్దులు మనం ఉపయోగించాలనుకునే డేటా పరిధి యొక్క అతిచిన్న మరియు అతిపెద్ద విలువలు. ఈ బౌండ్ విలువల కంటే చిన్న లేదా పెద్ద విలువలు ఏవైనా అవుట్‌లెర్స్.

IQR విలువను 1.5 గుణించి, Q1 డేటా పాయింట్ నుండి తీసివేయడం ద్వారా సెల్ F5 లో తక్కువ పరిమితిని మేము లెక్కిస్తాము:

= F2- (1.5 * F4)

గమనిక: ఈ సూత్రంలోని బ్రాకెట్‌లు అవసరం లేదు, ఎందుకంటే వ్యవకలన భాగానికి ముందు గుణకారం భాగం లెక్కిస్తుంది, కానీ అవి సూత్రాన్ని చదవడానికి సులభతరం చేస్తాయి.

సెల్ F6 లో ఎగువ సరిహద్దును లెక్కించడానికి, మేము మళ్ళీ IQR ను 1.5 గుణించాలి, కాని ఈసారి జోడించు ఇది Q3 డేటా పాయింట్‌కు:

= F3 + (1.5 * F4)

నాలుగవ దశ: అవుట్‌లియర్‌లను గుర్తించండి

ఇప్పుడు మన అంతర్లీన డేటా మొత్తాన్ని సెటప్ చేసాము, మన బయటి డేటా పాయింట్లను గుర్తించాల్సిన సమయం ఆసన్నమైంది-అవి తక్కువ బౌండ్ విలువ కంటే తక్కువ లేదా ఎగువ బౌండ్ విలువ కంటే ఎక్కువ.

ఈ తార్కిక పరీక్షను నిర్వహించడానికి మేము OR ఫంక్షన్‌ను ఉపయోగిస్తాము మరియు కింది సూత్రాన్ని సెల్ C2 లోకి నమోదు చేయడం ద్వారా ఈ ప్రమాణాలకు అనుగుణంగా ఉన్న విలువలను చూపుతాము:

= OR (B2 $ F $ 6)

మేము ఆ విలువను మా C3-C14 కణాలలోకి కాపీ చేస్తాము. నిజమైన విలువ lier ట్‌లియర్‌ను సూచిస్తుంది మరియు మీరు చూడగలిగినట్లుగా, మా డేటాలో మాకు రెండు ఉన్నాయి.

సగటు సగటును లెక్కించేటప్పుడు అవుట్‌లియర్‌లను విస్మరించడం

QUARTILE ఫంక్షన్‌ను ఉపయోగించి మనం IQR ను లెక్కించి, అవుట్‌లియర్ యొక్క విస్తృతంగా ఉపయోగించే నిర్వచనంతో పని చేద్దాం. ఏదేమైనా, విలువల శ్రేణికి సగటు సగటును లెక్కించేటప్పుడు మరియు అవుట్‌లర్‌లను విస్మరించేటప్పుడు, ఉపయోగించడానికి వేగంగా మరియు సులభంగా పని ఉంటుంది. ఈ సాంకేతికత మునుపటిలాగా lier ట్‌లియర్‌ను గుర్తించదు, కాని ఇది మన అవుట్‌లియర్ భాగాన్ని పరిగణించే దానితో సరళంగా ఉండటానికి అనుమతిస్తుంది.

మాకు అవసరమైన ఫంక్షన్‌ను TRIMMEAN అంటారు మరియు మీరు దాని కోసం వాక్యనిర్మాణాన్ని క్రింద చూడవచ్చు:

= TRIMMEAN (శ్రేణి, శాతం)

ది అమరిక మీరు సగటున కోరుకునే విలువల శ్రేణి. ది శాతం డేటా సెట్ యొక్క ఎగువ మరియు దిగువ నుండి మినహాయించాల్సిన డేటా పాయింట్ల శాతం (మీరు దీన్ని ఒక శాతం లేదా దశాంశ విలువగా నమోదు చేయవచ్చు).

సగటును లెక్కించడానికి మరియు 20% అవుట్‌లియర్‌లను మినహాయించడానికి మా ఉదాహరణలో సెల్ D3 లోకి క్రింది సూత్రాన్ని నమోదు చేసాము.

= TRIMMEAN (బి 2: బి 14, 20%)

అవుట్‌లియర్‌లను నిర్వహించడానికి మీకు రెండు వేర్వేరు విధులు ఉన్నాయి. మీరు కొన్ని రిపోర్టింగ్ అవసరాలకు వాటిని గుర్తించాలనుకుంటున్నారా లేదా సగటు వంటి లెక్కల నుండి మినహాయించాలనుకుంటున్నారా, ఎక్సెల్ మీ అవసరాలకు తగినట్లుగా ఒక ఫంక్షన్‌ను కలిగి ఉంది.


$config[zx-auto] not found$config[zx-overlay] not found