ఎక్సెల్ లో అవుట్లర్స్ ఫంక్షన్ ఎలా ఉపయోగించాలి (మరియు ఎందుకు)
అవుట్లియర్ అనేది మీ డేటాలోని చాలా విలువల కంటే గణనీయంగా ఎక్కువ లేదా తక్కువగా ఉండే విలువ. డేటాను విశ్లేషించడానికి ఎక్సెల్ ఉపయోగిస్తున్నప్పుడు, అవుట్లెర్స్ ఫలితాలను వక్రీకరించవచ్చు. ఉదాహరణకు, డేటా సమితి యొక్క సగటు సగటు మీ విలువలను నిజంగా ప్రతిబింబిస్తుంది. మీ అవుట్లర్లను నిర్వహించడానికి ఎక్సెల్ కొన్ని ఉపయోగకరమైన విధులను అందిస్తుంది, కాబట్టి చూద్దాం.
త్వరిత ఉదాహరణ
దిగువ చిత్రంలో, li ట్లెయిర్లను గుర్తించడం చాలా సులభం-ఎరిక్కు కేటాయించిన రెండు విలువ మరియు ర్యాన్కు కేటాయించిన 173 విలువ. ఈ విధమైన డేటా సెట్లో, ఆ అవుట్లైయర్లను మానవీయంగా గుర్తించడం మరియు పరిష్కరించడం చాలా సులభం.
డేటా యొక్క పెద్ద సమూహంలో, అది అలా ఉండదు. అవుట్లైయర్లను గుర్తించడం మరియు గణాంక లెక్కల నుండి వారిని తొలగించడం చాలా ముఖ్యం - మరియు ఈ వ్యాసంలో ఎలా చేయాలో మేము చూస్తున్నాము.
మీ డేటాలో అవుట్లియర్లను ఎలా కనుగొనాలి
డేటా సమితిలో అవుట్లర్లను కనుగొనడానికి, మేము ఈ క్రింది దశలను ఉపయోగిస్తాము:
- 1 వ మరియు 3 వ త్రైమాసికాలను లెక్కించండి (మేము వాటి గురించి కొంచెం మాట్లాడుతాము).
- ఇంటర్క్వార్టైల్ పరిధిని అంచనా వేయండి (మేము వీటిని కొంచెం క్రిందికి వివరిస్తాము).
- మా డేటా పరిధి యొక్క ఎగువ మరియు దిగువ హద్దులను తిరిగి ఇవ్వండి.
- బయటి డేటా పాయింట్లను గుర్తించడానికి ఈ హద్దులను ఉపయోగించండి.
ఈ విలువలను నిల్వ చేయడానికి దిగువ చిత్రంలో కనిపించే డేటా సెట్ యొక్క కుడి వైపున ఉన్న సెల్ పరిధి ఉపయోగించబడుతుంది.
ప్రారంభిద్దాం.
మొదటి దశ: క్వార్టైల్స్ను లెక్కించండి
మీరు మీ డేటాను క్వార్టర్స్గా విభజిస్తే, ఆ ప్రతి సెట్ను క్వార్టైల్ అంటారు. పరిధిలోని అతి తక్కువ 25% సంఖ్యలు 1 వ క్వార్టైల్, తరువాతి 25% 2 వ క్వార్టైల్ మరియు మొదలైనవి. మేము మొదట ఈ దశను తీసుకుంటాము ఎందుకంటే lier ట్లియర్ యొక్క విస్తృతంగా ఉపయోగించబడే నిర్వచనం 1 వ క్వార్టైల్ కంటే 1.5 కంటే ఎక్కువ ఇంటర్క్వార్టైల్ పరిధులు (ఐక్యూఆర్) మరియు 3 వ క్వార్టైల్ పైన 1.5 ఇంటర్క్వార్టైల్ పరిధులు. ఆ విలువలను నిర్ణయించడానికి, క్వార్టిల్స్ ఏమిటో మనం మొదట గుర్తించాలి.
క్వార్టైల్స్ను లెక్కించడానికి ఎక్సెల్ QUARTILE ఫంక్షన్ను అందిస్తుంది. దీనికి రెండు సమాచారం అవసరం: శ్రేణి మరియు క్వార్ట్.
= QUARTILE (శ్రేణి, క్వార్ట్ట్)
ది అమరిక మీరు మదింపు చేస్తున్న విలువల శ్రేణి. ఇంకా క్వార్ట్ట్ మీరు తిరిగి రావాలనుకునే క్వార్టైల్ను సూచించే సంఖ్య (ఉదా., 1 వ క్వార్టైల్కు 1, 2 వ క్వార్టైల్కు 2 మరియు మొదలైనవి).
గమనిక: ఎక్సెల్ 2010 లో, మైక్రోసాఫ్ట్ QUARTILE.INC మరియు QUARTILE.EXC ఫంక్షన్లను QUARTILE ఫంక్షన్కు మెరుగుదలలుగా విడుదల చేసింది. ఎక్సెల్ యొక్క బహుళ వెర్షన్లలో పనిచేసేటప్పుడు QUARTILE మరింత వెనుకబడిన అనుకూలంగా ఉంటుంది.
మన ఉదాహరణ పట్టికకు తిరిగి వద్దాం.
1 వ క్వార్టైల్ లెక్కించడానికి మేము సెల్ F2 లో ఈ క్రింది సూత్రాన్ని ఉపయోగించవచ్చు.
= QUARTILE (B2: B14,1)
మీరు ఫార్ములా ఎంటర్ చేసినప్పుడు, ఎక్సెల్ క్వార్ట్ ఆర్గ్యుమెంట్ కోసం ఎంపికల జాబితాను అందిస్తుంది.
3 వ క్వార్టైల్ను లెక్కించడానికి, సెల్ F3 లో మునుపటి మాదిరిగానే ఒక ఫార్ములాను నమోదు చేయవచ్చు, కాని ఒకదానికి బదులుగా మూడింటిని ఉపయోగిస్తాము.
= QUARTILE (B2: B14,3)
ఇప్పుడు, కణాలలో ప్రదర్శించబడిన క్వార్టైల్ డేటా పాయింట్లను మేము పొందాము.
దశ రెండు: ఇంటర్క్వార్టైల్ పరిధిని అంచనా వేయండి
ఇంటర్క్వార్టైల్ పరిధి (లేదా IQR) మీ డేటాలోని 50% విలువలు. ఇది 1 వ క్వార్టైల్ విలువ మరియు 3 వ క్వార్టైల్ విలువ మధ్య వ్యత్యాసంగా లెక్కించబడుతుంది.
మేము 3 వ క్వార్టైల్ నుండి 1 వ క్వార్టైల్ ను తీసివేసే సెల్ F4 లోకి ఒక సాధారణ సూత్రాన్ని ఉపయోగించబోతున్నాము:
= F3-F2
ఇప్పుడు, మన ఇంటర్క్వార్టైల్ పరిధి ప్రదర్శించబడుతుంది.
మూడవ దశ: దిగువ మరియు ఎగువ హద్దులను తిరిగి ఇవ్వండి
దిగువ మరియు ఎగువ హద్దులు మనం ఉపయోగించాలనుకునే డేటా పరిధి యొక్క అతిచిన్న మరియు అతిపెద్ద విలువలు. ఈ బౌండ్ విలువల కంటే చిన్న లేదా పెద్ద విలువలు ఏవైనా అవుట్లెర్స్.
IQR విలువను 1.5 గుణించి, Q1 డేటా పాయింట్ నుండి తీసివేయడం ద్వారా సెల్ F5 లో తక్కువ పరిమితిని మేము లెక్కిస్తాము:
= F2- (1.5 * F4)
గమనిక: ఈ సూత్రంలోని బ్రాకెట్లు అవసరం లేదు, ఎందుకంటే వ్యవకలన భాగానికి ముందు గుణకారం భాగం లెక్కిస్తుంది, కానీ అవి సూత్రాన్ని చదవడానికి సులభతరం చేస్తాయి.
సెల్ F6 లో ఎగువ సరిహద్దును లెక్కించడానికి, మేము మళ్ళీ IQR ను 1.5 గుణించాలి, కాని ఈసారి జోడించు ఇది Q3 డేటా పాయింట్కు:
= F3 + (1.5 * F4)
నాలుగవ దశ: అవుట్లియర్లను గుర్తించండి
ఇప్పుడు మన అంతర్లీన డేటా మొత్తాన్ని సెటప్ చేసాము, మన బయటి డేటా పాయింట్లను గుర్తించాల్సిన సమయం ఆసన్నమైంది-అవి తక్కువ బౌండ్ విలువ కంటే తక్కువ లేదా ఎగువ బౌండ్ విలువ కంటే ఎక్కువ.
ఈ తార్కిక పరీక్షను నిర్వహించడానికి మేము OR ఫంక్షన్ను ఉపయోగిస్తాము మరియు కింది సూత్రాన్ని సెల్ C2 లోకి నమోదు చేయడం ద్వారా ఈ ప్రమాణాలకు అనుగుణంగా ఉన్న విలువలను చూపుతాము:
= OR (B2 $ F $ 6)
మేము ఆ విలువను మా C3-C14 కణాలలోకి కాపీ చేస్తాము. నిజమైన విలువ lier ట్లియర్ను సూచిస్తుంది మరియు మీరు చూడగలిగినట్లుగా, మా డేటాలో మాకు రెండు ఉన్నాయి.
సగటు సగటును లెక్కించేటప్పుడు అవుట్లియర్లను విస్మరించడం
QUARTILE ఫంక్షన్ను ఉపయోగించి మనం IQR ను లెక్కించి, అవుట్లియర్ యొక్క విస్తృతంగా ఉపయోగించే నిర్వచనంతో పని చేద్దాం. ఏదేమైనా, విలువల శ్రేణికి సగటు సగటును లెక్కించేటప్పుడు మరియు అవుట్లర్లను విస్మరించేటప్పుడు, ఉపయోగించడానికి వేగంగా మరియు సులభంగా పని ఉంటుంది. ఈ సాంకేతికత మునుపటిలాగా lier ట్లియర్ను గుర్తించదు, కాని ఇది మన అవుట్లియర్ భాగాన్ని పరిగణించే దానితో సరళంగా ఉండటానికి అనుమతిస్తుంది.
మాకు అవసరమైన ఫంక్షన్ను TRIMMEAN అంటారు మరియు మీరు దాని కోసం వాక్యనిర్మాణాన్ని క్రింద చూడవచ్చు:
= TRIMMEAN (శ్రేణి, శాతం)
ది అమరిక మీరు సగటున కోరుకునే విలువల శ్రేణి. ది శాతం డేటా సెట్ యొక్క ఎగువ మరియు దిగువ నుండి మినహాయించాల్సిన డేటా పాయింట్ల శాతం (మీరు దీన్ని ఒక శాతం లేదా దశాంశ విలువగా నమోదు చేయవచ్చు).
సగటును లెక్కించడానికి మరియు 20% అవుట్లియర్లను మినహాయించడానికి మా ఉదాహరణలో సెల్ D3 లోకి క్రింది సూత్రాన్ని నమోదు చేసాము.
= TRIMMEAN (బి 2: బి 14, 20%)
అవుట్లియర్లను నిర్వహించడానికి మీకు రెండు వేర్వేరు విధులు ఉన్నాయి. మీరు కొన్ని రిపోర్టింగ్ అవసరాలకు వాటిని గుర్తించాలనుకుంటున్నారా లేదా సగటు వంటి లెక్కల నుండి మినహాయించాలనుకుంటున్నారా, ఎక్సెల్ మీ అవసరాలకు తగినట్లుగా ఒక ఫంక్షన్ను కలిగి ఉంది.