Средна стойност - обща характеристика

Рейтинг: 0/5

Продължаваме разглеждането на темата за средни стойности. В предишната статия говори за това, което средната стойност като първоначалните данни може да се отрази на качеството на средата и какво да направя, за да средната стойност е информативен показател, а не "средната температура в болницата."







А сега да разгледаме още една важна функция на тази статистика, която до голяма степен се обяснява с цел използването му. Основната функция на средната стойност е в графата "компресиране" на първоначалната информация. Нека си представим, че ние сме заинтересовани да се сравни нивото на заплатите в някои страни, които са дом на няколко милиона души. Заплатите са различни, има богати, бедни, средно. Как да се определи държавата, в която хората получават повече? Как да получите обобщена благосъстоянието на оценяване? И това е толкова често въпросът е: къде повече се получава от нас или от тях? Невъзможно е да се отговори на този въпрос, без да се прибягва до статистическия анализ на данните. Все пак, ако се изчисли средната заплата в страната, огромното количество сурови данни "свие" до само един единствен показател за всяка държава. След това, средните стойности могат да бъдат много лесно и визуално сравнение един с друг. Трябва да се разбере, че в прехода от суровите данни за средните стойности на разнообразието на първоначалните данни изчезва. Ние няма да видите заплата на всеки служител поотделно (част от информацията се губи), но огромно количество информация, източник, който не може да разбере и осмисли гола мозъка се превръща в един доста компактен и информативно описание на целия набор от ценности. Дъвка една топка е по-лесно, отколкото някои от тях. Внимавай за една птица е по-лесно, отколкото десет. С една дума, за да се справят с един предмет лесно, отколкото много хора.

Качеството на такава характеристика (средно) зависи от оригиналните данни, но точката остава същата - големи количества от данни "компресирани" към една стойност. Ако изходните данни в статистически смисъл на качеството (хомогенна), средната стойност, запазват съдържанието на информацията (т.е. правилно отразява модела на) необработените данни и много пъти ще намалят обема им. Но в действителност, хомогенен набор от данни, не се среща често. Какво се случва след това зависи от целите на анализа. Ако все още са важни за бързо и лесно да се получи обща оценка на заплата в страната, е възможно да се изчисли средно, игнорирайки тяхната хомогенност. След това трябва да се има предвид, че изчислените средни стойности не са надеждно отразяват естественото ниво на заплатите, както и ще се показва само общия фонд работна заплата на служител. Този показател е най-често могат да се намерят в различни публикации. Но сега сме, тъй като компетентните анализатори разбират, че тя не трябва да се тълкува като средна (природни) Нивата на S / N, и точно както се изчислява: Фонд C / N на служител. Това, разбира се, една дреболия за лаиците, но все пак се съгласявате, че между редовете на номера и има някаква качествена разлика, въпреки че и двете серии средната аритметична стойност на същите - 5. За по-голяма яснота, различията в графиките представляват данните.







Както намалена стойност
Както намалена стойност

Левият Фигурата показва ясно, че в първи набор от данни номера са хетерогенни - Част стойности значително по-голяма от средната стойност (червена линия), частта - значително по-малко; във втория сет (вдясно фигурата), всички стойности са много по-хомогенна (малко по-различни един от друг и се тълпят около средната стойност - червена линия). Този пример с номера, подобни на примера в предишната статия за бедните и богатите.

Ако искаме да постигнем статистически средно качество, оригиналния набор от разнородни трябва да бъде разделена на хомогенни групи и вече групирани данни за изчисляване на средни стойности. Как ще групи и като средни стойности. Това, ако се прави за наука. На практика, малко хора знаят, че такава хомогенност и продължава да вярва, "средната температура в болницата". От друга страна, равномерността често изобщо не е необходимо, тъй като анализатор обикновено е интересен анализ на ситуацията в динамиката. И динамиката на хетерогенност изравниха почти същото като намалената фракция (ние няма да влезем в един вълнуващ алгебра 6-ти клас). Като цяло, еднообразието на данните - това е важно изискване, но не винаги е необходимо. Но да се върнем на подходящи и точни статистически данни.

Очевидно е, че колкото по-голям от броя на групите да се разделят на първоначалните данни, така че те ще бъдат по-равномерно в рамките на всяка група. Все пак, това увеличава броя на самите стойности, а това от своя страна го прави трудно за провеждане и тълкуване на статистически анализ. Поради тази причина, анализаторът трябва да се опита да се постигне оптимално съотношение между броя на групи и тяхното качество (хомогенност). Вие също трябва да се обърне внимание на броя на ценности в рамките на групи. Това често се случва, че цялото тяло се разделя така, че по-голямата част от ценности получава само една или две групи, а останалите стойности се различават много от по-голямата част, че най-малко някои групи от тях го правят. Разбира се, да се анализират данните от една или две няма смисъл наблюдения. Тези стойности се наричат ​​анормални, и в много случаи, те трябва да се елиминира напълно от изчисленията (не се забравя за тяхното съществуване).

По този начин, има две полярни видове информация: или най-точно (ако първоначалната стойност за работа всеки поотделно) или максимално компактен (когато цялата информация, се заменя с друга характеристика като средната стойност). Междинните варианти определени група данни. По-големият от групата, толкова по-хомогенна данните в тях, но по-голям от средния. Тази ситуация води до проблема с избора между точност и компактност. Ако данните се анализират в динамика, нееднородността може да се пренебрегне, тъй като тя има малък ефект върху динамиката на индекса. Но ако сравним средните стойности на други стойности (с други обекти в пространството, но не и в говорителя), все пак е необходимо да се обърне внимание на качествените показатели. За разнородни данни би било правилно да държат група и / или правилно тълкуване на резултатите от изчисленията. Най-важното нещо за анализаторът не се вдигне от земята и за всяко изчисление, за да се чувстват връзка с реалността.

Това е всичко. Въпреки това, темата за средни стойности ще продължи, все още има много интересни и информативни.
Всичко най-хубаво.