Definición de serie de variación. Series de distribución y agrupación.

El método de agrupación también le permite medir variación(variabilidad, fluctuación) de signos. Cuando el número de unidades en una población es relativamente pequeño, la variación se mide con base en el número clasificado de unidades que componen la población. la serie se llama clasificado, si las unidades están dispuestas en orden ascendente (descendente) de la característica.

Sin embargo, las series clasificadas son bastante indicativas cuando es necesario. Características comparativas variaciones. Además, en muchos casos tenemos que tratar con poblaciones estadísticas que consisten en gran número unidades que son prácticamente difíciles de representar en forma de una serie específica. En este sentido, para un conocimiento general inicial de los datos estadísticos y especialmente para facilitar el estudio de la variación de las características, los fenómenos y procesos en estudio generalmente se combinan en grupos, y los resultados de la agrupación se presentan en forma de tablas de grupo.

Si una tabla de grupos tiene solo dos columnas: grupos según una característica seleccionada (opciones) y el número de grupos (frecuencia o frecuencia), se llama distribución cercana.

Rango de distribución - el tipo más simple de agrupación estructural basado en una característica, mostrado en una tabla de grupo con dos columnas que contienen variantes y frecuencias de la característica. En muchos casos, con tal agrupación estructural, es decir, Con la recopilación de series de distribución se inicia el estudio del material estadístico inicial.

Una agrupación estructural en forma de serie de distribución puede convertirse en una auténtica agrupación estructural si los grupos seleccionados se caracterizan no sólo por las frecuencias, sino también por otros indicadores estadísticos. El objetivo principal de las series de distribución es estudiar la variación de las características. La teoría de las series de distribución se desarrolla en detalle mediante la estadística matemática.

Las series de distribución se dividen en atributivo(agrupar según características atributivas, por ejemplo, dividir la población por género, nacionalidad, estado civil, etc.) y variacional(agrupación por características cuantitativas).

Serie de variación Es una tabla de grupos que contiene dos columnas: agrupación de unidades según una característica cuantitativa y el número de unidades en cada grupo. Los intervalos de una serie de variación suelen ser iguales y cerrados. La serie de variación es la siguiente agrupación de la población rusa según el ingreso monetario promedio per cápita (Cuadro 3.10).

Tabla 3.10

Distribución de la población de Rusia por renta media per cápita en 2004-2009.

Grupos de población por ingreso monetario promedio per cápita, rublos/mes

Población del grupo, % del total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Más de 25.000,0

Toda la población

Las series de variación, a su vez, se dividen en discretas y de intervalo. Discreto Las series de variación combinan variantes de características discretas que varían dentro de límites estrechos. Un ejemplo de discreto serie de variación La distribución de las familias rusas según el número de hijos que tienen puede servirnos de guía.

Intervalo Las series de variación combinan variantes de características continuas o características discretas que varían en un amplio rango. El intervalo es la serie de variación de la distribución de la población rusa según el ingreso monetario promedio per cápita.

Las series de variación discreta no se utilizan con mucha frecuencia en la práctica. Mientras tanto, compilarlos no es difícil, ya que la composición de los grupos está determinada por las variantes específicas que realmente tienen las características de agrupación estudiadas.

Las series de variación de intervalos están más extendidas. Al compilarlos surge una pregunta difícil sobre el número de grupos, así como el tamaño de los intervalos que deben establecerse.

Los principios para resolver este problema se establecen en el capítulo sobre la metodología para la construcción de agrupaciones estadísticas (ver párrafo 3.3).

Las series de variación son un medio para colapsar o comprimir información diversa en una forma compacta; a partir de ellas se puede hacer un juicio bastante claro sobre la naturaleza de la variación y estudiar las diferencias en las características de los fenómenos incluidos en el conjunto en estudio. Pero el significado más importante de las series de variación es que a partir de ellas se calculan las características generalizadoras especiales de la variación (ver Capítulo 7).

(definición de una serie de variación; componentes de una serie de variación; tres formas de una serie de variación; viabilidad de construir una serie de intervalo; conclusiones que se pueden extraer de la serie construida)

Una serie de variación es la secuencia de todos los elementos de la muestra dispuestos en orden no decreciente. Se repiten elementos idénticos

Las series variacionales son series construidas sobre una base cuantitativa.

Las series de distribución variacional constan de dos elementos: opciones y frecuencias:

Las variantes son valores numéricos de una característica cuantitativa en una serie de distribución variacional. Pueden ser positivos y negativos, absolutos y relativos. Así, al agrupar empresas según resultados actividad económica Los números positivos significan ganancias y los números negativos significan pérdidas.

Las frecuencias son el número de variantes individuales o de cada grupo de una serie de variaciones, es decir Estos son números que muestran con qué frecuencia ocurren ciertas opciones en una serie de distribución. La suma de todas las frecuencias se llama volumen de la población y está determinada por el número de elementos de toda la población.

Las frecuencias son frecuencias expresadas como valores relativos (fracciones de unidades o porcentajes). La suma de las frecuencias es igual a uno o 100%. Reemplazar frecuencias con frecuencias permite comparar series de variación con diferentes números de observaciones.

Hay tres formas de series de variación: series clasificadas, series discretas y series de intervalos.

Una serie clasificada es la distribución de unidades individuales de una población en orden ascendente o descendente de la característica que se está estudiando. La clasificación le permite dividir fácilmente los datos cuantitativos en grupos, detectar inmediatamente los más pequeños y valor más alto característica, resalte los valores que se repiten con mayor frecuencia.

Otras formas de series de variación son tablas de grupos compiladas según la naturaleza de la variación de los valores de la característica en estudio. Según la naturaleza de la variación, se distinguen características discretas (discontinuas) y continuas.

Una serie discreta es una serie variacional, cuya construcción se basa en características con cambio discontinuo (características discretas). Estos últimos incluyen la categoría arancelaria, el número de hijos de la familia, el número de empleados de la empresa, etc. Estas características sólo pueden tomar un número finito de valores específicos.

Una serie de variación discreta representa una tabla que consta de dos columnas. La primera columna indica el valor específico del atributo y la segunda columna indica el número de unidades en la población con un valor específico del atributo.

Si una característica tiene un cambio continuo (cantidad de ingresos, duración del servicio, costo de los activos fijos de una empresa, etc., que puede tomar cualquier valor dentro de ciertos límites), entonces para esta característica es necesario construir una serie de variación de intervalo.



La tabla de grupos aquí también tiene dos columnas. El primero indica el valor del atributo en el intervalo “de - a” (opciones), el segundo indica el número de unidades incluidas en el intervalo (frecuencia).

Frecuencia (frecuencia de repetición): el número de repeticiones de una variante particular de los valores de los atributos se denota por fi, y la suma de frecuencias igual al volumen de la población en estudio se denota

Donde k es el número de opciones para los valores de los atributos.

Muy a menudo, la tabla se complementa con una columna en la que se calculan las frecuencias acumuladas S, que muestran cuántas unidades de la población tienen un valor característico no mayor que este valor.

Una serie de distribución variacional discreta es una serie en la que los grupos se componen de acuerdo con una característica que cambia discretamente y toma solo valores enteros.

Una serie de distribución variacional de intervalo es una serie en la que la característica de agrupación que forma la base de la agrupación puede tomar cualquier valor, incluidos los fraccionarios, en un intervalo determinado.

Intervalo serie de variación es un conjunto ordenado de intervalos de valores variables variable aleatoria con las correspondientes frecuencias o frecuencias de ocurrencia de valores de valor en cada uno de ellos.

Es aconsejable construir una serie de distribución de intervalos, en primer lugar, con una variación continua de una característica, y también si una variación discreta se manifiesta en un rango amplio, es decir, el número de variantes de una característica discreta es bastante grande.

De esta serie ya se pueden sacar varias conclusiones. Por ejemplo, el elemento medio de una serie de variación (mediana) puede ser una estimación del resultado de medición más probable. El primer y último elemento de la serie de variación (es decir, el elemento mínimo y máximo de la muestra) muestran la dispersión de los elementos de la muestra. En ocasiones, si el primer o último elemento es muy diferente del resto de la muestra, se excluyen de los resultados de la medición, considerando que estos valores se obtuvieron como resultado de algún tipo de falla grave, por ejemplo, tecnológica.

Series de variación y sus elementos.

Un investigador interesado en la categoría arancelaria de los trabajadores mecánicos.
taller, realizó una encuesta a 100 trabajadores. Coloquemos los valores observados.
premio en orden ascendente. Esta operación se llama clasificación.
Datos estadísticos. Como resultado, obtenemos la siguiente serie, que llama
Xia clasificado:

1,1,..1, 2,2..2, 3,3,..3, 4,4,..4, 5,5,..5, 6,6,..6.

De la serie clasificada se desprende que la característica estudiada (arancel
rango) tomó seis valores diferentes: 1, 2, 3, 4, 5 y 6.

A continuación, llamaremos a diferentes valores de la característica. opción-
mi,
Y debajo variando - Comprender los cambios en los valores de los atributos.

Dependiendo de los valores aceptados por el signo, los signos se dividen
en varían discretamente y varían continuamente.

La categoría arancelaria es una característica que varía discretamente. Número, impresiones-
El número de veces que aparece la opción x en un número de observaciones se denomina hora-
juguete
opción mx.

En lugar de la frecuencia de la opción x, podemos considerar su relación con la frecuencia general.
número de observaciones norte, Lo que es llamado frecuencia opción y su relación denota ancho x .

w x =m x /n=m x /åm x

Una tabla que le permite juzgar la distribución de frecuencias (o frecuencias) entre opciones se llama series de variación discreta.

Junto con el concepto de frecuencia, se utiliza el concepto. frecuencia acumulada,
que denotan t x nak. La frecuencia acumulada muestra cuantas veces
En las observaciones, el signo tomó valores menores que el valor x dado. Actitud
la suma de la frecuencia acumulada al número total de observaciones n se llama acumulado
frecuencia
y denotar w x desnudo. Es obvio que



w x nak =m x nak /n=m x nak /åm x .

Frecuencias acumuladas (frecuencias para una serie de variación discreta, calculadas en la siguiente tabla:

X mx m x desnudo w x desnudo
0+4=4 0,04
4+6=10 0,10
10+12=22 0,22
22+16=38 0,38
38+44=82 0,82
82+18=100 1,00
Por encima de 6

Sea necesario estudiar la producción por trabajador - maquinista de un taller mecánico en el año del informe como porcentaje del año anterior. Aquí, la característica x que se estudia es la producción en el año del informe como porcentaje del anterior. Esta es una característica que varía continuamente. Identificar rasgos característicos Las variaciones en los valores del atributo se combinarán en grupos de trabajadores cuya producción fluctúe dentro del 10%. Presentamos los datos agrupados en la tabla:

Investigación firmar x Número de trabajadores m Proporción de trabajadores w Acumulado frecuencia m x nak w x desnudo
80-90 8/117 8/117
90-100 15/117 8+15=23 23/117
100-110 46/117 23+46=69 69/117
110-120 29/117 69+29=98 98/117
120-130 13/117 98+13=111 111/117
130-140 3/117 111+3=114 114/117
140-150 3/117 114+3=117 117/117
å

En la tabla de frecuencia, m muestra cuántas observaciones tomó la característica en valores pertenecientes a un intervalo particular. Esta frecuencia se llama intervalo, y su relación con el número total de observaciones es frecuencia de intervalo w. Una tabla que permite juzgar la distribución de frecuencia entre intervalos de variación en los valores de una característica se llama serie de variación de intervalo.

Se construye una serie de variación de intervalo basada en datos observacionales para
un rasgo que varía continuamente, así como uno que varía discretamente, si
el número de variantes observadas es grande. Se construye una serie de variaciones discretas.
sólo para un rasgo discretamente variable

A veces, una serie de variación de intervalo se reemplaza condicionalmente por una discreta.
Entonces el valor medio del intervalo se toma como opción x, y el valor correspondiente
frecuencia del intervalo de deformación - para tx.

Para determinar el intervalo constante óptimo h, a menudo utilizan Fórmula Sturgess:

h=(x máx – x mín)/(1+3,322*lg norte).

Construcción de int.var.rows

Las frecuencias m muestran cuántas observaciones tomó la característica en valores pertenecientes a un intervalo particular. Esta frecuencia se llama frecuencia de intervalo y su relación con el número total de observaciones se llama frecuencia de intervalo w. Una tabla que permite juzgar la distribución de frecuencias (o frecuencias) entre intervalos de variación en los valores de una característica se denomina serie de variación de intervalo.

Se construye una serie de variación de intervalo basándose en datos de observación para un rasgo que varía continuamente, así como para uno que varía discretamente, si el número de variantes observadas es grande. Una serie de variación discreta se construye sólo para una característica que varía discretamente.

A veces, una serie de variación de intervalo se reemplaza condicionalmente por una discreta. Luego, el valor medio del intervalo se toma como opción x y la frecuencia del intervalo correspondiente se toma como mx.

Para construir una serie de variación de intervalo, es necesario determinar el tamaño del intervalo, establecer una escala completa de intervalos y agrupar los resultados de la observación de acuerdo con ella.

Para determinar el intervalo constante óptimo h, a menudo se utiliza la fórmula de Sturgess:

h = (xmáx - xmín) /(1+ 3,322 log n) .

donde xmax xmin son las opciones máxima y mínima, respectivamente. Si, como resultado de los cálculos, h resulta ser un número fraccionario, entonces se debe tomar como valor del intervalo el número entero más cercano o la fracción simple más cercana.

Se recomienda tomar el valor a1=xmin-h/2 como inicio del primer intervalo; el inicio del segundo intervalo coincide con el final del primero y es igual a a2=a1 +h; el comienzo del tercer intervalo coincide con el final del segundo y es igual a a3=a2 + h. La construcción de intervalos continúa hasta que el comienzo del siguiente intervalo en orden sea mayor que xmax. Después de establecer la escala de intervalo, se deben agrupar los resultados de la observación.

5) Concepto, formas de expresión y tipos de indicadores estadísticos.

Indicador estadístico representa una característica cuantitativa de los fenómenos y procesos socioeconómicos en condiciones de certeza cualitativa. La certeza cualitativa del indicador radica en que está directamente relacionado con el contenido interno del fenómeno o proceso en estudio, su esencia.

Sistema de indicadores estadísticos. es un conjunto de indicadores interrelacionados que tiene una estructura de un solo nivel o de varios niveles y tiene como objetivo resolver un problema estadístico específico.

A diferencia de una característica, un indicador estadístico se obtiene mediante cálculo. Puede ser un simple recuento de unidades de población, sumando sus valores característicos, comparando 2 o más valores, o cálculos más complejos.

Existe una distinción entre un indicador estadístico específico y un indicador de categoría.

Indicador estadístico específico Caracteriza el tamaño, magnitud del fenómeno o proceso que se estudia en un lugar determinado y en un momento determinado. Sin embargo, en los trabajos teóricos y en la etapa de diseño de la observación estadística, también operan con indicadores absolutos o indicadores de categorías.

Indicadores-categorías reflejar la esencia, propiedades distintivas generales de indicadores estadísticos específicos del mismo tipo sin indicar el lugar, la hora y el valor numérico. Todos los indicadores estadísticos se dividen según la cobertura de las unidades de población en individuales y libres, y según la forma, en absoluto, relativo y promedio.

Indicadores individuales caracterizar un objeto separado o una unidad separada de una población: una empresa, una firma, un banco, etc. Un ejemplo es el número de personal industrial y de producción de una empresa. A partir de la comparación de dos indicadores absolutos individuales que caracterizan el mismo objeto o unidad, se obtiene un indicador relativo individual.

Indicadores resumidos a diferencia de los individuales, caracterizan un grupo de unidades que representan parte de una población estadística o toda la población en su conjunto. Estos indicadores se dividen en volumétricos y calculados.

Indicadores de volumen se obtienen sumando los valores característicos de unidades individuales de la población. El valor resultante, llamado volumen de una característica, puede actuar como un indicador volumétrico absoluto o puede compararse con otro valor volumétrico absoluto o el volumen de una población. En los 2 últimos casos se obtienen indicadores volumétricos relativos y volumétricos medios.

Indicadores estimados, calculados mediante varias fórmulas, sirven para resolver problemas de análisis estadísticos individuales: medir la variación, las características de los cambios estructurales, evaluar las relaciones, etc. También se dividen en absolutos, relativos o promedio.

Este grupo incluye índices, coeficientes de correlación, errores de muestreo y otros indicadores.

La cobertura de las unidades de población y la forma de expresión son las principales, pero no las únicas, características de clasificación de los indicadores estadísticos. Una característica de clasificación importante es también el factor tiempo. Los procesos y fenómenos socioeconómicos se reflejan en indicadores estadísticos ya sea en un momento determinado, generalmente en una fecha determinada, al comienzo o al final de un mes, año o durante un período determinado: día, semana, mes, trimestre, año. . En el primer caso, los indicadores son momentáneo, en el segundo - intervalo.

Dependiendo de la pertenencia a uno o dos objetos de estudio, distinguen objeto único Y indicadores interobjetos. Si los primeros caracterizan solo un objeto, los segundos se obtienen como resultado de una comparación de dos cantidades relacionadas con objetos diferentes.

Desde el punto de vista de la certeza espacial, los indicadores estadísticos se dividen en territoriales generales, caracterizando el objeto o fenómeno que se estudia en el país en su conjunto, regionales y locales, relativo a cualquier parte del territorio o a un objeto separado.

6) Tipos y relaciones de indicadores relativos..

Indicador relativo es el resultado de dividir un indicador absoluto por otro y expresa la relación entre las características cuantitativas de los procesos y fenómenos socioeconómicos. Por tanto, en relación con los indicadores absolutos, los indicadores relativos o los indicadores en forma de valores relativos son derivados.

Al calcular un indicador relativo, el indicador absoluto que se encuentra en el numerador de la relación resultante se llama actual o comparable. El indicador con el que se realiza la comparación y que está en el denominador se llama base o base de comparación. Las medidas relativas se pueden expresar como porcentajes, ppm, proporciones o pueden denominarse números.

Todos los indicadores relativos utilizados en la práctica se dividen en:

·Altavoces; plan; ·implementación del plan; estructuras; · coordinación; · intensidad y nivel de ecodesarrollo; · comparaciones.

Indicador de dinámica relativa es la relación entre el nivel del proceso o fenómeno en estudio durante un período de tiempo determinado y el nivel del mismo proceso o fenómeno en el pasado.

OPD=indicador actual/anterior. O una línea de base.

El valor calculado de esta manera muestra cuántas veces el nivel actual excede al anterior o qué proporción de este último corresponde. Si este indicador se expresa como una razón múltiple, se llama tasa de crecimiento, al multiplicar este coeficiente por 100% obtenemos tasa de crecimiento.

Índice de estructura relativa representa la relación entre las partes estructurales del objeto en estudio y su conjunto. El indicador de estructura relativa se expresa en fracciones de unidad o como porcentaje. Los valores calculados (d i), llamados respectivamente participación o gravedad específica, muestran qué participación tiene la i-ésima parte en el total general.

Indicadores relativos de coordinación caracterizar la relación entre las partes individuales del todo. En este caso se selecciona como base de comparación la parte que tiene mayor participación o es prioritaria desde el punto de vista económico, social o de cualquier otro tipo. Como resultado, obtenemos cuántas unidades de cada parte estructural hay por 1 unidad de la parte estructural básica.

Índice de intensidad relativa Caracteriza el grado de distribución del proceso o fenómeno que se estudia en su entorno inherente. Este indicador se calcula cuando el valor absoluto es insuficiente para formular conclusiones fundamentadas sobre la escala del fenómeno, su tamaño, saturación y densidad de distribución. Puede expresarse como porcentaje, ppm o una cantidad determinada. Se utilizan diversos indicadores de intensidad relativa. indicadores relativos del nivel de desarrollo ambiental, caracterizando la producción per cápita y desempeñando un papel importante en la evaluación del desarrollo de la economía del estado. En cuanto a la forma de expresión, estos indicadores se acercan a los indicadores promedio, lo que a menudo conduce a su confusión o identificación. La única diferencia entre ellos es que al calcular el indicador promedio, estamos tratando con un conjunto de unidades, cada una de las cuales es portadora de la característica promediada.

Índice de comparación relativa representa la relación de indicadores absolutos del mismo nombre que caracterizan diferentes objetos (empresas, firmas, regiones, distritos, etc.)

Indicadores de variación

El estudio de la variación (cambio en los valores de una característica dentro de una población) es de gran importancia en la estadística y la investigación socioeconómica en general. Los indicadores de variación absolutos y relativos, que caracterizan la variabilidad de los valores de una característica variable, permiten, en particular, medir el grado de conexión e interrelación, evaluar el grado de homogeneidad de la población, la tipicidad y la estabilidad. del promedio, y determinar la magnitud del posible error de observación del muestreo.

Los indicadores absolutos de variación incluyen el rango de variación, la desviación lineal promedio, la dispersión, la desviación estándar y la desviación trimestral.

El rango de variación muestra en qué medida cambia el valor de una característica que varía cuantitativamente.

R=xmax-xmin, donde xmax(xmin) es el valor máximo (mínimo) de la característica en el agregado (en la serie de distribución).

La desviación lineal promedio d se define como el valor promedio de las desviaciones de las variantes de atributos del promedio a la primera potencia, tomado módulo:

La desviación lineal promedio se utiliza relativamente raramente para evaluar la variación de un rasgo. Normalmente se calculan la varianza y la desviación estándar.

Si es necesario comparar la variabilidad de varias características en una población o la misma característica en varias poblaciones con diferentes indicadores del centro de distribución, entonces se utilizan indicadores relativos de variación.

Estos incluyen los siguientes indicadores:

1. Coeficiente de oscilación:

2. Desviación lineal relativa:

3. Coeficiente de variación:

4. Indicador de variación cuartil relativa:

La medida de variación relativa más utilizada es el coeficiente de variación. Este indicador se utiliza no solo para una evaluación comparativa de la variación, sino también como una característica de la homogeneidad de la población. Una población se considera homogénea si<0,33.

Formularios.

1. Estadísticas. La presentación de informes es una forma organizativa en la que las unidades de observación proporcionan información sobre sus actividades en forma de formularios, aparatos regulatorios.

La peculiaridad de la denuncia es que debe estar justificada, ejecutoriada y legalmente confirmada mediante la firma del gerente o responsable.

2. La observación especialmente organizada es el ejemplo más sorprendente y sencillo de esta forma de observación de los fenómenos. censo. El censo suele realizarse a intervalos regulares, simultáneamente en toda la zona de estudio y al mismo tiempo.

Los organismos estadísticos rusos realizan censos de población de ciertos tipos de subsistencia y organizaciones, recursos materiales, plantaciones perennes, objetos de construcción de salud pública, etc.

4. Forma de registro de observación: basada en el mantenimiento de un registro estadístico. En el registro cada La unidad de observación se caracteriza por una serie de indicadores. En la práctica estadística nacional, los más difundidos son los registros y subregistros US-I.

El registro de población lo realiza la Oficina del Registro Civil

Registro - USRPO led.org. Estadísticas.

Tipos.

se pueden dividir en grupos según lo siguiente. señales:

a) según el momento de la inscripción

b) por cobertura de unidades de la sociedad

Por registro de tiempo. ellos son:

Actual (continua)

Intermitente (periódico y único)

En la actualidad obs. los cambios en los fenómenos y procesos se registran a medida que ocurren (inscripción de nacimiento, defunción, matrimonio, divorcio, etc.)

Periódico obs. llevado a cabo a través de def. Intervalos de tiempo (N censo de población cada 10 años)

Una vez obs. llevado a cabo no regularmente o sólo una vez (referéndum)

Por unidades de cobertura. Observación del estado soviético. hay:

Sólido

No continuo

Observación continua es una encuesta de todas las unidades de la sociedad

Observación continua Se supone que sólo una parte de la investigación está sujeta a observación.

Existen varios tipos de observación no continua:

Método básico formación

Selectivo (por tu cuenta)

Monográfico

Este método se caracteriza por el hecho de que, por regla general, se seleccionan la mayor cantidad de criaturas, generalmente las unidades más grandes. sov-ti en el gato. centro significa. parte de todos los signos.

Con observación monográfica, atenta y. están sujetos al departamento. unidades estudiar el búho o tal vez o típico de una unidad soviética determinada. o presentar nuevas variedades de fenómenos.

Observación múltiple llevado a cabo con el objetivo de identificar tendencias emergentes en el desarrollo de este fenómeno.

Métodos

Observación directa

Observación documental

llamado directamente tales obs. con gato Los propios registradores, midiendo, contando, restringiendo inmediatamente el hecho objeto de registro, y sobre esta base hacen una anotación en el formulario.

Método documental de observación. basado en el uso de diversos documentos como fuentes de información, generalmente registros contables (es decir, informes estadísticos)

Una encuesta es un método de persuasión con un gato. la información necesaria se obtendrá de las palabras del encuestado (es decir, de la persona entrevistada) (oral, corresponsal, cuestionario, personal, etc.)

Determinación de errores de muestreo.

En el proceso de realización de la observación de muestras se distinguen dos tipos de errores: registro y representatividad.

Errores de registro – desviaciones entre el valor del indicador obtenido durante la observación estadística y su valor real. Estos errores pueden aparecer tanto durante la observación continua como durante la observación incompleta. Los errores de registro ocurren debido a información incorrecta o inexacta. Las fuentes de este tipo de error pueden ser la falta de comprensión de la esencia de la pregunta, la falta de atención del registrador, la omisión o el recuento de unidades de observación individuales. Los errores de registro se dividen en sistemático, causado por razones que actúan en cualquier dirección y suavizan los resultados de la encuesta (redondeo de números), y aleatorio, que son el resultado de la acción de varios factores aleatorios (reorganización de números vecinos). Los errores aleatorios tienen diferentes direcciones y, cuando se encuesta un volumen de población suficientemente grande, se anulan entre sí.

Errores de representatividad – desviaciones de los valores del indicador de la población encuestada de su valor en la población original. Estos errores también se dividen en sistemático, resultante de una violación de los principios de selección de unidades a observar de la población original, y aleatorio, que surgen si la población seleccionada no reproduce completamente a toda la población en su conjunto. Se puede estimar la magnitud del error aleatorio.

Sesgo de muestreo– la diferencia entre el valor de una característica en la población general y su valor calculado sobre la base de los resultados de la observación de la muestra. En la práctica de las encuestas por muestreo, la mayoría de las veces se determinan los errores de muestreo promedio y máximo.

El error de muestreo promedio se calcula de manera diferente para diferentes métodos de muestreo. Si se trata de una selección aleatoria o mecánica, entonces

Para promedio: m = s 2 / (n) 1/2

Para una fracción: m = (w(1-w)/n) 1/ 2, donde

m - error de muestreo promedio

s 2 - variación general

n – tamaño de la muestra

Si la población muestral se forma sobre la base de una muestra típica y la selección de unidades se realiza en proporción al tamaño de los grupos típicos, entonces el error promedio es igual a:

Para mediano: m = (s yo 2 / n) 1/2

Para compartir: m = (w i (1-w i) / n) 1/2 , Dónde

s i 2 – promedio de las variaciones intragrupo

wi es la proporción de unidades de este grupo que tienen el rasgo en estudio.

s yo 2 = ås 2 norte yo / ån yo

El error de muestreo serial promedio es:

Para mediano: metro = (d x 2 / r) 1/2

Para compartir: metro = (d 2 w/r) 1/2

re 2 w – varianza de la proporción intergrupal

rex 2 – dispersión intergrupal de un rasgo cuantitativo.

r – número de series seleccionadas/

d 2 x = å(xi -x) 2 / r

re 2 w = å(w yo – w) 2 / r

Si la selección de unidades de la población general se realiza de forma no repetitiva, entonces se modifican las fórmulas del error medio: (1-n/N) 1/2

Error de muestreo marginal D se calcula como el producto del coeficiente de confianza t y el error de muestreo promedio: D = t*metro. D está relacionado con el nivel de confianza de probabilidad que lo garantiza. Este nivel determina el coeficiente de confianza t, y viceversa. Los valores t se dan en tablas matemáticas especiales.

Determinación del tamaño de la muestra.

El tamaño de la muestra se calcula, por regla general, en la etapa de diseño de la encuesta por muestreo. Las fórmulas para determinar el tamaño de la muestra se derivan de las fórmulas para los errores máximos de muestreo.

El volumen de muestreo repetido aleatorio y mecánico real está determinado por las fórmulas:

Para promedio norte = t 2 s 2 / D 2

por una parte norte = t 2 w(1-w) / D 2

En caso de muestreo no repetitivo:

Para promedio norte = t 2 s 2 norte / ND 2 +t 2 s 2

por una parte norte = t 2 w(1-w)N / ND 2 +t 2 w(1-w).

Cantidades s 2 y w desconocido antes de la observación aleatoria. Se encuentran aproximadamente así:

1. tomado de encuestas anteriores;

2. Si se conocen los valores máximo y mínimo de una característica, entonces la desviación estándar se determina según la regla "tres sigma":

s = x máx – x mín / 6

3. al estudiar un rasgo alternativo, si no hay información sobre su participación en la población general, se toma el valor máximo posible w = 0,5

Con la selección típica, proporcional al tamaño de los grupos típicos, el tamaño de la muestra para cada grupo está determinado por la fórmula : n yo = n*N yo / N, Dónde

n yo – tamaño de muestra del i-ésimo grupo

ni yo– volumen del grupo i en la sociedad genética.

Cuando el muestreo es proporcional a la variación de una característica, el tamaño de la muestra de cada grupo se encuentra de la siguiente manera: n yo = nN yo s yo /åN yo s yo .

Con un remuestreo típico proporcional al tamaño de los grupos, el tamaño total de la muestra se encuentra de la siguiente manera:

Para promedio norte = t 2 s 2 yo / D 2

por una parte norte = t 2 w(1-w) / D 2

En el caso de muestreo típico no repetitivo:

Para promedio norte = t 2 s 2 yo norte / re 2 norte + t 2 s 2 yo

por una parte norte = t 2 w(1-w)N / D 2 N+t 2 w(1-w)

Conceptos básicos y requisitos previos para el uso del análisis de correlación y regresión.

Correlación Es una dependencia estadística entre variables aleatorias que no tienen un carácter estrictamente funcional, en la que un cambio en una de las variables aleatorias conduce a un cambio en la expectativa matemática de la otra.

Análisis de correlación– tiene como tarea la determinación cuantitativa de la estrecha relación entre dos características y entre las características efectivas y multifactoriales. La cercanía de la conexión se expresa cuantitativamente por la magnitud de los coeficientes de correlación.

Correlación-regresión El análisis como concepto general incluye medir la estanqueidad, la dirección de la conexión y establecer una expresión analítica (forma) de la conexión (análisis de regresión).

Análisis de regresión Consiste en determinar la expresión analítica de una relación en la que un cambio en un valor (llamado característica dependiente o resultante) se debe a la influencia de uno o más valores independientes (factores), y el conjunto de todos los demás factores que también influencia se supone el valor dependiente - se calcula para valores constantes y promedio. La regresión puede ser unifactorial (emparejada) y multifactorial (múltiple).

El propósito del análisis de regresión. es una evaluación de la dependencia funcional del valor promedio condicional de la característica resultante (Y) de las características del factor (x 1, x 2, ... x k).

La premisa principal del análisis de regresión. es que sólo la característica resultante (U) obedece a la ley de distribución normal, y las características factoriales x 1, x 2,..., x k pueden tener una ley de distribución arbitraria. En el análisis de series de tiempo, el tiempo t actúa como un atributo del factor. Al mismo tiempo, en el análisis de regresión se supone de antemano que existen relaciones de causa y efecto entre las características del factor efectivo (U) (x 1, x 2,..., x k). La ecuación de regresión, o modelo estadístico de la relación entre fenómenos socioeconómicos, expresada por la función Y x = f (x 1, x 2,..., x k), es bastante adecuada al fenómeno o proceso real simulado si la se cumplen las siguientes condiciones requisitos para su construcción.

1. El conjunto de datos iniciales objeto de estudio debe ser homogéneo y estar descrito matemáticamente mediante funciones continuas.

2. La capacidad de describir el fenómeno modelado con una o más ecuaciones de relaciones causa-efecto.

3. Todas las características de los factores deben tener una expresión cuantitativa (numérica).

4. La presencia de un volumen suficientemente grande de la población de muestra en estudio.

5. Las relaciones de causa y efecto entre fenómenos y procesos deben describirse mediante formas de dependencia lineales o reducibles a lineales.

6. Falta de restricciones cuantitativas sobre los parámetros del modelo de comunicación.

7. Constancia de la estructura territorial y temporal de la población estudiada.

La validez teórica de los modelos de relación construidos sobre la base del análisis de correlación y regresión está garantizada mediante el cumplimiento de lo siguiente condiciones básicas.

1. Todas las características y sus distribuciones conjuntas deben obedecer a la ley de distribución normal;

2. La varianza de la característica modelada (V) debe permanecer constante todo el tiempo cuando cambian el valor (V) y los valores de las características del factor.

3. Las observaciones individuales deben ser independientes, es decir, los resultados obtenidos en la i -ésima observación no deben estar relacionados con los anteriores y contener información sobre observaciones posteriores, además de influir en ellas.

OBJETIVOS DEL RESUMEN Y SU CONTENIDO

La observación proporciona información sobre cada unidad del objeto en estudio. Los datos obtenidos no son indicadores generales. Con su ayuda, es imposible sacar conclusiones sobre el objeto en su conjunto sin un procesamiento preliminar de los datos.

Por tanto, el objetivo de la siguiente etapa de la investigación estadística es sistematizar los datos primarios y obtener, a partir de estos, una característica resumida de todo el objeto utilizando patrones estadísticos generalizadores.

Resumen: un conjunto de operaciones secuenciales para generalizar hechos individuales específicos que forman un conjunto, con el fin de identificar características y patrones típicos inherentes al fenómeno estudiado en su conjunto.

Si durante la observación estadística se recopilan datos sobre cada unidad de un objeto, entonces el resultado del resumen son datos detallados que reflejan toda la población en su conjunto.

El resumen estadístico debe realizarse sobre la base de un análisis teórico preliminar de fenómenos y procesos, de modo que durante el resumen no se pierda información sobre el fenómeno en estudio y todos los resultados estadísticos reflejen los rasgos característicos más importantes del objeto.

Según la profundidad del procesamiento del material, el resumen puede ser simple o complejo.

Un resumen simple es la operación de calcular los totales totales para un conjunto de unidades de observación.

Un resumen complejo es un conjunto de operaciones que incluye agrupar unidades de observación, calcular totales para cada grupo y para todo el objeto y presentar los resultados de la agrupación y el resumen en forma de tablas estadísticas.

El resumen está precedido por el desarrollo de su programa, que consta de las siguientes etapas: selección de características de agrupación; determinar el orden de formación del grupo; desarrollo de un sistema estadístico para caracterizar grupos y el objeto en su conjunto; desarrollo de un sistema de diseños de tablas estadísticas en las que se deben presentar los resultados resumidos.

Resumen de la forma de procesamiento de materiales: descentralizado y centralizado.

Con un resumen descentralizado (esto es lo que se utiliza, por regla general, al procesar informes estadísticos), el desarrollo del material se lleva a cabo en etapas sucesivas. Así, los informes de las empresas son elaborados por los órganos estadísticos de las entidades constitutivas de la Federación de Rusia, y los resultados de la región se envían al Comité Estatal de Estadística de Rusia, y allí los resultados de la economía nacional del país como el conjunto está determinado.

Con un resumen centralizado, todo el material primario ingresa a una organización, donde se procesa de principio a fin. Generalmente se utiliza un resumen centralizado para procesar materiales de encuestas estadísticas únicas.

Según la técnica de ejecución, el resumen estadístico se divide en mecanizado y manual.

Resumen mecanizado: en el que todas las operaciones se llevan a cabo utilizando computadoras electrónicas. Con el resumen manual, todas las operaciones principales (cálculo de totales generales y de grupo) se realizan manualmente.

Para realizar el resumen se elabora un plan que establece cuestiones organizativas: quién y cuándo se realizarán todas las operaciones, el procedimiento para su realización, la composición de la información a publicar en publicaciones periódicas.

Cerrando filas de din-ki

Al analizar filas de din-ki, surge la necesidad de cerrarlas, combinar dos o más filas en una sola. El cierre es necesario en los casos en que los niveles de las series no sean comparables debido a cambios territoriales, a cambios en los precios y a cambios en el método de cálculo de los niveles de las series. es necesario cerrar (combinar) las dos filas anteriores en una. Esto se puede hacer utilizando el coeficiente de comparabilidad. Multiplicando los datos del año por el coeficiente resultante, obtenemos una serie cerrada (comparable) de dinámicas de valores absolutos. 2. El método para cerrar la serie de dinámicas (método de reducción a una base) es que los niveles del año en el que ocurrieron los cambios, como antes del cambio y después de los cambios, se toman como 100%, y el resto se recalcula como un porcentaje en relación con estos niveles, respectivamente.

30. Métodos para alinear filas de din-ki.

Teóricamente, cualquier serie de dinámicas se puede representar en forma de tres componentes:

Tendencia (la principal tendencia y desarrollo de la serie dinámica);

Fluctuaciones cíclicas (periódicas), incluidas las estacionales;

Fluctuaciones aleatorias.

Una de las tareas que surge al analizar series dinámicas es establecer cambios en los niveles del fenómeno en estudio. En algunos casos, el patrón de cambios en los niveles de la serie din-ki es bastante claro, por ejemplo, una disminución sistemática en los niveles de la serie o su aumento. a veces los niveles de una serie sufren cambios muy diferentes (ya sean crecientes o decrecientes). En este caso, sólo podemos hablar de una tendencia y un desarrollo generales: crecimiento o declive.

La identificación de la tendencia principal y el desarrollo (tendencia) se denomina alineación de series de tiempo, y los métodos para identificar la tendencia principal se denominan alineación.

La identificación directa de una tendencia se puede realizar mediante tres métodos.

* Md ampliación de intervalos. Este MD se basa en la ampliación de períodos de tiempo, que incluyen los niveles de la serie. Por ejemplo, una fila de din-ki

la producción diaria se reemplaza por una serie de proyecciones mensuales, etc.

* Media móvil md. En este método, los niveles iniciales de la serie se reemplazan por valores medios, que se obtienen a partir de un nivel dado y de varios que lo rodean simétricamente. El número entero de niveles sobre los cuales se calcula el valor promedio se denomina intervalo de suavizado. El intervalo de suavizado puede ser impar (3, 5, 7, etc. puntos) o par (2, 4, 6, etc. puntos). Los promedios se calculan utilizando el método deslizante, es decir, excluyendo gradualmente el primer nivel del período deslizante aceptado e incluyendo el siguiente. Con suavizado impar, la media aritmética resultante se asigna al centro del intervalo calculado.

“-” m-dics de suavizado por medias móviles consiste en la convención de determinar niveles suavizados para los puntos al principio y al final de la serie.

* La alineación analítica es la forma más eficaz de identificar la principal tendencia y desarrollo. En este caso, los niveles de la serie dinámica se expresan en función del tiempo: Yt=f(t)

El propósito del alineamiento analítico de una serie es determinar el valor analítico f(t). En la práctica, utilizando las series de tiempo existentes, establecen la forma y encuentran los parámetros de la función f(t), y luego analizan el comportamiento de las desviaciones de la tendencia.

En economía, a menudo se utiliza una función de la forma: Уi = а0 +∑ аi +ti

A partir de una función de la forma (3.12), la mayoría de las veces al nivelar se utiliza la función lineal /(*) = ao + a1 *t o la parabólica f(t) = a0 +att + a2 t2.

Los coeficientes ao,a,a2,...,ap en la fórmula se encuentran mediante mínimos cuadrados.

Según este método, para encontrar los parámetros de un polinomio de grado p, es necesario resolver un sistema de las llamadas ecuaciones normales:

nao+a1∑t=∑Y

ao∑t+ a1∑t*t= ∑Y*t.

La tendencia muestra cómo los factores sistemáticos influyen en la dinámica de la población. La fluctuación de niveles alrededor de la tendencia sirve como medida del impacto de factores residuales (aleatorios). Esta medida de impacto puede evaluarse

utilizando la fórmula de desviación estándar.

Conceptos básicos de análisis de correlación y regresión.

Se presentan en forma de series de distribución y se presentan en forma.

Una serie de distribución es uno de los tipos de agrupaciones.

Rango de distribución— representa una distribución ordenada de unidades de la población que se estudian en grupos según una determinada característica variable.

Dependiendo de la característica que subyace a la formación de la serie de distribución, se distinguen atributivo y variacional filas de distribución:

  • Atributivo- se denominan series de distribución construidas según características cualitativas.
  • Las series de distribución construidas en orden ascendente o descendente de valores de una característica cuantitativa se denominan variacional.
La serie de variación de la distribución consta de dos columnas:

La primera columna proporciona valores cuantitativos de la característica variable, que se denominan opciones y son designados. Opción discreta: expresada como un número entero. La opción de intervalo varía desde y hasta. Dependiendo del tipo de opciones, puede construir una serie de variación discreta o de intervalo.
La segunda columna contiene número de opción específica, expresado en términos de frecuencias o frecuencias:

Frecuencias- estos son números absolutos que muestran cuántas veces un valor dado de una característica ocurre en conjunto, que denotan . La suma de todas las frecuencias debe ser igual al número de unidades de toda la población.

Frecuencias() son frecuencias expresadas como porcentaje del total. La suma de todas las frecuencias expresadas como porcentajes debe ser igual al 100% en fracciones de uno.

Representación gráfica de series de distribución.

Las series de distribución se presentan visualmente mediante imágenes gráficas.

Las series de distribución se representan como:
  • Polígono
  • Histogramas
  • Acumula
  • ojivas

Polígono

Al construir un polígono, los valores de la característica variable se trazan en el eje horizontal (eje x) y las frecuencias o frecuencias se trazan en el eje vertical (eje y).

El polígono de la Fig. 6.1 se basa en datos del microcenso de población de Rusia de 1994.

6.1. Distribución del tamaño del hogar

Condición: Se proporcionan datos sobre la distribución de 25 empleados de una de las empresas según categorías arancelarias:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tarea: Construya una serie de variación discreta y represente gráficamente como un polígono de distribución.
Solución:
En este ejemplo, las opciones son el grado salarial del empleado. Para determinar las frecuencias es necesario calcular el número de empleados con la categoría arancelaria correspondiente.

El polígono se utiliza para series de variación discreta.

Para construir un polígono de distribución (Figura 1), trazamos los valores cuantitativos de las características variables (variantes) a lo largo del eje de abscisas (X) y las frecuencias o frecuencias a lo largo del eje de ordenadas.

Si los valores de una característica se expresan en forma de intervalos, entonces dicha serie se llama intervalo.
Serie de intervalos Las distribuciones se representan gráficamente en forma de histograma, acumulado u ojiva.

tabla estadistica

Condición: Se proporcionan datos sobre el tamaño de los depósitos de 20 personas en un banco (miles de rublos), 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tarea: Construya una serie de variación de intervalos con intervalos iguales.
Solución:

  1. La población inicial consta de 20 unidades (N = 20).
  2. Usando la fórmula de Sturgess, determinamos el número requerido de grupos utilizados: n=1+3.322*lg20=5
  3. Calculemos el valor del intervalo igual: i=(152 - 2) /5 = 30 mil rublos
  4. Dividamos la población inicial en 5 grupos con un intervalo de 30 mil rublos.
  5. Presentamos los resultados de la agrupación en la tabla:

Con tal registro de una característica continua, cuando el mismo valor ocurre dos veces (como el límite superior de un intervalo y el límite inferior de otro intervalo), entonces este valor pertenece al grupo donde este valor actúa como el límite superior.

gráfico de barras

Para construir un histograma, los valores de los límites de los intervalos se indican a lo largo del eje de abscisas y, en base a ellos, se construyen rectángulos, cuya altura es proporcional a las frecuencias (o frecuencias).

En la Fig. 6.2. muestra un histograma de la distribución de la población rusa en 1997 por grupo de edad.

Arroz. 6.2. Distribución de la población rusa por grupos de edad.

Condición: Se da la distribución de 30 empleados de la empresa por salario mensual

Tarea: Muestra gráficamente la serie de variación del intervalo en forma de histograma y acumula.
Solución:

  1. El límite desconocido del (primer) intervalo abierto está determinado por el valor del segundo intervalo: 7000 - 5000 = 2000 rublos. Con el mismo valor encontramos el límite inferior del primer intervalo: 5000 - 2000 = 3000 rublos.
  2. Para construir un histograma en un sistema de coordenadas rectangular, trazamos a lo largo del eje de abscisas los segmentos cuyos valores corresponden a los intervalos de la serie varicosa.
    Estos segmentos sirven como base inferior y la frecuencia correspondiente (frecuencia) sirve como altura de los rectángulos formados.
  3. Construyamos un histograma:

Para construir acumulados, es necesario calcular las frecuencias acumuladas (frecuencias). Se determinan sumando secuencialmente las frecuencias (frecuencias) de intervalos anteriores y se denominan S. Las frecuencias acumuladas muestran cuántas unidades de la población tienen un valor característico no mayor que el considerado.

Acumula

La distribución de una característica en una serie de variación sobre frecuencias acumuladas (frecuencias) se representa mediante un acumulado.

Acumula o una curva acumulativa, a diferencia de un polígono, se construye a partir de frecuencias o frecuencias acumuladas. En este caso, los valores de la característica se colocan en el eje de abscisas y las frecuencias o frecuencias acumuladas en el eje de ordenadas (Fig. 6.3).

Arroz. 6.3. Acumulados de distribución del tamaño de los hogares

4. Calculemos las frecuencias acumuladas:
La frecuencia acumulada del primer intervalo se calcula de la siguiente manera: 0 + 4 = 4, para el segundo: 4 + 12 = 16; para el tercero: 4 + 12 + 8 = 24, etc.

Al construir un acumulado, la frecuencia acumulada (frecuencia) del intervalo correspondiente se asigna a su límite superior:

Ogiva

Ogiva se construye de manera similar a un acumulado con la única diferencia de que las frecuencias acumuladas se colocan en el eje de abscisas y los valores característicos se colocan en el eje de ordenadas.

Un tipo de acumulación es una curva de concentración o diagrama de Lorentz. Para construir una curva de concentración, en ambos ejes del sistema de coordenadas rectangulares se traza una escala en porcentajes de 0 a 100. Al mismo tiempo, en el eje de abscisas se indican las frecuencias acumuladas y en el eje de abscisas se indican los valores acumulados de la participación. (en porcentaje) en volumen de la característica se indican en el eje de ordenadas.

La distribución uniforme de la característica corresponde a la diagonal del cuadrado en el gráfico (Fig. 6.4). Con una distribución desigual, el gráfico representa una curva cóncava dependiendo del nivel de concentración del rasgo.

6.4. Curva de concentración

Las series de distribución estadística son el tipo de agrupación más simple.

Serie de distribución estadística- se trata de una distribución cuantitativa ordenada de unidades de población en grupos homogéneos según una característica variable (atributiva o cuantitativa).

Dependiendo del signo, En la base de la formación de grupos, se hace una distinción entre series de distribución atributiva y variacional.

Atributivo se denominan series de distribución construidas según características cualitativas, es decir características que no tienen expresión numérica. Un ejemplo de serie de distribución de atributos es la distribución de la población económicamente activa de la Federación de Rusia por género en 2010 (cuadro 3.10).

Tabla 3.10. Distribución de la población económicamente activa de la Federación de Rusia por sexo en 2010

variacional se denominan series de distribución construidas sobre una base cuantitativa, es decir un signo que tiene una expresión numérica.

La serie de distribución variacional consta de dos elementos: opciones y frecuencias.

Opciones nombrar los valores individuales de una característica que toma en una serie de variación.

Frecuencias son los números de variantes individuales o de cada grupo de la serie de variaciones. Las frecuencias muestran con qué frecuencia ocurren ciertos valores de una característica en la población que se estudia. La suma de todas las frecuencias determina el tamaño de toda la población, su volumen.

Frecuencias Se llaman frecuencias expresadas en fracciones de una unidad o como porcentaje del total. En consecuencia, la suma de las frecuencias es igual a 1 o 100%.

Dependiendo de la naturaleza de la variación del rasgo. distinguir entre series de distribución de variación discreta y de intervalo.

Distribución de series de variación discreta - Se trata de una serie de distribución en la que los grupos se componen según una característica que cambia de forma discontinua, es decir a través de un cierto número de unidades, y aceptando sólo valores enteros. Por ejemplo, la distribución del número de apartamentos construidos en la Federación de Rusia por el número de habitaciones que contienen ¡I! 2010 (cuadro 3.11).

Tabla 3.11. Distribución del número de apartamentos construidos en la Federación de Rusia por el número de habitaciones en 2010.

Distribución de series de variación de intervalos - Se trata de una serie de distribución en la que la característica de agrupación que forma la base de la agrupación puede tomar cualquier valor en el intervalo que difiera entre sí en una cantidad arbitrariamente pequeña.

La construcción de series de variación de intervalo es aconsejable principalmente para la variación continua de una característica (Tabla 3.12), así como si la variación discreta de una característica se manifiesta en un amplio rango (Tabla 3.13), es decir el número de variantes de una característica discreta es bastante grande.

Tabla 3.12. Distribución de entidades constituyentes del Distrito Federal Sur de la Federación de Rusia por área al 1 de enero de 2011

Tabla 3.13. Distribución de entidades constituyentes del Distrito Federal Central de la Federación de Rusia por el número de instituciones educativas municipales al 1 de enero de 2011.

Las reglas para construir series de distribución son similares a las reglas para construir agrupaciones.

El análisis de las series de distribución se puede realizar visualmente a partir de su representación gráfica. Para ello se construye un polígono, un histograma y distribuciones.

Polígono Se utiliza al representar series de distribución de variación discreta. Para construirlo, en un sistema de coordenadas rectangular, los valores clasificados de la característica variable se trazan a lo largo del eje de abscisas en la misma escala, y a lo largo del eje de ordenadas se traza una escala para expresar la magnitud de las frecuencias. Obtenido en la intersección del eje de abscisas. (X) y los ejes de ordenadas (Y) están conectados por líneas rectas, lo que da como resultado una línea discontinua llamada polígono de frecuencias.

Histograma Se utiliza para representar una serie de variación de intervalo. Al construir un histograma, los valores de los intervalos se trazan en el eje de abscisas y las frecuencias se representan mediante rectángulos construidos en los intervalos correspondientes. La altura de las columnas debe ser proporcional a las frecuencias.

Un histograma se puede convertir en un polígono de distribución conectando los puntos medios de los lados superiores de los rectángulos con líneas rectas.

Al construir un histograma de la distribución de una serie de variación con intervalos desiguales, no son las frecuencias las que se trazan a lo largo del eje de ordenadas, sino la densidad de la distribución de la característica en los intervalos correspondientes. Densidad de distribución - es la frecuencia calculada por unidad de ancho de intervalo,

aquellos. cuántas unidades de cada grupo hay por unidad de valor de intervalo.

Se puede utilizar una curva acumulativa para mostrar gráficamente series de distribución de variación. Mediante el uso acumula representan una serie de frecuencias acumuladas. Las frecuencias acumuladas se determinan mediante suma secuencial de frecuencias en grupos.

Al construir los acumulados de la serie de variación de intervalos a lo largo del eje de abscisas (X) se trazan las variantes de la serie y, a lo largo del eje de ordenadas (Y), se encuentran las frecuencias acumuladas, que se trazan en el campo del gráfico en forma de perpendiculares al eje de abscisas en los límites superiores de los intervalos. Luego se conectan estas perpendiculares y se obtiene una línea discontinua, es decir recoger en montón.

Si, al representar gráficamente una serie variacional de distribuciones en forma de acumulados del eje X y tú cambias de lugar, resulta ogiva.