La solución es probar las reglas de tres sigma. Distribución normal de una variable aleatoria y la regla de las tres sigma

1. La regla de tres sigma es que casi todos los resultados que componen una muestra distribuida normalmente están dentro de . Esta regla se puede utilizar para resolver los siguientes problemas importantes:

1) Estimaciones de la normalidad de la distribución de datos muestrales. Si los resultados están aproximadamente dentro
y en el área de la media aritmética los resultados ocurren con más frecuencia, y a la derecha y a la izquierda, con menos frecuencia, entonces podemos suponer que los resultados se distribuyen normalmente.

2) Identificación de resultados obtenidos erróneamente. Si los resultados individuales se desvían de la media aritmética en valores que exceden significativamente 3, es necesario verificar la exactitud de los valores obtenidos. A menudo, estos resultados "aparecidos" pueden aparecer como resultado de un mal funcionamiento del dispositivo, errores en las mediciones y cálculos.

3) Estimación del valor de . Si el rango de variación R=X max - X max se divide por 6, obtenemos un valor aproximado de .

2. La prueba W de Shapiro y Wilk está diseñada para probar la hipótesis de una distribución poblacional normal cuando el tamaño de la muestra es pequeño ( norte≤ 50). El procedimiento de verificación es el siguiente: se plantea una hipótesis nula sobre la distribución normal de la población. El valor observado del criterio de Shapiro y Wilk W obs se calcula y se compara con el valor crítico W crit, que se encuentra en la tabla de puntos críticos del criterio de Shapiro y Wilk dependiendo del tamaño de la muestra y el nivel de significancia. Si W obs ≥ W crit, se acepta la hipótesis nula de distribución normal de resultados; en Wobs.< W крит она отвергается.

1. ¿Qué es la regla de las tres sigma?

2. Aplicación práctica de la regla de las tres sigma.

3. ¿Qué criterio se utiliza para comprobar la normalidad de la distribución de la población con un tamaño de muestra pequeño?

4. Describe el procedimiento para probar la normalidad de una distribución.

Literatura:

1. Fundamentos de estadística matemática. Uh. manual para el Instituto de Cultura Física (bajo la dirección general de V.S. Ivanov). – M.: Cultura física y deporte, 1990. – P. 62 – 63, 110 – 112.

2. Rukavitsyna S.L., Volkov Yu.O., Soltanovich L.L. Metrología deportiva. Probar la eficacia de los métodos de entrenamiento utilizando métodos de estadística matemática. Taller para estudiantes de BSUPC. – Minsk: BGUFK, 2006. – P. 66 – 67.

3. Ginzburg G.I., Kiselev V.G. Trabajos de cálculo y gráficos sobre metrología deportiva. – Minsk: BGOIFK, 1984. – P. 21 – 22, 26 – 29.

CONFERENCIA 7.

Sujeto: Relación entre los resultados de la medición. Métodos para calcular coeficientes de correlación.

Preguntas a considerar:

1. Tipos de relaciones.

2. Las principales tareas del análisis de correlación.

3. Coeficiente de correlación y sus propiedades.

4. Métodos para calcular los coeficientes de correlación.

1. En la investigación deportiva, a menudo se encuentra una relación entre los indicadores estudiados. Su apariencia varía. Por ejemplo, la determinación de la aceleración basada en datos de velocidad conocidos en biomecánica, la ley de Fechner en psicología, la ley de Hill en fisiología y otros caracterizan la llamada dependencia funcional, o relación en la que cada valor de un indicador corresponde a un valor estrictamente definido de otro.

Otro tipo de relación incluye, por ejemplo, la dependencia del peso de la longitud corporal. Un valor de longitud corporal puede corresponder a varios valores de peso y viceversa. En tales casos, cuando un valor de un indicador corresponde a varios valores de otro, la relación se denomina estadística.

Se presta mucha atención al estudio de la relación estadística entre diversos indicadores en la investigación deportiva, ya que esto permite identificar algunos patrones y posteriormente describirlos tanto verbal como matemáticamente con el fin de utilizarlos en el trabajo práctico de un entrenador y profesor. .

Entre las relaciones estadísticas, las más importantes son correlacional. La correlación es que el valor promedio de un indicador cambia dependiendo del valor de otro.

2. El método estadístico utilizado para estudiar las relaciones se llama análisis de correlación. Su principal tarea es determinar la forma, cercanía y dirección de la relación entre los indicadores en estudio. El análisis de correlación le permite explorar sólo relaciones estadísticas. Se utiliza ampliamente en teoría de pruebas para evaluar su confiabilidad y contenido de información. Diferentes escalas de medición requieren diferentes tipos de análisis de correlación.

El análisis de relaciones comienza con una representación gráfica de los resultados de la medición en un sistema de coordenadas rectangular. Se construye un gráfico con los resultados X en el eje de abscisas y los resultados Y en el eje de ordenadas. Por lo tanto, cada par de resultados en un sistema de coordenadas rectangular se mostrará como un punto. El conjunto de puntos resultante está delimitado por una curva cerrada.

Esta relación gráfica se llama diagrama de dispersión o campo de correlación. El análisis visual del gráfico le permite identificar la forma de dependencia (al menos hacer una suposición). Si la forma del campo de correlación es cercana a una elipse, esta forma de relación se denomina dependencia lineal o forma lineal de relación.

Sin embargo, en la práctica se puede encontrar otra forma de relación. La dependencia obtenida experimentalmente para los servicios de tenis es característica de no lineal formas de relación o dependencia no lineal.

Por tanto, el análisis visual del campo de correlación nos permite identificar la forma de la dependencia estadística: lineal o no lineal. Esto tiene implicaciones importantes para el siguiente paso del análisis: seleccionar y calcular el coeficiente de correlación apropiado.

3. Si las mediciones se realizan en una escala de razón o intervalo y se observa una forma lineal de relación, se utiliza el coeficiente de correlación de Bravais-Pearson para cuantificar la fuerza de la relación. Denotado por la letra r. Calculado por la fórmula:

,

Dónde Y – valores medios aritméticos de los indicadores xey; σ x y σ y – desviaciones estándar; n – número de mediciones (sujetos).

Sus propiedades:

1) Los valores de r pueden variar de –1 a 1.

2) En el caso de r=-1 y r=1, la relación es funcional, negativa y positiva, respectivamente.

3) Cuando r=0, no se establece una relación lineal, pero sí se puede observar una relación de diferente forma.

4) en r<0 взаимосвязь отрицательная, при r>0 – positivo.

Para evaluar la cercanía de la relación en el análisis de correlación, se utiliza el valor (valor absoluto) del coeficiente de correlación. El valor absoluto de cualquier coeficiente de correlación se encuentra en el rango de 0 a 1. El valor de este coeficiente se explica (interpreta) de la siguiente manera:

coeficiente de correlación es 1,00 (relación funcional, ya que el valor de un indicador corresponde sólo a un valor de otro indicador);

coeficiente de correlación es 0,990,7 (relación estadística fuerte);

coeficiente de correlación es 0,690,5 (relación estadística promedio);

coeficiente de correlación es 0,490,2 (relación estadística débil);

coeficiente de correlación es 0,190,01 (relación estadística muy débil);

El coeficiente de correlación es 0,00 (sin correlación).

4. Antes de iniciar el procedimiento mecánico para calcular el coeficiente de correlación, es necesario responder algunas preguntas:

1) ¿En qué escala se mide el indicador en estudio?

2) ¿Cuántas mediciones de este indicador se han realizado?

Las respuestas a estas preguntas determinan qué coeficiente de correlación se calculará.

En particular, cuando las mediciones se realizan en una escala de intervalo o de razón, se calcula el coeficiente de correlación de Bravais-Pearson para evaluar la fuerza de la relación; en la escala de rango, se calcula el coeficiente de correlación de rango de Spearman; y en la escala de denominación, cuando la característica de interés varía alternativamente, se utiliza el coeficiente de contingencia tetracórico.

El coeficiente de correlación de rangos de Spearman se calcula mediante la fórmula:

,

Dónde d= d X - d y– la diferencia de clasificación de un par determinado de indicadores X e Y; norte – tamaño de la muestra.

Se aplica cuando los indicadores se miden en una escala de nombres (es decir, se les asignan números, pero no se puede decir que uno sea mayor que el otro), y los indicadores varían alternativamente (género masculino/femenino, finalización o fracaso de una tarea, etc.). de lo contrario, hay dos estados: 0 y 1).

Se denomina T 4 y se calcula mediante la fórmula:

,

donde A es el valor que corresponde al número de sujetos (intentos) que coinciden con ambos indicadores X e Y, es decir 1 y 1; B – valor que corresponde al número de coincidencias 0 – X y 1 – Y; C – valor correspondiente al número de coincidencias 1 – X y 0 – Y; D – valor de las coincidencias 0 y 0; norte – tamaño de la muestra.

Preguntas de prueba para el autoexamen:

1. Relación funcional. Definición y ejemplos.

2. Relación estadística. Definición y ejemplos. Relación de correlación.

3. Principales tareas del análisis de correlación.

4. Campo de correlación. Orden de construcción, análisis de imágenes.

6. Coeficiente de correlación de Bravais-Pearson y sus propiedades.

7. Reglas para elegir el coeficiente de relación.

Literatura:

1. Fundamentos de estadística matemática. Uh. manual para el Instituto de Cultura Física (bajo la dirección general de V.S. Ivanov). – M.: Cultura física y deporte, 1990. – P. 124 – 126, 142 – 150, 155 – 162.

2. Rukavitsyna S.L., Volkov Yu.O., Soltanovich L.L. Metrología deportiva. Probar la eficacia de los métodos de entrenamiento utilizando métodos de estadística matemática. Taller para estudiantes de BSUPC. – Minsk: BGUFK, 2006. – P. 42 – 48.

3. Ginzburg G.I., Kiselev V.G. Trabajos de cálculo y gráficos sobre metrología deportiva. – Minsk: BGOIFK, 1984. – P. 51 – 60.

CONFERENCIA 8.

Sujeto: Hipótesis estadísticas y fiabilidad de las características estadísticas. Prueba de hipótesis estadísticas.

De este artículo aprenderás:

    Qué ha pasado intervalo de confianza?

    Cuál es el punto de reglas 3 sigma?

    ¿Cómo puedes aplicar este conocimiento en la práctica?

Hoy en día, debido a la sobreabundancia de información asociada a una gran variedad de productos, direcciones de venta, empleados, áreas de actividad, etc., puede ser difícil resaltar lo principal, a lo que, en primer lugar, vale la pena prestar atención y esforzarse en gestionar. Definición intervalo de confianza y análisis de valores reales que van más allá de sus límites, una técnica que te ayudará a resaltar situaciones, influyendo en las tendencias cambiantes. Podrás desarrollar factores positivos y reducir la influencia de los negativos. Esta tecnología se utiliza en muchas empresas mundiales de renombre.

Existen los llamados " alertas", cual informar a los gerentes que el siguiente valor está en una determinada dirección Fue mas alla intervalo de confianza. ¿Qué quiere decir esto? Esta es una señal de que ha ocurrido algún evento inusual que puede cambiar la tendencia existente en esta dirección. Esta es una señal a ese para averiguarlo en la situación y comprender qué influyó en ella.

Por ejemplo, considere varias situaciones. Calculamos el pronóstico de ventas con límites de pronóstico para 100 artículos para 2011 por mes y las ventas reales en marzo:

  1. Por " Aceite de girasol» superó el límite superior del pronóstico y no cayó en el intervalo de confianza.
  2. Para la “levadura seca” superamos el límite inferior del pronóstico.
  3. Las “gachas de avena” han superado el límite superior.

Para otros productos, las ventas reales estuvieron dentro de los límites previstos. Aquellos. sus ventas estuvieron dentro de las expectativas. Entonces, identificamos 3 productos que traspasaron las fronteras y comenzamos a descubrir qué los influyó para traspasar las fronteras:

  1. Para el Aceite de Girasol ingresamos a una nueva red de distribución, lo que nos dio un volumen de ventas adicional, lo que nos llevó a superar el límite superior. Para este producto conviene recalcular la previsión hasta final de año, teniendo en cuenta la previsión de ventas de esta red.
  2. Para "levadura seca", el automóvil se quedó atascado en la aduana y hubo escasez en 5 días, lo que afectó la disminución de las ventas y superó el límite inferior. Quizás valga la pena averiguar qué lo causó y tratar de no repetir esta situación.
  3. Se lanzó un evento de promoción de ventas de Gachas de Avena, que generó un aumento significativo en las ventas y llevó a la empresa a superar las expectativas.

Identificamos 3 factores que influyeron en la superación de los límites previstos. En la vida puede haber muchos más. Para aumentar la precisión de las previsiones y la planificación, factores que llevan a que las ventas reales puedan ir más allá de las previsiones, conviene resaltar y elaborar previsiones y planes para ellos por separado. Y luego considere su impacto en el pronóstico de ventas principal. También puede evaluar periódicamente el impacto de estos factores y mejorar la situación. reduciendo la influencia de los factores negativos y aumentando la influencia de los positivos.

Con un intervalo de confianza podemos:

  1. Seleccionar direcciones, a los que vale la pena prestar atención, porque En estas direcciones han ocurrido acontecimientos que pueden afectar cambio de tendencia.
  2. Identificar factores, que realmente influyen en el cambio de situación.
  3. Aceptar decisión informada(por ejemplo, sobre compras, planificación, etc.).

Ahora veamos qué es un intervalo de confianza y cómo calcularlo en Excel usando un ejemplo.

¿Qué es un intervalo de confianza?

El intervalo de confianza son los límites del pronóstico (superior e inferior), dentro de los cuales con una probabilidad dada (sigma) Aparecerán los valores reales.

Aquellos. Calculamos el pronóstico: esta es nuestra pauta principal, pero entendemos que es poco probable que los valores reales sean 100% iguales a nuestro pronóstico. Y surge la pregunta, dentro de qué límites los valores reales pueden caer, si la tendencia actual continúa? Y esta pregunta nos ayudará a responder. cálculo del intervalo de confianza, es decir. - límites superior e inferior del pronóstico.

¿Qué es una probabilidad sigma dada?

Al calcular intervalo de confianza podemos establecer probabilidad golpes valores actuales dentro de los límites previstos dados. ¿Cómo hacerlo? Para ello fijamos el valor de sigma y, si sigma es igual a:

    3sigma- entonces, la probabilidad de que el siguiente valor real caiga dentro del intervalo de confianza será del 99,7%, o 300 a 1, o hay una probabilidad del 0,3% de ir más allá de los límites.

    2sigma- entonces, la probabilidad de que el siguiente valor caiga dentro de los límites es ≈ 95,5%, es decir las probabilidades son de aproximadamente 20 a 1, o hay un 4,5% de posibilidades de exagerar.

    1 sigma- entonces la probabilidad es ≈ 68,3%, es decir las probabilidades son aproximadamente de 2 a 1, o hay un 31,7% de posibilidades de que el siguiente valor quede fuera del intervalo de confianza.

Nosotros formulamos regla 3 sigma,que dice que probabilidad de acierto otro valor aleatorio en el intervalo de confianza con un valor dado tres sigma es 99,7%.

El gran matemático ruso Chebyshev demostró el teorema de que existe un 10% de probabilidad de ir más allá de los límites previstos con un valor dado de tres sigma. Aquellos. la probabilidad de caer dentro del intervalo de confianza de 3 sigma será de al menos el 90%, mientras que un intento de calcular el pronóstico y sus límites "a simple vista" está plagado de errores mucho más importantes.

¿Cómo calcular usted mismo un intervalo de confianza en Excel?

Veamos el cálculo del intervalo de confianza en Excel (es decir, los límites superior e inferior del pronóstico) usando un ejemplo. Tenemos una serie de tiempo: ventas mensuales durante 5 años. Ver archivo adjunto.

Para calcular los límites de previsión, calculamos:

  1. Pronóstico de ventas().
  2. Sigma - desviación estándar modelos de pronóstico a partir de valores reales.
  3. Tres sigma.
  4. Intervalo de confianza.

1. Previsión de ventas.

=(CR[-14] (datos de series de tiempo)-RC[-1] (valor del modelo))^2(al cuadrado)


3. Para cada mes, resumamos los valores de desviación de la etapa 8 Sum((Xi-Ximod)^2), es decir Resumamos enero, febrero... de cada año.

Para hacer esto, use la fórmula =SUMAR.SI()

SUMAR.SI(matriz con números de período dentro del ciclo (para los meses del 1 al 12); enlace al número de período en el ciclo; enlace a una matriz con cuadrados de la diferencia entre los datos de origen y los valores del período)


4. Calcule la desviación estándar para cada período del ciclo del 1 al 12 (etapa 10 en el archivo adjunto).

Para hacer esto, extraemos la raíz del valor calculado en la etapa 9 y la dividimos por el número de períodos en este ciclo menos 1 = SQRT((Sum(Xi-Ximod)^2/(n-1))

Usemos las fórmulas en Excel =ROOT(R8 (enlace a (Suma(Xi-Ximod)^2)/(CONTAR.SI($O$8:$O$67 (enlace a matriz con números de ciclo); O8 (enlace a un número de ciclo específico que contamos en la matriz))-1))

Usando la fórmula de Excel = CONTAR.SI contamos el número n


Habiendo calculado la desviación estándar de los datos reales del modelo de pronóstico, obtuvimos el valor sigma para cada mes - etapa 10 en el archivo adjunto .

3. Calculemos 3 sigma.

En la etapa 11 establecemos el número de sigmas; en nuestro ejemplo, "3" (etapa 11 en el archivo adjunto):

También es conveniente para practicar los valores sigma:

1,64 sigma: 10% de probabilidad de exceder el límite (1 probabilidad entre 10);

1,96 sigma: 5% de posibilidades de traspasar los límites (1 posibilidad entre 20);

2,6 sigma: 1% de probabilidad de exceder los límites (1 probabilidad entre 100).

5) Calculando tres sigma, para ello multiplicamos los valores “sigma” de cada mes por “3”.

3. Determine el intervalo de confianza.

  1. Límite superior de pronóstico- previsión de ventas teniendo en cuenta el crecimiento y la estacionalidad + (más) 3 sigma;
  2. Límite inferior de pronóstico- previsión de ventas teniendo en cuenta el crecimiento y la estacionalidad – (menos) 3 sigma;

Para facilitar el cálculo del intervalo de confianza para un período prolongado (ver archivo adjunto), utilizaremos la fórmula de Excel =Y8+BUSCARV(W8,$U$8:$V$19,2,0), Dónde

Y8- pronóstico de ventas;

W8- el número del mes para el cual tomaremos el valor 3 sigma;

Aquellos. Límite superior de pronóstico= “pronóstico de ventas” + “3 sigma” (en el ejemplo, BUSCARV(número de mes; tabla con valores de 3 sigma; columna de la que extraemos el valor de sigma igual al número de mes en la fila correspondiente; 0)).

Límite inferior de pronóstico= “pronóstico de ventas” menos “3 sigma”.

Entonces, calculamos el intervalo de confianza en Excel.

Ahora tenemos un pronóstico y un rango con límites dentro de los cuales caerán los valores reales con una probabilidad sigma determinada.

En este artículo, analizamos qué son sigma y la regla de tres sigma, cómo determinar un intervalo de confianza y por qué se puede utilizar esta técnica en la práctica.

¡Le deseamos pronósticos precisos y éxito!

Cómo Forecast4AC PRO puede ayudarteal calcular el intervalo de confianza?:

    Forecast4AC PRO calculará automáticamente los límites superiores o inferiores del pronóstico para más de 1000 series temporales simultáneamente;

    La capacidad de analizar los límites del pronóstico en comparación con el pronóstico, la tendencia y las ventas reales en el gráfico con solo presionar una tecla;

En el programa Forcast4AC PRO es posible configurar el valor sigma de 1 a 3.

¡Únete a nosotros!

Descargue aplicaciones gratuitas de previsión y análisis empresarial:


  • Novo Pronóstico Lite- automático cálculo de pronóstico V Sobresalir.
  • 4análisis - Análisis ABC-XYZ y análisis de emisiones Sobresalir.
  • Sentido Qlik Escritorio y QlikViewEdición Personal - Sistemas BI para análisis y visualización de datos.

Pruebe las capacidades de las soluciones pagas:

  • Novo Pronóstico PRO- previsión en Excel para grandes conjuntos de datos.

Encontremos la probabilidad de que una variable aleatoria distribuida normalmente tome un valor del intervalo ( A - 3σ, un + 3σ ):

Por lo tanto, la probabilidad de que el valor de una variable aleatoria sea afuera de este intervalo es igual a 0,0027, es decir, 0,27% y puede considerarse insignificante. Por lo tanto, en la práctica se puede suponer que Todo valores posibles de una distribución normal variable aleatoria se encuentran en el intervalo ( A - 3σ, un + 3σ ).

El resultado obtenido nos permite formular regla tres sigma: Si una variable aleatoria tiene una distribución normal, entonces el módulo de su desviación de x = a no excede 3σ.

16.7. Distribución exponencial.

Definición. Exponencial se llama distribución de probabilidad de una variable aleatoria continua X, que se describe por la densidad

A diferencia de la distribución normal, la ley exponencial está determinada por un solo parámetro λ . Ésta es su ventaja, ya que normalmente los parámetros de distribución no se conocen de antemano y hay que estimarlos de forma aproximada. Está claro que es más fácil evaluar un parámetro que varios.

Encontremos la función de distribución de la ley exponencial:

Por eso,

Ahora podemos encontrar la probabilidad de que una variable aleatoria distribuida exponencialmente caiga en el intervalo ( A,b):

Valores de función mi -X se puede encontrar en las tablas.

16.8. Función de confiabilidad.

Dejar elemento(es decir, algún dispositivo) comienza a funcionar en el momento t 0 = 0 y debería funcionar durante un período de tiempo. t. Denotemos por t variable aleatoria continua: el tiempo de funcionamiento sin fallos del elemento, luego la función F(t) = pag(t > t) determina la probabilidad de falla a lo largo del tiempo t. Por lo tanto, la probabilidad de funcionamiento sin fallas durante el mismo tiempo es igual a

R(t) = pag(t > t) = 1 – F(t).

Esta función se llama función de confiabilidad.

16.9. La ley exponencial de la confiabilidad.

A menudo, la duración del funcionamiento sin fallos de un elemento tiene una distribución exponencial, es decir

F(t) = 1 – mi - λt .

Por tanto, la función de confiabilidad en este caso tiene la forma:

R(t) = 1 – F(t) = 1 – (1 – mi -λt) = mi -λt .

Definición. La ley exponencial de la confiabilidad. llamar a la función de confiabilidad definida por la igualdad

R(t) = mi - λt ,

Dónde λ - tasa de fracaso.

Ejemplo. Supongamos que el tiempo de funcionamiento sin fallos de un elemento se distribuya según una ley exponencial con una densidad de distribución. F(t) = 0,1 mi - 0,1 t en t≥ 0. Encuentre la probabilidad de que el elemento funcione sin fallas durante 10 horas.

Solución. Porque λ = 0,1, R(10) = mi-0,1 10 = mi -1 = 0,368.

16.10. Valor esperado.

Definición. Expectativa matemática Una variable aleatoria discreta es la suma de los productos de sus posibles valores y sus correspondientes probabilidades:

METRO(X) = X 1 R 1 + X 2 R 2 + … + X PAG R PAG .

Si el número de valores posibles de una variable aleatoria es infinito, entonces
, si la serie resultante converge absolutamente.

Nota 1. La expectativa matemática a veces se llama peso promedio, ya que es aproximadamente igual a la media aritmética de los valores observados de la variable aleatoria durante una gran cantidad de experimentos.

Nota 2. De la definición de expectativa matemática se deduce que su valor no es menor que el valor más pequeño posible de una variable aleatoria y no mayor que el mayor.

Nota 3. La expectativa matemática de una variable aleatoria discreta es no aleatorio(constante. Más adelante veremos que lo mismo ocurre con las variables aleatorias continuas.

Ejemplo. Encontremos la expectativa matemática de una variable aleatoria. X– el número de piezas estándar entre tres seleccionadas de un lote de 10 piezas, incluidas 2 defectuosas. Creemos una serie de distribución para X. De las condiciones del problema se deduce que X puede tomar valores 1, 2, 3. Entonces

Ejemplo 2. Determinar la expectativa matemática de una variable aleatoria. X– el número de lanzamientos de moneda antes de la primera aparición del escudo de armas. Esta cantidad puede tomar un número infinito de valores (el conjunto de valores posibles es el conjunto números naturales). Su serie de distribución tiene la forma:

(0,5) PAG

+ (durante el cálculo, se utilizó dos veces la fórmula para la suma de una progresión geométrica infinitamente decreciente:
, dónde).

Propiedades de la expectativa matemática.

    La expectativa matemática de una constante es igual a la constante misma:

METRO(CON) = CON.

Prueba. Si consideramos CON como una variable aleatoria discreta que toma un solo valor CON con probabilidad R= 1, entonces METRO(CON) = CON·1 = CON.

    El factor constante se puede sacar del signo de expectativa matemática:

METRO(CX) = CM(X).

Prueba. Si la variable aleatoria X dado por series de distribución

X i

X norte

pag i

pag norte

luego la serie de distribución para CX tiene la forma:

CONX i

CONX 1

CONX 2

CONX norte

pag i

pag norte

Entonces METRO(CX) = cx 1 R 1 + cx 2 R 2 + … + cx PAG R PAG = CON(X 1 R 1 + X 2 R 2 + … + X PAG R PAG) = CM(X).

Definición. Dos variables aleatorias se llaman independiente, si la ley de distribución de uno de ellos no depende de qué valores haya tomado el otro. De lo contrario, las variables aleatorias dependiente.

Definición. Llamemos producto de variables aleatorias independientesX YY variable aleatoria XY, cuyos valores posibles son iguales a los productos de todos los valores posibles X para todos los valores posibles Y, y las probabilidades correspondientes son iguales a los productos de las probabilidades de los factores.

    La expectativa matemática del producto de dos variables aleatorias independientes es igual al producto de sus expectativas matemáticas:

METRO(XY) = METRO(X)METRO(Y).

Prueba. Para simplificar los cálculos, nos limitaremos al caso en el que X Y Y tomar sólo dos valores posibles:

X i

pag i

en i

gramo i

Entonces la serie de distribución para XY tiene este aspecto:

XY

X 1 y 1

X 2 y 1

X 1 y 2

X 2 y 2

pag 1 gramo 1

pag 2 gramo 1

pag 1 gramo 2

pag 2 gramo 2

Por eso, METRO(XY) = X 1 y 1 · pag 1 gramo 1 + X 2 y 1 · pag 2 gramo 1 + X 1 y 2 · pag 1 gramo 2 + X 2 y 2 · pag 2 gramo 2 = y 1 gramo 1 (X 1 pag 1 + X 2 pag 2) + + y 2 gramo 2 (X 1 pag 1 + X 2 pag 2) = (y 1 gramo 1 + y 2 gramo 2) (X 1 pag 1 + X 2 pag 2) = METRO(XMETRO(Y).

Nota 1. De manera similar, puede demostrar esta propiedad para un mayor número de valores posibles de los factores.

Nota 2. La propiedad 3 es cierta para el producto de cualquier número de variables aleatorias independientes, lo cual se demuestra mediante inducción matemática.

Definición. definamos suma de variables aleatoriasX YY como una variable aleatoria X+Y, cuyos valores posibles son iguales a las sumas de cada valor posible X con todos los valores posibles Y; las probabilidades de tales sumas son iguales a los productos de las probabilidades de los términos (para variables aleatorias dependientes, los productos de la probabilidad de un término por la probabilidad condicional del segundo).

4) La expectativa matemática de la suma de dos variables aleatorias (dependientes o independientes) es igual a la suma de las expectativas matemáticas de los términos:

METRO (X + Y) = METRO (X) + METRO (Y).

Prueba.

Consideremos nuevamente las variables aleatorias definidas por la serie de distribución dada en la prueba de la propiedad 3. Entonces los valores posibles X + Y son X 1 + en 1 , X 1 + en 2 , X 2 + en 1 , X 2 + en 2. Denotemos sus probabilidades respectivamente como R 11 , R 12 , R 21 y R 22. Lo encontraremos METRO(X+Y) = (X 1 + y 1)pag 11 + (X 1 + y 2)pag 12 + (X 2 + y 1)pag 21 + (X 2 + y 2)pag 22 =

= X 1 (pag 11 + pag 12) + X 2 (pag 21 + pag 22) + y 1 (pag 11 + pag 21) + y 2 (pag 12 + pag 22).

Probemos que R 11 + R 22 = R 1 . En efecto, el evento que X + Y tomará valores X 1 + en 1 o X 1 + en 2 y cuya probabilidad es R 11 + R 22 coincide con el evento que X = X 1 (su probabilidad es R 1). Se demuestra de manera similar que pag 21 + pag 22 = R 2 , pag 11 + pag 21 = gramo 1 , pag 12 + pag 22 = gramo 2. Medio,

METRO(X + Y) = X 1 pag 1 + X 2 pag 2 + y 1 gramo 1 + y 2 gramo 2 = METRO (X) + METRO (Y).

Comentario. De la propiedad 4 se deduce que la suma de cualquier número de variables aleatorias es igual a la suma de las expectativas matemáticas de los términos.

Ejemplo. Encuentra la expectativa matemática de la suma del número de puntos obtenidos al lanzar cinco dados.

Encontremos la expectativa matemática del número de puntos obtenidos al lanzar un dado:

METRO(X 1) = (1 + 2 + 3 + 4 + 5 + 6)
El mismo número es igual a la expectativa matemática del número de puntos obtenidos en cualquier dado. Por lo tanto, por propiedad 4 METRO(X)=

Variable aleatoria. La desviación estándar se utiliza en los cálculos. Error estándar media aritmética, al construir intervalos de confianza, al probar estadísticamente hipótesis, al medir una relación lineal entre variables aleatorias.

¿Dónde está el estándar? Desviación Estándar, estimación insesgada de la desviación estándar de la variable aleatoria X con respecto a su expectativa matemática; - dispersión; - i-ésimo elemento muestras; - media aritmética de la muestra; - tamaño de la muestra.

Cabe señalar que el estándar difiere (en el denominador norte− 1 ) desde la raíz de la varianza (desviación estándar) (en el denominador norte), con un tamaño de muestra pequeño, la estimación de la varianza hasta el último valor está algo sesgada; con un tamaño de muestra infinitamente grande, la diferencia entre los valores indicados desaparece. Una muestra es sólo una parte de la población. La totalidad son absolutamente todos los resultados posibles. En principio, es absolutamente imposible obtener un resultado que no esté incluido en la población general. Para el caso de lanzar una moneda al aire, la población general es: cruz, arista, cara. pero el par cara-cruz es sólo una selección. Para la población general, la expectativa matemática coincide con el valor real del parámetro estimado. Pero para la muestra esto no es un hecho. La expectativa matemática de la muestra tiene un sesgo con respecto al valor real del parámetro. Debido a esto, la raíz del error cuadrático medio es mayor que la dispersión, ya que la dispersión es la expectativa matemática de la desviación al cuadrado del valor promedio y la desviación estándar es la expectativa matemática de la desviación del valor real. La diferencia es de lo que buscamos una desviación, cuando es dispersión, entonces del promedio y no importa si es un promedio verdadero o un error, pero cuando es una desviación estándar, entonces buscamos una desviación del valor real.

regla 3 sigma(): casi todos los valores de una variable aleatoria distribuida normalmente se encuentran en el intervalo. Más estrictamente, con al menos un 99,7% de confianza, el valor de una variable aleatoria distribuida normalmente se encuentra en el intervalo especificado. Siempre que el valor sea verdadero y no se obtenga como resultado del procesamiento de la muestra. Si se desconoce el valor verdadero, entonces no se debe utilizar σ, sino s. Así, la regla de 3 sigma se transforma en la regla de tres. s


Fundación Wikimedia. 2010.

Vea qué es la “Regla Tres Sigma” en otros diccionarios:

    La dispersión de una variable aleatoria es una medida de la dispersión de una variable aleatoria dada, es decir, su desviación de la expectativa matemática. Se designa D[X] en la literatura rusa y (variación inglesa) en la literatura extranjera. En estadística, la designación o se utiliza a menudo... ... Wikipedia

    - (inglés six sigma) un concepto de gestión de producción desarrollado en Motorola Corporation en la década de 1980 y popularizado a mediados de la década de 1990 después de que Jack Welch lo utilizara como estrategia clave en General Electric. La esencia... ... Wikipedia

    - (sinónimos: desviación estándar, desviación cuadrada; términos relacionados: desviación estándar, dispersión estándar) en teoría de probabilidad y estadística, el indicador más común de la dispersión de los valores de una variable aleatoria ... Wikipedia

    La desviación estándar (a veces desviación estándar) en la teoría de la probabilidad y la estadística es el indicador más común de la dispersión de los valores de una variable aleatoria en relación con su expectativa matemática. Medido en unidades... ... Wikipedia

    Densidad de probabilidad Línea verde ... Wikipedia

    SISTEMA NERVIOSO- SISTEMA NERVIOSO. Contenidos: I. Embriogénesis, histogénesis y filogenia N.s. . 518II. Anatomía de N. pág................. 524 III. Fisiología N. p................. 525 IV. Patología N.s................. 54? I. Embriogénesis, histogénesis y filogenia N. e.... ... Gran enciclopedia médica

    El grupo de esponjas más numeroso. Se trata principalmente de formas elásticas suaves. Su esqueleto está formado por espinas uniaxiales. Siempre hay una cierta cantidad de esponja, con la ayuda de la cual las agujas se pegan formando haces o fibras... Enciclopedia biológica

    En medicina, conjunto de métodos para el estudio y análisis cuantitativo del estado y (o) comportamiento de objetos y sistemas relacionados con la medicina y la atención sanitaria. En biología, medicina y atención sanitaria, la gama de fenómenos estudiados utilizando M.M. incluye... ... Enciclopedia médica

    Contenidos 1 Gestión basada actividad económica 2 Desarrollo de una situación empresarial 3 ... Wikipedia

    Este artículo debería ser wikificado. Formatéelo de acuerdo con las reglas de formato del artículo. El costeo basado en actividades (ABC) es un modelo especial de descripción de costos que identifica el trabajo de una empresa... Wikipedia

Al realizar cálculos prácticos, la desviación estándar a se toma como unidad de medida para la desviación de una variable aleatoria sujeta a la ley normal desde su centro de dispersión (expectativa matemática). Entonces, basándose en la fórmula (7) del § 17, es útil varios cálculos igualdad

Estos resultados se representan geométricamente en la Fig. 439.

Es casi seguro que la variable aleatoria (error) no se desviará de la expectativa matemática en valor absoluto más que este supuesto, que se denomina regla de tres sigma.

En la teoría de tiro y al procesar diversos materiales estadísticos, puede resultar útil conocer la probabilidad de que una variable aleatoria caiga en los intervalos (0, E),

Con la densidad de distribución determinada por la fórmula (1) § 19. El conocimiento de estas probabilidades en muchos casos reduce los cálculos y ayuda en el análisis de los fenómenos.

Al calcular estas probabilidades, usaremos la fórmula (8) § 19 y la tabla de funciones.

Los resultados de los cálculos se muestran geométricamente en la Fig. 440, que se denomina escala de dispersión de errores. De estos cálculos se deduce que es casi seguro que el valor de una variable aleatoria cae dentro del intervalo. La probabilidad de que el valor de una variable aleatoria quede fuera de este intervalo es menor que 0,01.

Ejemplo 1. Se dispara un tiro a lo largo de una franja de 100 m de ancho, la puntería se calculó sobre la línea central de la franja, que es perpendicular al plano de vuelo del proyectil. La dispersión obedece a la ley normal con una probable desviación del alcance. Determine la probabilidad de golpear la banda (Fig. 441). En la teoría del tiro, la desviación media del alcance se denomina lateral.

Solución. Usemos la fórmula (7) § 19. En nuestro caso. Por eso,

Comentario. Sería posible resolver aproximadamente el problema sin utilizar tablas de funciones, sino utilizando la escala de dispersión (Fig. 440).