La decisión de verificar las reglas de Three Sigma. La distribución normal de una variable aleatoria y la regla de tres sigma

1. La regla de Three Sigma es que casi todos los resultados que conforman una muestra distribuida normalmente están dentro. Esta regla se puede usar para resolver las siguientes tareas importantes:

1) Estimaciones de la normalidad de la distribución de datos de muestra. Si los resultados están aproximadamente dentro
y en el campo de la media aritmética, los resultados son más comunes, y a la derecha y la izquierda con menos frecuencia, se puede suponer que los resultados se distribuyen normalmente.

2) Identificación de resultados obtenidos erróneamente. Si los resultados individuales se desvían de la media aritmética por valores que exceden significativamente 3, debe verificar la exactitud de los valores obtenidos. A menudo, estos resultados "emergentes" pueden aparecer como resultado de un mal funcionamiento del dispositivo, errores de medición y cálculos.

3) Una estimación de величины. Si el rango de variación R \u003d X naib - X min se divide por 6, entonces obtenemos un valor aproximado de .

2. El criterio W de Shapiro y Wilk pretende probar la hipótesis de la distribución normal de la población general cuando el tamaño de la muestra es pequeño ( norte ≤ 50). El procedimiento de verificación es el siguiente: se presenta la hipótesis nula de la distribución normal de la población. El valor observado del criterio de Shapiro y Wilk W obs se calcula y se compara con el valor crítico de W crit, que se encuentra en la tabla de puntos críticos del criterio de Shapiro y Wilk según el tamaño de la muestra y el nivel de significación. Si W obs ≥ W crit, se acepta la hipótesis nula de una distribución normal de resultados; en W obs< W крит она отвергается.

1. ¿Cuál es la regla de tres sigma?

2. La aplicación práctica de la regla de tres sigma.

3. ¿Qué criterio se utiliza para verificar la normalidad de la distribución de la población general con un tamaño de muestra pequeño?

4. Describa el procedimiento para verificar la normalidad de la distribución.

Literatura:

1. Los fundamentos de la estadística matemática. Uch subsidio para la educación física (bajo la dirección general de V.S. Ivanov). - M .: Educación física y deporte, 1990. - S. 62 - 63, 110 - 112.

2. Rukavitsyna S. L., Volkov Yu.O., Soltanovich L. L. Metrología deportiva. Probar la efectividad de los métodos de entrenamiento utilizando métodos estadísticos matemáticos. Taller para estudiantes de BSUFK. - Minsk: BSUFK, 2006 .-- S. 66-67.

3. Ginzburg G.I., Kiselev V.G. Asentamiento y obra gráfica en metrología deportiva. - Minsk: BGOIFK, 1984. - S. 21 - 22, 26 - 29.

CONFERENCIA 7.

Tema: La relación de los resultados de la medición. Métodos para calcular los coeficientes de relación.

Preguntas a considerar:

1. Tipos de relación.

2. Las principales tareas del análisis de correlación.

3. El coeficiente de correlación y sus propiedades.

4. Métodos para calcular los coeficientes de relación.

1. En los estudios deportivos, a menudo se encuentra una relación entre los indicadores estudiados. Su apariencia es diferente. Por ejemplo, la definición de aceleración a partir de datos de velocidad conocidos en biomecánica, la ley de Fechner en psicología, la ley de Hill en fisiología y otros caracterizan la llamada dependencia funcional, o la relación en la que cada valor de un indicador corresponde a un valor estrictamente definido de otro.

Otro tipo de relación incluye, por ejemplo, la dependencia del peso con respecto a la longitud del cuerpo. Un valor de la longitud del cuerpo puede corresponder a varios valores de peso y viceversa. En tales casos, cuando un valor de un indicador corresponde a varios valores de otro, la relación se denomina estadística.

En la investigación deportiva, se presta mucha atención al estudio de la relación estadística entre varios indicadores, ya que esto nos permite revelar algunos patrones y describirlos tanto verbalmente como matemáticamente para usar un entrenador y un maestro en el trabajo práctico.

Entre las relaciones estadísticas, las más importantes correlación. La correlación es que el valor promedio de un indicador varía según el valor de otro.

2. El método estadístico que se utiliza para estudiar las relaciones se llama análisis de correlación. Su tarea principal es determinar la forma, la rigidez y la orientación de la relación de los indicadores estudiados. El análisis de correlación le permite explorar solo la relación estadística. Es ampliamente utilizado en la teoría de pruebas para evaluar su confiabilidad y contenido de información. Las diferentes escalas de medición requieren diferentes variantes de análisis de correlación.

El análisis de la relación comienza con una representación gráfica de los resultados de la medición en un sistema de coordenadas rectangular. Se traza un gráfico en el eje de abscisas del cual se trazan los resultados de X, y en el eje de ordenadas, los resultados de Y. Por lo tanto, cada par de resultados en un sistema de coordenadas rectangular se mostrará como un punto. El conjunto resultante de puntos está rodeado por una curva cerrada.

Esta dependencia gráfica se llama patrón de dispersión o campo de correlación. El análisis visual del gráfico le permite identificar la forma de dependencia (al menos hacer una suposición). Si la forma del campo de correlación está cerca de una elipse, esta forma de la relación se denomina relación lineal o forma lineal de la relación.

Sin embargo, en la práctica, se puede encontrar otra forma de relación. La dependencia obtenida experimentalmente con el saque en el tenis es característica de no lineal formas de interconexión, o dependencia no lineal.

Por lo tanto, un análisis visual del campo de correlación nos permite identificar la forma de la dependencia estadística  lineal o no lineal. Esto es esencial para el siguiente paso en el análisis de la selección y el cálculo del coeficiente de correlación correspondiente.

3. Si las mediciones se realizan en una escala de relaciones o intervalos y se observa una relación lineal, el coeficiente de correlación de Brave-Pearson se utiliza para cuantificar la estrechez de la relación. Se denota por la letra r. Se calcula mediante la fórmula:

,

dónde y - valores medios aritméticos de los indicadores x e y; σ x y σ y son las desviaciones estándar; n es el número de mediciones (sujetos).

Sus propiedades:

1) Los valores de r pueden variar de –1 a 1.

2) En el caso de r \u003d -1 yr \u003d 1, la relación es funcional, respectivamente, negativa y positiva.

3) Para r \u003d 0, no se establece una relación lineal, pero al mismo tiempo, se puede observar una relación de otra forma.

4) Cuando r<0 взаимосвязь отрицательная, при r>0 es positivo.

Para evaluar la estrechez de la relación en el análisis de correlación, se utiliza el valor (valor absoluto) del coeficiente de correlación. El valor absoluto de cualquier coeficiente de correlación se encuentra en el rango de 0 a 1. Explique (interprete) el valor de este coeficiente de la siguiente manera:

 el coeficiente de correlación es 1.00 (relación funcional, ya que solo un valor de otro indicador corresponde al valor de un indicador);

 coeficiente de correlación es 0.990.7 (fuerte relación estadística);

 el coeficiente de correlación es 0.690.5 (relación estadística promedio);

 el coeficiente de correlación es 0.490.2 (relación estadística débil);

 coeficiente de correlación es 0.190.01 (relación estadística muy débil);

 el coeficiente de correlación es 0.00 (sin correlación).

4. Antes de comenzar el procedimiento mecánico para calcular el coeficiente de correlación, es necesario responder algunas preguntas:

1) ¿En qué escala se mide el indicador estudiado?

2) ¿Cuántas mediciones de este indicador se han realizado?

De las respuestas a estas preguntas depende qué coeficiente de correlación se calculará.

En particular, cuando las mediciones se toman en una escala de intervalos o relaciones, el coeficiente de correlación Brave-Pearson se calcula para evaluar la rigidez de la relación; El coeficiente de correlación de rango de Spearman se calcula en una escala de rango; y en la escala de nombres, cuando el signo de interés varía alternativamente, se usa un coeficiente de conjugación tetracórica.

El coeficiente de correlación de rango de Spearman se calcula mediante la fórmula:

,

dónde re= re x - re y - la diferencia en los rangos de este par de indicadores X e Y; n es el tamaño de la muestra.

Se usa cuando los indicadores se miden en la escala de nombres (es decir, se les asignan números, pero no se puede decir que uno de ellos es más grande que el otro), y los indicadores varían alternativamente (género masculino / femenino, finalización o incumplimiento de una tarea, etc. diciendo que hay dos estados: 0 y 1).

Se designa T 4 y se calcula mediante la fórmula:

,

donde A es el valor que corresponde al número de sujetos (intentos), que coinciden en ambos indicadores X e Y, es decir 1 y 1; B es el valor que corresponde al número de coincidencias 0 - X y 1 - Y; C es el valor correspondiente al número de coincidencias 1 - X y 0 - Y; D es el valor de los partidos 0 y 0; n es el tamaño de la muestra.

Preguntas de prueba para autoevaluación:

1. Relación funcional. Definición y ejemplos.

2. La relación estadística. Definición y ejemplos. Relación de correlación.

3. Las principales tareas del análisis de correlación.

4. El campo de correlación. El orden de construcción, análisis de imágenes.

6. El coeficiente de correlación de Brave-Pearson y sus propiedades.

7. Reglas para elegir un coeficiente de correlación.

Literatura:

1. Los fundamentos de la estadística matemática. Uch subsidio para la educación física (bajo la dirección general de V.S. Ivanov). - M .: Educación física y deporte, 1990. - S. 124 - 126, 142 - 150, 155 - 162.

2. Rukavitsyna S. L., Volkov Yu.O., Soltanovich L. L. Metrología deportiva. Probar la efectividad de los métodos de entrenamiento utilizando métodos estadísticos matemáticos. Taller para estudiantes de BSUFK. - Minsk: BSUFK, 2006 .-- S. 42-48.

3. Ginzburg G.I., Kiselev V.G. Asentamiento y obra gráfica en metrología deportiva. - Minsk: BGOIFK, 1984. - S. 51-60.

CONFERENCIA 8.

Tema: Hipótesis estadísticas y la fiabilidad de las características estadísticas. Prueba de hipótesis estadísticas.

De este artículo aprenderás:

    Qué intervalo de confianza?

    Cual es la esencia 3 reglas sigma?

    ¿Cómo se puede poner en práctica este conocimiento?

Hoy en día, debido al exceso de información relacionada con una gran variedad de productos, áreas de ventas, empleados, líneas de negocios, etc. es difícil resaltar lo principal, que, en primer lugar, merece la pena prestar atención y hacer esfuerzos para gestionarlo. Definición intervalo de confianza y análisis de ir más allá de sus límites de valores reales, una técnica que te ayuda a resaltar situaciones, influyendo en las tendencias cambiantes.Puede desarrollar factores positivos y reducir el impacto de los negativos. Esta tecnología se utiliza en muchas empresas de fama mundial.

Hay los llamados " alertas "cual informar a los gerentes que el siguiente valor en cierta dirección casado intervalo de confianza. ¿Qué significa esto? Esta es una señal de que se ha producido algún evento no estándar que, posiblemente, cambiará la tendencia existente en esta dirección. Es una señal a ese clasificarlo en una situación y entender lo que la influyó.

Por ejemplo, considere varias situaciones. Calculamos el pronóstico de ventas con los límites de pronóstico para 100 artículos de producto para 2011 por meses y en ventas reales de marzo:

  1. Para el "aceite de girasol" rompieron el límite superior del pronóstico y no cayeron en el intervalo de confianza.
  2. De acuerdo con la "levadura seca" fue más allá del límite inferior de la previsión.
  3. En "Gachas de avena" rompió a través del borde superior.

Para otros bienes, las ventas reales estuvieron dentro de los límites de pronóstico especificados. Aquellos. sus ventas estuvieron en línea con las expectativas. Entonces, identificamos 3 productos que iban más allá de las fronteras y comenzamos a resolver lo que afectó la salida al extranjero:

  1. Para el "aceite de girasol", ingresamos a una nueva red de distribución, lo que nos dio ventas adicionales, lo que nos llevó a ir más allá de la frontera superior. Para este producto, vale la pena volver a contar el pronóstico antes de fin de año, teniendo en cuenta el pronóstico de ventas en esta red.
  2. Según Dry Yeast, el automóvil se atascó en la aduana y se formó un déficit en 5 días, lo que afectó la disminución de las ventas e ir más allá del límite inferior. Puede valer la pena averiguar cuál fue la razón y tratar de no repetir esta situación.
  3. En "Gachas de avena" se lanzó un evento de promoción de ventas, que dio un aumento significativo en las ventas y llevó a sobrepasar el pronóstico.

Identificamos 3 factores que influyeron en la salida más allá de los límites del pronóstico. En la vida, puede haber muchos más. Para mejorar la precisión de los pronósticos y la planificación, vale la pena resaltar los factores que conducen al hecho de que las ventas reales pueden ir más allá del pronóstico y construir pronósticos y planes para ellos por separado. Y luego considere su impacto en el pronóstico de ventas principal. También puede evaluar regularmente el impacto de estos factores y cambiar la situación para mejor reduciendo el impacto negativo y aumentando la influencia de factores positivos.

Usando el intervalo de confianza, podemos:

  1. Direcciones destacadas, a los que vale la pena prestar atención, como en estas áreas han ocurrido eventos que pueden afectar cambio de tendencia.
  2. Identificar factoreseso realmente afecta el cambio en la situación.
  3. Aceptar decisión informada (por ejemplo, adquisiciones, planificación, etc.).

Ahora veamos cuál es el intervalo de confianza y cómo calcularlo en Excel usando un ejemplo.

¿Qué es un intervalo de confianza?

El intervalo de confianza es el límite de pronóstico (superior e inferior), dentro del cual con una probabilidad dada (sigma) Se obtendrán los valores reales.

Aquellos. calculamos el pronóstico: esta es nuestra guía principal, pero entendemos que es poco probable que los valores reales sean 100% iguales a nuestro pronóstico. Y la pregunta es, a qué límites los valores reales pueden caer si la tendencia existente continúa? Y esta pregunta nos ayudará a responder cálculo del intervalo de confianzaes decir - los límites superior e inferior de la previsión.

¿Qué es una probabilidad sigma dada?

Al calcular intervalo de confianza que podamos establecer probabilidad golpear valores actuales a los límites de pronóstico especificados. ¿Cómo hacerlo? Para hacer esto, establecemos el valor sigma y, si el sigma es igual a:

    3 sigma - entonces, la probabilidad de que el próximo valor real caiga en el intervalo de confianza será 99.7%, o 300 a 1, o hay una probabilidad de 0.3% de ir más allá de las fronteras.

    2 sigma - que, la probabilidad de que el próximo valor caiga dentro de las fronteras es ≈ 95.5%, es decir las probabilidades son de 20 a 1, o hay un 4.5% de posibilidades de ir al extranjero.

    1 sigma - entonces, la probabilidad es ≈ 68.3%, es decir las probabilidades son aproximadamente de 2 a 1, o existe una probabilidad del 31.7% de que el siguiente valor vaya más allá del intervalo de confianza.

Hemos formulado regla 3 sigma,el cual establece que probabilidad de golpe siguiente valor aleatorio en intervalo de confianza con un valor dado tres sigma es 99.7%.

El gran matemático ruso Chebyshev demostró el teorema de que hay un 10% de probabilidad de ir más allá del pronóstico con un valor dado de tres sigma. Aquellos. la probabilidad de entrar en el intervalo de confianza de 3 sigma será al menos del 90%, mientras que un intento de calcular el pronóstico y sus límites "a simple vista" está lleno de errores mucho más significativos.

¿Cómo calcular de forma independiente el intervalo de confianza en Excel?

El cálculo del intervalo de confianza en Excel (es decir, los límites superior e inferior del pronóstico) se considerará como un ejemplo. Tenemos una serie temporal: ventas mensuales durante 5 años. Ver archivo adjunto.

Para calcular los límites del pronóstico, calculamos:

  1. Pronóstico de ventas().
  2. Sigma - desviación estándar pronostique modelos a partir de valores reales.
  3. Tres sigma.
  4. Intervalo de confianza.

1. Previsión de ventas.

\u003d (RC [-14] (datos en una serie temporal) - RC [-1] (valor del modelo)) ^ 2 (al cuadrado)


3. Suma para cada mes las desviaciones de la suma de la octava etapa ((Xi-Ximod) ^ 2), es decir resumir enero, febrero ... para cada año.

Para hacer esto, usamos la fórmula \u003d SUMMES ()

SUMAS (matriz con números de período dentro del ciclo (para meses del 1 al 12); referencia al número de período en el ciclo; referencia a la matriz con los cuadrados de la diferencia entre los datos iniciales y los valores de los períodos)


4. Calculamos la desviación estándar para cada período del ciclo del 1 al 12 (etapa 10 en el archivo adjunto).

Para hacer esto, extraemos la raíz del valor calculado en la etapa 9 y dividimos por el número de períodos en este ciclo menos 1 \u003d RAÍZ ((Suma (Xi-Ximod) ^ 2 / (n-1))

Usamos las fórmulas en Excel \u003d ROOT (R8 (enlace a (Suma (Xi-Ximod) ^ 2)/ (COUNTIF ($ O $ 8: $ O $ 67 (referencia a una matriz con números de bucle); O8 (enlace a un número de bucle específico, que contamos en la matriz))-1))

Usando la fórmula de Excel \u003d COUNTIF contamos el número n


Después de calcular la desviación estándar de los datos reales del modelo de pronóstico, obtuvimos el valor sigma para cada mes - paso 10 en el archivo adjunto .

3. Calcular 3 sigma.

En la etapa 11, establecemos el número de sigma, en nuestro ejemplo, "3" (etapa 11 en el archivo adjunto):

También los valores prácticos de sigma son:

1.64 sigma - 10% de probabilidad de ir más allá del límite (1 posibilidad de 10);

1.96 sigma - 5% de probabilidad de ir más allá (1 posibilidad de 20);

2.6 sigma - 1% de probabilidad de ir más allá (1 posibilidad de 100).

5) Contamos tres sigma, para esto multiplicamos los valores de "sigma" para cada mes por "3".

3. Determine el intervalo de confianza.

  1. El límite superior del pronóstico. - previsión de ventas teniendo en cuenta el crecimiento y la estacionalidad + (más) 3 sigma;
  2. El límite inferior del pronóstico. - previsión de ventas teniendo en cuenta el crecimiento y la estacionalidad - (menos) 3 sigma;

Para la conveniencia de calcular el intervalo de confianza durante un largo período (consulte el archivo adjunto), utilizamos la fórmula de Excel \u003d Y8 + BUSCARV (W8; $ U $ 8: $ V $ 19; 2; 0)dónde

Y8 - pronóstico de ventas;

W8 - el número de mes para el cual tomaremos el valor de 3 sigma;

Aquellos. El límite superior del pronóstico. \u003d "Previsión de ventas" + "3 sigma" (en el ejemplo, BUSCARV (número de mes; tabla con 3 valores sigma; columna de la que extraemos el valor sigma igual al número de mes en la fila correspondiente; 0)).

El límite inferior del pronóstico. \u003d "Previsión de ventas" menos "3 sigma".

Entonces, calculamos el intervalo de confianza en Excel.

Ahora tenemos un pronóstico y un rango con límites dentro de los cuales los valores reales caerán con una probabilidad sigma dada.

En este artículo, examinamos qué son sigma y la regla de tres sigma, cómo determinar el intervalo de confianza y para qué puede usar esta técnica en la práctica.

Previsiones precisas y éxito!

Que Forecast4AC PRO puede ayudarloal calcular el intervalo de confianza?:

    Forecast4AC PRO calcula automáticamente los límites superior o inferior del pronóstico para más de 1000 series de tiempo al mismo tiempo;

    La capacidad de analizar los límites del pronóstico en comparación con el pronóstico, la tendencia y las ventas reales en el gráfico con el clic de un botón;

El programa Forcast4AC PRO tiene la capacidad de establecer el valor sigma de 1 a 3.

¡Únete a nosotros!

Descargue aplicaciones gratuitas de previsión y análisis empresarial:


  • Novo Forecast Lite - automático cálculo de pronóstico en Sobresalir.
  • 4analytics - Análisis ABC-XYZ y análisis de emisiones en Sobresalir
  • Qlik Sense Escritorio y QlikViewEdición personal: sistemas de BI para análisis y visualización de datos.

Pruebe las posibilidades de las soluciones pagas:

  • Novo Forecast PRO - Pronóstico en Excel para grandes conjuntos de datos.

Encontramos la probabilidad de que una variable aleatoria distribuida normalmente tome un valor del intervalo ( y -3σ y +3σ ):

Por lo tanto, la probabilidad de que el valor de una variable aleatoria sea fuera de este intervalo es igual a 0.0027, es decir, 0.27% y puede considerarse insignificante. Por lo tanto, en la práctica, podemos suponer que todas Los posibles valores de una variable aleatoria normalmente distribuida se encuentran en el intervalo ( y -3σ y +3σ ).

El resultado obtenido nos permite formular regla de tres sigma: si la variable aleatoria se distribuye normalmente, entonces el módulo de su desviación de x \u003d a no excede de 3σ.

16.7. Distribución exponencial.

Definición. Exponencialllamada la distribución de probabilidad de una variable aleatoria continua Xque se describe por densidad

A diferencia de la distribución normal, la ley exponencial está determinada por un solo parámetro λ . Esta es su ventaja, ya que generalmente los parámetros de distribución no se conocen de antemano y deben estimarse aproximadamente. Está claro que evaluar un parámetro es más fácil que varios.

Encuentre la función de distribución de la ley exponencial:

Por lo tanto,

Ahora puede encontrar la probabilidad de que una variable aleatoria distribuida exponencialmente caiga en el intervalo ( y,si):

Valores de función mi X se puede encontrar en las tablas.

16.8. Función de fiabilidad.

Permitir elemento(es decir, algún dispositivo) comienza a funcionar en un momento determinado t 0 = 0 y debe funcionar por un período de tiempo t. Denotamos por T variable aleatoria continua - tiempo de actividad del elemento, luego la función F(t) = pags(T > t) determina la probabilidad de falla con el tiempo t. En consecuencia, la probabilidad de una operación libre de fallas durante el mismo tiempo es

R(t) = pags(T > t) = 1 – F(t).

Esta función se llama función de fiabilidad.

16.9. La ley exponencial de la fiabilidad.

A menudo, el tiempo de actividad de un elemento tiene una distribución exponencial, es decir

F(t) = 1 – mi - λt .

Por lo tanto, la función de confiabilidad en este caso tiene la forma:

R(t) = 1 – F(t) = 1 – (1 – mi -λt) = mi -λt .

Definición. La ley exponencial de confiabilidad llamada la función de fiabilidad definida por la igualdad

R(t) = mi - λt ,

dónde λ - tasa de fracaso.

Ejemplo. Deje que el tiempo de actividad del elemento se distribuya de acuerdo con la ley exponencial con la densidad de distribución f(t) = 0,1 mi - 0,1 t a t ≥ 0. Encuentre la probabilidad de que el elemento funcione sin fallas durante 10 horas.

Decisión. Como λ = 0,1, R(10) = mi -0.110 \u003d mi -1 = 0,368.

10.16. Valor esperado.

Definición Expectativa matemáticauna variable aleatoria discreta es la suma de los productos de sus posibles valores por las probabilidades correspondientes:

METRO(X) = x 1 r 1 + x 2 r 2 + … + x pAGS r pAGS .

Si el número de valores posibles de una variable aleatoria es infinito, entonces
si la serie resultante converge absolutamente.

Observación 1.La expectativa matemática a veces se llama peso promedio, ya que es aproximadamente igual a la media aritmética de los valores observados de una variable aleatoria con un gran número de experimentos.

Observación 2.De la definición de expectativa matemática, se deduce que su valor no es menor que el valor más pequeño posible de una variable aleatoria y no más que el mayor.

Observación 3.La expectativa matemática de una variable aleatoria discreta es no aleatorio(constante. Más adelante veremos que esto también es cierto para las variables aleatorias continuas.

Ejemplo. Encuentra la expectativa matemática de una variable aleatoria X - el número de partes estándar entre tres seleccionadas de un lote de 10 partes, incluidas 2 defectuosas. Compusimos una serie de distribuciones para X. De las condiciones del problema se deduce que X puede tomar los valores 1, 2, 3. Luego

Ejemplo 2. Definir la expectativa matemática de una variable aleatoria. X - el número de lanzamientos de monedas antes de la primera aparición del escudo de armas. Este valor puede tomar un número infinito de valores (el conjunto de valores posibles es el conjunto de números naturales). Un número de su distribución tiene la forma:

(0,5) pAGS

+ (al calcular la fórmula de la suma de una progresión geométrica infinitamente decreciente se usó dos veces:
de donde).

Propiedades de la expectativa matemática.

    La expectativa matemática de una constante es igual a la más constante:

METRO(DE) = DE.

Evidencia. Si consideras DE como una variable aleatoria discreta que toma solo un valor DE con probabilidad r \u003d 1 entonces METRO(DE) = DE1 \u003d DE.

    El factor constante se puede sacar del signo de expectativa matemática:

METRO(CX) = CM(X).

Evidencia. Si una variable aleatoria X establecido por distribución

x yo

x norte

pags yo

pags norte

entonces la serie de distribución para CX tiene la forma:

DEx yo

DEx 1

DEx 2

DEx norte

pags yo

pags norte

Luego METRO(CX) = Cx 1 r 1 + Cx 2 r 2 + … + Cx pAGS r pAGS = DE( X 1 r 1 + x 2 r 2 + … + x pAGS r pAGS) = CM(X).

Definición Dos variables aleatorias se llaman independientesi la ley de distribución de uno de ellos no depende de qué valores ha tomado el otro. De lo contrario, variables aleatorias fanático.

Definición Llamada producto de variables aleatorias independientesX yY variable aleatoria Xycuyos valores posibles son iguales a los productos de todos los valores posibles X a todos los valores posibles Y, y las probabilidades correspondientes son iguales a los productos de las probabilidades de los factores.

    La expectativa matemática del producto de dos variables aleatorias independientes es igual al producto de sus expectativas matemáticas:

METRO(Xy) = METRO(X)METRO(Y).

Evidencia. Para simplificar los cálculos, nos restringimos al caso cuando X y Y tome solo dos valores posibles:

x yo

pags yo

a yo

gramo yo

Luego la serie de distribución para Xy tiene este aspecto:

XY

x 1 y 1

x 2 y 1

x 1 y 2

x 2 y 2

pags 1 gramo 1

pags 2 gramo 1

pags 1 gramo 2

pags 2 gramo 2

Por lo tanto, METRO(Xy) = x 1 y 1 · pags 1 gramo 1 + x 2 y 1 · pags 2 gramo 1 + x 1 y 2 pags 1 gramo 2 + x 2 y 2 pags 2 gramo 2 = y 1 gramo 1 (x 1 pags 1 + x 2 pags 2) + + y 2 gramo 2 (x 1 pags 1 + x 2 pags 2) = (y 1 gramo 1 + y 2 gramo 2) (x 1 pags 1 + x 2 pags 2) = METRO(XMETRO(Y).

Observación 1.Del mismo modo, podemos probar esta propiedad para un mayor número de valores posibles de los factores.

Observación 2. La propiedad 3 es válida para el producto de cualquier número de variables aleatorias independientes, lo que se demuestra mediante el método de inducción matemática.

Definición Definir suma de variables aleatoriasX yY como una variable aleatoria X +Ycuyos valores posibles son iguales a las sumas de cada valor posible X con todos los valores posibles Y; las probabilidades de tales sumas son iguales a los productos de las probabilidades de los términos (para variables aleatorias dependientes, los productos de la probabilidad de un término y la probabilidad condicional del segundo).

4) La expectativa matemática de la suma de dos variables aleatorias (dependientes o independientes) es igual a la suma de las expectativas matemáticas de los términos:

METRO (X + Y) = METRO (X) + METRO (Y).

Evidencia.

Nuevamente consideramos las variables aleatorias dadas por la serie de distribución dada en la prueba de propiedad 3. Luego, los valores posibles X + Y son x 1 + a 1 , x 1 + a 2 , x 2 + a 1 , x 2 + a 2) Denotamos sus probabilidades, respectivamente, como r 11 , r 12 , r 21 y r 22) Encontrará METRO(X+Y) = (x 1 + y 1)pags 11 + (x 1 + y 2)pags 12 + (x 2 + y 1)pags 21 + (x 2 + y 2)pags 22 =

= x 1 (pags 11 + pags 12) + x 2 (pags 21 + pags 22) + y 1 (pags 11 + pags 21) + y 2 (pags 12 + pags 22).

Demostremos que r 11 + r 22 = r 1) De hecho, el evento que X + Y tomará valores x 1 + a 1 o x 1 + a 2 y cuya probabilidad es igual a r 11 + r 22, coincide con el evento de que X = x 1 (su probabilidad es r 1) También se demostró que pags 21 + pags 22 = r 2 , pags 11 + pags 21 = gramo 1 , pags 12 + pags 22 = gramo 2) Medio

METRO(X + Y) = x 1 pags 1 + x 2 pags 2 + y 1 gramo 1 + y 2 gramo 2 = METRO (X) + METRO (Y).

Comentario. De la propiedad 4 se deduce que la suma de cualquier número de variables aleatorias es igual a la suma de las expectativas matemáticas de los términos.

Ejemplo. Encuentre la expectativa matemática de la suma del número de puntos que cayeron durante el lanzamiento de cinco dados.

Encuentre la expectativa matemática del número de puntos que cayeron al lanzar un dado:

METRO(X 1) = (1 + 2 + 3 + 4 + 5 + 6)
El mismo número es la expectativa matemática del número de puntos que han caído sobre cualquier hueso. Por lo tanto, por propiedad 4 METRO(X)=

Variable aleatoria. La desviación estándar se usa al calcular el error estándar de la media aritmética, al construir intervalos de confianza, al probar estadísticas de hipótesis, al medir la relación lineal entre variables aleatorias.

donde es el estándar, la desviación estándar, la estimación imparcial de la desviación estándar de la variable aleatoria X en relación con su expectativa matemática; - varianza; - i-ésimo elemento de muestra; - media aritmética de la muestra; - tamaño de la muestra.

Cabe señalar la diferencia en el estándar (en el denominador norte - 1) desde la raíz de la varianza (desviación estándar) (en el denominador norte ), para un tamaño de muestra pequeño, la estimación de la varianza a través del último valor está algo sesgada, con un tamaño de muestra infinitamente grande, la diferencia entre los valores indicados desaparece. La muestra es solo una parte de la población. La población total es absolutamente todos los resultados posibles. Obtener un resultado que no está incluido en la población general es absolutamente imposible en principio. Para el caso de lanzar una moneda, la población general es: colas, bordes, águilas. pero el par de cabezas y colas es solo una selección. Para la población general, la expectativa matemática coincide con el verdadero valor del parámetro estimado. Pero para la muestra no es un hecho. La expectativa matemática de la muestra tiene un desplazamiento relativo al valor verdadero del parámetro. Debido a esto, el error estándar es mayor que la varianza, ya que la varianza es la expectativa matemática del cuadrado de la desviación de la media, y la desviación estándar es la expectativa matemática de la desviación del valor verdadero. La diferencia es de qué estamos buscando la desviación, cuando la varianza es del promedio y no importa si este es el promedio o es erróneo, y cuando la desviación estándar es, estamos buscando la desviación del valor verdadero.

Regla 3 sigma () - casi todos los valores de una variable aleatoria normalmente distribuida se encuentran en el intervalo. Más estrictamente, con no menos del 99,7% de certeza, el valor de una variable aleatoria normalmente distribuida se encuentra en el intervalo indicado. Siempre que el valor sea verdadero y no se obtenga como resultado del procesamiento de la muestra. Si el valor verdadero es desconocido, entonces no se debe usar σ, sino s . Por lo tanto, la regla de 3 sigma se transforma en la regla de tres s


Fundación Wikimedia. 2010

Vea qué es la "Regla de tres sigmas" en otros diccionarios:

    La varianza de una variable aleatoria es una medida de la dispersión de una variable aleatoria dada, es decir, su desviación de la expectativa matemática. Se designa D [X] en la literatura rusa y (varianza inglesa) en el extranjero. Las estadísticas a menudo usan la designación o ... ... Wikipedia

    - (Inglés Six Sigma), un concepto de gestión de producción desarrollado por Motorola en la década de 1980 y popularizado a mediados de la década de 1990 después de que Jack Welch lo aplicara como una estrategia clave en General Electric. El resultado final ... ... Wikipedia

    - (sinónimos: desviación estándar, desviación estándar; términos relacionados: desviación estándar, dispersión estándar) en teoría de probabilidad y estadística, el indicador más común de la dispersión de valores aleatorios ... Wikipedia

    La desviación estándar (a veces desviación estándar) en la teoría de la probabilidad y las estadísticas es el indicador más común de dispersión de valores aleatorios en relación con sus expectativas matemáticas. Medido en unidades ... ... Wikipedia

    Densidad de probabilidad Línea verde ... Wikipedia

    SISTEMA NERVIOSO - SISTEMA NERVIOSO. Contenido: I. Embriogénesis, histogénesis y filogénesis. . 518 II. Anatomía de N. s ................. 524 III. Fisiología de N. con ................ 525 IV. Patología N.s ................. 54? I. Embriogénesis, histogénesis y filogénesis N. e ... ... Enciclopedia médica grande

    El mayor grupo de esponjas. Estas son formas elásticas predominantemente suaves. Su esqueleto está formado por agujas uniaxiales. Siempre hay una cierta cantidad de esponja, con la cual las agujas se pegan en haces o fibras ... Enciclopedia biológica

    En medicina, un conjunto de métodos para el estudio cuantitativo y el análisis del estado y (o) el comportamiento de los objetos y sistemas relacionados con la medicina y la atención médica. En biología, medicina y salud, la gama de fenómenos estudiados con la ayuda de M. M. incluye ... ... Enciclopedia médica

    Contenido 1 Gestión basada en actividades empresariales 2 Desarrollo de una situación empresarial 3 ... Wikipedia

    Este artículo debe ser vikified. Organícelo de acuerdo con las reglas para el diseño de artículos. El costeo basado en actividades (ABC) es un modelo de costo especial que identifica el trabajo de una empresa ... Wikipedia

En los cálculos prácticos, la desviación estándar de a se toma como la unidad de medida de la desviación de una variable aleatoria sujeta a la ley normal desde su centro de dispersión (expectativa matemática). Luego, sobre la base de la fórmula (7) del § 17, obtenemos ecuaciones útiles para varios cálculos

Estos resultados se representan geométricamente en la Fig. 439.

Es casi seguro que la variable aleatoria (error) no se desvía de la expectativa matemática en valor absoluto en más de esto. Este supuesto se llama la regla de tres sigma.

En la teoría del disparo y en el procesamiento de diversos materiales estadísticos, puede ser útil conocer la probabilidad de que una variable aleatoria caiga en los intervalos (0, Е),

Con una densidad de distribución determinada por la fórmula (1), § 19. El conocimiento de estas probabilidades en muchos casos reduce el cálculo y ayuda en el análisis de fenómenos.

Al calcular estas probabilidades, usamos la fórmula (8) del § 19 y la tabla de funciones

Los resultados del cálculo se representan geométricamente en la Fig. 440, que se llama la escala de dispersión de error. De estos cálculos se deduce que es prácticamente confiable que el valor de una variable aleatoria caiga dentro del intervalo. La probabilidad de que el valor de una variable aleatoria caiga fuera de este intervalo es menor que 0.01.

Ejemplo 1. Se dispara un disparo en una franja de 100 m de ancho El objetivo se calculó en la línea media de la franja, que es perpendicular al plano de vuelo del proyectil. La dispersión obedece a una ley normal con una desviación probable en el rango. Determine la probabilidad de caer en la franja (Fig. 441). La desviación promedio en el rango en la teoría de tiro indica lateral.

Decisión. Utilizamos la fórmula (7) del § 19. En nuestro caso. Por lo tanto,

Comentario. Sería posible resolver el problema aproximadamente, sin usar tablas de funciones, pero usando la escala de dispersión (Fig. 440).