lunes, 21 de febrero de 2011

¿Qué es la simulación?

La simulación es una técnica para analizar y estudiar sistemas complejos.  Nos permite reunir información pertinente sobre el comportamiento del sistema porque ejecuta un modelo computarizado.
Los datos recopilados se usan para diseñar el sistema. Según WINSTON (1994) se puede definir a la Simulación como la técnica de imita el funcionamiento de un sistema del mundo real cuando evoluciona en el tiempo. La simulación no es una técnica de optimización. Más bien es una técnica para estimar las medidas de desempeño del sistema modelado.
Un modelo de simulación comúnmente toma la forma de un conjunto de hipótesis acerca del funcionamiento del sistema, expresado como relaciones matemáticas o lógicas entre los objetos de interés del sistema. En contraste con las soluciones matemáticas el proceso de simulación incluye la ejecución del modelo en una computadora, que genera muestras representativas de las mediciones del desempeño, como un experimento de muestreo acerca del sistema real cuyos resultados son puntos de muestra.

Ventajas y desventajas de la simulación
Ya que la simulación es en muchas ocasiones una herramienta apropiada de análisis, es preciso considerar las ventajas y desventajas de su utilización.

Ventajas

1.      Una vez construido, el modelo puede ser modificado de manera rápida con el fin de analizar diferentes políticas o escenarios.
2.      Generalmente es menos costoso mejorar el sistema vía simulación, que hacerlo directamente en el sistema real.
3.      Es mucho más sencillo comprender y visualizar los métodos de simulación que los métodos puramente analíticos.
4.      Los métodos analíticos se desarrollan casi siempre, para sistemas relativamente sencillos donde suele hacerse un gran número de suposiciones o simplificaciones, mientras que con los modelos de simulación es posible analizar sistemas de mayor complejidad o con mayor
5.      En algunos casos, la simulación es el único medio disponible para lograr una solución.
6.      Es un proceso relativamente eficiente y flexible.
7.      Puede ser usada para analizar y sintetizar una compleja y extensa situación real, pero no puede ser empleada para solucionar un modelo de análisis cuantitativo convencional.
8.      Los modelos de simulación se estructuran y nos resuelve en general problemas trascendentes.
9.      Los directivos requieren conocer como se avanza y que opciones son atractivas; el directivo con la ayuda del computador puede obtener varias opciones de decisión.
10.  La simulación no interfiere en sistemas del mundo real.
11.  La simulación permite estudiar los efectos interactivos de los componentes individuales o variables para determinar las más importantes.
12.  La simulación permite la inclusión de complicaciones del mundo real.
13.  Permite la experimentación en condiciones que podrían ser peligrosas o de elevado coste económico en el sistema real.
Desventajas

1.      Se requiere gran cantidad de corridas computacionales para encontrar "soluciones óptimas", lo cual repercute en altos costos.
2.      Es difícil aceptar los modelos de simulación.
3.      La solución de un modelo de simulación puede dar al analista un falso sentido de seguridad.
1.      Un buen modelo de simulación puede resultar bastante costoso; a menudo el proceso de desarrollar un modelo es largo y complicado.
2.      La simulación no genera soluciones óptimas a problemas de análisis cuantitativos, en técnicas como cantidad económica de pedido, programación lineal o PERT. Por ensayo y error se producen diferentes resultados en repetidas corridas en el computador.
3.      Los directivos generan todas las condiciones y restricciones para analizar las soluciones. El modelo de simulación no produce respuestas por si mismo.
4.      Cada modelo de simulación es único. Las soluciones e inferencias no son usualmente transferibles a otros problemas.
5.      Siempre quedarán variables por fuera y esas variables (si hay mala suerte) pueden cambiar completamente los resultados en la vida real que la simulación no previó… en ingeniería se “minimizan riesgos, no se evitan”.

Fuente: Azarang M., Garcia E. SIMULACIÓN Y ANÁLISIS DE MODELOS ESTOCÁSTICOS.  Mc. Graw Hill. México.

¿Qué es la EXPERIMENTACIÓN?

 La experimentación es una técnica utilizada para encontrar el comportamiento de una variable a partir de diferentes combinaciones de factores o variables de entrada de un proceso, que al cambiar afectan la respuesta. Para entrar a experimentar es necesario pasar primero por el diseño de experimentos, esta técnica busca la manipulación sistemática de las variables de entrada de un proceso para entender el efecto que estas pueden causar en la variable respuesta. Es ampliamente utilizado en las empresas debido a que éste permite visualizar situaciones que pueden suceder a partir de la realización de un proceso. En la industria se utiliza principalmente para buscar el mejoramiento del rendimiento de un proceso, para reducir la variabilidad y permitir que haya un mayor acercamiento a los parámetros de la empresa, para reducir tiempos de procesamiento y reducir costos. Cualquier problema experimental incluye: diseño del experimento y análisis de los datos.
Fuente: “La Experimentación” disponible en:  http://academic.uprm.edu/dgonzalez/6005/Definiciones.pdf

Ventajas y desventajas de la experimentación
Ventajas
1.      Se requiere una estrecha colaboración entre los estadísticos y el investigador o científicos con las consiguientes ventajas en el análisis e interpretación de las etapas del programa.
2.      Se enfatiza respecto a las alternativas anticipadas y respecto a la pre-planeación sistemática, permitiendo aun la ejecución por etapas y la producción única de datos útiles para el análisis en combinaciones posteriores.
3.      Debe enfocarse la atención a las interrelaciones y a la estimación y cuantificación de fuentes de variabilidad en los resultados.
4.      El número de pruebas requerido puede determinarse con certeza y a menudo puede reducirse.
5.      La comparación de los efectos de los cambios es más precisa debido a la agrupación de resultados.
6.      La exactitud de las conclusiones se conoce con una precisión matemáticamente definida.
Desventajas
1.      Tales diseños y sus análisis, usualmente están acompañados de enunciados basados en lenguaje técnico del estadístico. Sería significativos a la generalidad de la gente, además, el estadístico no debería subestimar el valor de presentarnos los resultados en forma gráfica. De hecho, siempre debería considerar a la representación gráfica como un paso preliminar de un procedimiento más analítico.
2.      Muchos diseños estadísticos, especialmente cuando fueron formulados por primera vez, se han criticado como demasiado caros, complicados y que requieren mucho tiempo. Tales críticas, cuando son válidas, deben aceptarse de buena fe y debe hacerse un intento honesto para mejorar la situación, siempre que no sea en detrimento de la solución del problema.
Fuente: COX D. R. Planning of Experiments. John Wiley and Sons, Inc. New York. 1988.

MEDIDAS DE TENDENCIA CENTRAL Y DISPERCION

1. MEDIA ARITMÉTICA
Es aquella medida destinada a reducir un conjunto de datos, siendo juzgados  n elementos con un mismo valor.
Esta medida se obtiene al dividir la suma de todos los valores de una variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de datos dividida por el número total de dichos datos.

X = Suma de todos los valores   =   x1 + x2 + x3 + … + xn
              Número total de datos                 n

 Ejemplo :
 En matemáticas, un alumno tiene las siguientes notas:  4, 7, 7, 2, 5, 3
            n = 6 (número total de datos)
X
=
4 + 7 + 7 + 2 + 5 + 3
=
 28
=
4,8
6
6

La media aritmética de las notas de esa asignatura es 4,8. Este número representa el promedio.

2. MEDIANA
Es aquel dato que es superado y a la vez supera en igual cantidad de número en un conjunto de observaciones.
Es una medida de posición. Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente. Dicho en otras palabras, la Mediana corresponde al valor que deja igual número de valores antes y después de él en un conjunto de datos agrupados.
Según el número de valores que se tengan se pueden presentar dos casos:
- Si el número de valores es impar, la Mediana corresponderá al valor central de dicho conjunto de datos.
- Si el número de valores es par, la Mediana corresponderá al promedio de los dos valores centrales (los valores centrales se suman y se dividen por 2).
Ejemplo :
Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2
Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 
                                                           1, 2, 4,  5  , 8, 9, 10
El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

Fuente: “Medidas Estadísticas” disponible en: http://www.profesorenlinea.cl/matematica/EstadisticaMediaMedianaModa.htm

3. MODA
Es definida como aquel valor de la variable que más se repite, es decir tiene la máxima frecuencia de distribución.
Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos, o sea, cual se repite más.
Ejemplo :
Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de niñas de un Jardín Infantil.
                  5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3
La edad que más se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

MEDIDAS DE DISPERCIÓN


Estas nos informan sobre cuánto se alejan del centro los valores de la distribución.
Las medidas de dispersión son:
1.      RANGO
Es la medida primaria entre un conjunto de datos dispersos. El rango es la diferencia entre el mayor y el menor de los datos de una distribución estadística.
2.      DESVIACIÓN MEDIA
La desviación respecto a la media es la diferencia entre cada valor de la variable estadística y la media aritmética.
Di = x - x
La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.
La desviación media se representa por     D_
                                                                 X
                       _                 _                         _
  D_  =  | X1 – X | + | X2 – X | + … + | Xn – X |
     X
                                         N
                            
Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
  D_  =   9 + 3 + 8 + 8 + 9 + 8 + 9 + 18   =  9
     X
                                  8        
  D_  =  | 9 – 9 | + | 3 – 9 | + | 8 – 9 | + | 8 – 9 | + | 9 – 9 | + | 8 – 9 | + | 9 – 9 | + | 18 – 9 |
     X
                                                               8

Desviación media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la desviación media es:                       
                       _                   _                             _
  D_  =  | X1 – X |f1 + | X2 – X | f2 + … + | Xn – X | fn
     X
                                           N
Ejemplo
Calcular la desviación media de la distribución:

xi
fi
xi · fi
|x - x|
|x - x| · fi
[10, 15)
12.5
3
37.5
9.286
27.858
[15, 20)
17.5
5
87.5
4.286
21.43
[20, 25)
22.5
7
157.5
0.714
4.998
[25, 30)
27.5
4
110
5.714
22.856
[30, 35)
32.5
2
65
10.174
21.428


21
457.5

98.57

_
X = 457.5 / 21 = 21.786
D_  =  98.57 / 21 = 4.69
   X

3.      VARIANZA
La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística.
La varianza se representa por s2.
                 _                 _                         _
s2 = (X1 – X)2 + (X2 – X)2 + … + (Xn – X)2
                                               N
                  
Varianza para datos agrupados
                 _                    _                            _
s2 = (X1 – X)2f1 + (X2 – X)2f2 + … + (Xn – X)2fn
                                               N
         




4.      Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación.
La desviación típica se representa por σ.
                   _                 _                         _
s = Ö (X1 – X)2 + (X2 – X)2 + … + (Xn – X)2 / N
                                   
Desviación típica para datos agrupados
                   _                    _                           _
s = Ö (X1 – X)2f1 + (X2 – X)2f2 + … + (Xn – X)2fn  / N
   
Ejercicios de desviación típica
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18

Calcular la desviación típica de la distribución de la tabla:

xi
fi
xi · fi
xi2 · fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60)
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250


42
1 820
88 050

             
Fuente: “Medidas de Dispersión” Disponible en http://www.profesorenlinea.cl/matematica/EstadisticaMediaMedianaModa.htm

Prueba de Ajuste de Bondad Chi Cuadrada

De los datos obtenidos en una experimentación, a veces es necesario conocer el tipo de distribución a la cual se ajustan adecuadamente (normal, binomial o de Poisson). Así, el investigador podrá también elegir el procedimiento estadístico más adecuado. Al respecto, es válido el ejemplo siguiente:
Ejemplo:
Ajuste de datos para una distribución normal, de un conjunto de mediciones en la tabla de niños de 5 años. Tamaño de la muestra 100.
Elección de la prueba estadística.
El modelo experimental tiene una muestra y nuestro objetivo es la bondad del ajuste.
Planteamiento de la hipótesis.
  • Hipótesis alterna (Ha). Las frecuencias observadas difieren de las que corresponden a una distribución normal.
  • Hipótesis nula (Ho). Las diferencias observadas entre los valores observados y los teóricos se deben al azar.
Nivel de significación.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Talla de niños de 5 años de edad.
Series de Clases de Talla (cm)
Frecuencia Observada
De 90 a 93
8
De 94 a 97
18
De 98 a 101
42
De 102 a 105
27
De 106 a 109
8
Total
100

Aplicación de la prueba estadística.
Para calcular el valor teórico, se debe aplicar el valor Z; por lo tanto, primero se debe obtener el valor promedio y la desviación estándar de los valores por ajustar.
_
X = 100.1
s = 3.91

En seguida se determinan los límites reales de cada clase y se calcula el valor Z para cada límite real.

Z (90 CM) =
90 - 100.1
=
-2.58
3.91
Z (93 CM) =
93 - 100.1
=
-1.82
3.91
Z (97 CM) =
97 - 100.1
=
-0.79
3.91
Z (101 CM) =
101 - 100.1
=
0.23
3.91
Z (105 CM) =
105 - 100.1
=
1.25
3.91
Z (109 CM) =
109 - 92.2
=
2.27
2.85


Para cada valor de Z, se localiza el valor del área bajo la curva de valores Z.
Obtención de valores teóricos de la distribución normal.

Series  de Talla
Límites Reales
Z para límites
Área bajo la curva Z
Área para cada clase
Frecuencia teórica
Frecuencia Observada

90
2.58
0.4951



De 90 a 93
93
1.82
0.4656
0.0295
3
8
De 94 a 97
97
0.79
0.2852
0.1804
18
18
De 98 a 101
101
0.23
0.091
0.3762
38
42
De 102 a 105
105
1.25
0.3944
0.3034
30
27
De 106 a 109
109
2.27
0.4884
0.094
9
8


Una vez anotados los valores del área bajo la curva normal para cada Z, se calcula el área que corresponde a cada talla. Para fines prácticos y a fin de ejecutar el procedimiento, el signo de Z se mantiene en el valor del área bajo la curva, y se realiza de la manera siguiente:
Clase 90 - 93 = -0.4656 - (-0.4951) = 0.0295
Clase 94 - 97 = -0.2852 - (-0.4656) = 0.1804
Clase 98 - 101 = 0.091 - (-0.2852) = 0.3762
Clase 102 - 105 = 0.3944 - 0.091 = 0.3034
Clase 106 - 109 = 0.4884 - 0.3944 = 0.094
Cada valor del área para la curva de clase se multiplica por el tamaño de la muestra (N); en este caso corresponde a 100. Para obtener los valores teóricos, se selecciona el valor entero más cercano.
En seguida se aplica la ecuación de X2.
X2 = SHN = 1 (fo – fe)2
                       fe

X2 = S (5 – 3)2 + (18 – 18)2 + (42 – 38)2 + (27 – 30)2 + (8 – 9)2
               3               18                38                30               9
X2 = S 1.333 + 0 + 0.105 + (-0.1) + (-0.111) = 1.227
Cálculo de los grados de libertad.
gl = K - 1 - 1 = 5 - 1 - 1 = 3
El valor de X2 calculado con 3 gl se compara con los respectivos valores críticos de la tabla de valores críticos de X2 y corresponde a 7.82 para una probabilidad de 0.05.
Decisión.
En virtud de que el valor calculado cae en la zona de rechazo, se acepta Ho y se rechaza Ha.
Interpretación.
Los valores de las frecuencias observadas para las cinco series de talla tienen una distribución normal y no difiere de los valores calculados en función de las áreas bajo la curva normal tipificada.



TABLA DE VALORES N # 2 (CHI2)

Probabilidad de un valor superior - Alfa (α)
Grados libertad
0,1
0,05
0,025
0,01
0,005
1
2,71
3,84
5,02
6,63
7,88
2
4,61
5,99
7,38
9,21
10,6
3
6,25
7,81
9,35
11,34
12,84
4
7,78
9,49
11,14
13,28
14,86
5
9,24
11,07
12,83
15,09
16,75
6
10,64
12,59
14,45
16,81
18,55
7
12,02
14,07
16,01
18,48
20,28
8
13,36
15,51
17,53
20,09
21,95
9
14,68
16,92
19,02
21,67
23,59
10
15,99
18,31
20,48
23,21
25,19
11
17,28
19,68
21,92
24,73
26,76
12
18,55
21,03
23,34
26,22
28,3
13
19,81
22,36
24,74
27,69
29,82
14
21,06
23,68
26,12
29,14
31,32
15
22,31
25
27,49
30,58
32,8
16
23,54
26,3
28,85
32
34,27
17
24,77
27,59
30,19
33,41
35,72
18
25,99
28,87
31,53
34,81
37,16
19
27,2
30,14
32,85
36,19
38,58
20
28,41
31,41
34,17
37,57
40
21
29,62
32,67
35,48
38,93
41,4
22
30,81
33,92
36,78
40,29
42,8
23
32,01
35,17
38,08
41,64
44,18
24
33,2
36,42
39,36
42,98
45,56
25
34,38
37,65
40,65
44,31
46,93
26
35,56
38,89
41,92
45,64
48,29
27
36,74
40,11
43,19
46,96
49,65
28
37,92
41,34
44,46
48,28
50,99
29
39,09
42,56
45,72
49,59
52,34
30
40,26
43,77
46,98
50,89
53,67
40
51,81
55,76
59,34
63,69
66,77
50
63,17
67,5
71,42
76,15
79,49
60
74,4
79,08
83,3
88,38
91,95
70
85,53
90,53
95,02
100,43
104,21
80
96,58
101,88
106,63
112,33
116,32
90
107,57
113,15
118,14
124,12
128,3
100
118,5
124,34
129,56
135,81
140,17
  
Fuente: “Prueba de bondad de ajuste mediante ji cuadrada”  disponible en “FortuneCity” http://members.fortunecity.com/bucker4/estadistica/pruebabondadaji.htm