4  Descripción y Justificación del Modelo.

El modelo Equation 3.1 pretende responder a la pregunta que denota el modelo ¿Cuánto producto tendré disponible al dia siguiente?. Lo anterior menciona que nuestras etapas \(t\in \mathcal{T} = \{t\in \mathbb{Z}^+: t\leq T,T\in \mathbb{N}\}\) representaran los dias dentro de un periodo \(T\), \(t\) hace referencia al dia actual, y \(t+1\) al dia siguiente. Entonces el modelo general esta dado por

\[ X_{t+1} = (\text{Today} + \text{In}_t - \text{Out}_{t})^+. \]

Esto es, la parte positiva del producto que hay “hoy”, es decir, \(X_t\). A eso le agregaremos el producto que entrará hoy al final del dia, en nuestro modelo solo habrá ingreso de producto mediante solicitud (En este caso no consideramos un almacenimiento dentro del supermercado), entonces \(\text{In}_t\) esta dado por nuestras acciones \(\text{In}_t = a_t\).

La parte que saldrá consta de dos elementos. En general consideramos la cantidad de producto que se compró en el dia \(t\). Sin embargo, desconocemos la cantidad requerida, haciendo referencia al dia siguiente. Por lo tanto la demanda está representada por \(D_{t+1}\), la cantidad de producto requerida al dia siguiente. En nuestro modelo también consideramos la salida de producto por considerarse producto no apto para la venta. Entonces

\[ \text{Out}_t = D_{t} + N_t(X_t). \]

Bajo de la suposición que todos los productos poseen el mismo tiempo de vida con periodos de vida distintos supondremos que cada dia, al final, se retira un factor con respecto a la cantidad actual de producto. \[ N_t = \eta X_t \]

\[ \text{Out}_t = D_{t} + \eta X_t \]

Finalmente, nos queda definir la función de costo, en nuestro modelo será la ganancia. Al considerar un periodo finito tenemos que la ganancia total \(G\) esta dada por

\[ G(x_0, \pi) = \sum_{t=0}^{T} R_t,X_0 = x_0, X_{t+1} = f(X_t, a_t), R_t = R(x_t,a_t,\xi_t) \]

donde \(\pi\) es una politica, \(\pi = (a_0,a_1, \ldots, a_{N-1})\). y \(R_t\) es la ganancia por etapa, en nuestro caso \[ R(x,a,\xi) = P_V \min\{x + a, \xi\} - P_C a - P_C \min{\xi - x - a, 0}. \]

Al intervenir una variable aleatoria, entonces nos interesaría el valor esperado.

\[ \mathcal{G}(x) = E_\pi[G\mid X_t = x]. \]