Función de recompensa por existencias

Por Joannès Vermorel, diciembre de 2015 (última revisión: febrero de 2017)

La función de recompensa por existencias cuantifica los rendimientos esperados, tanto positivos como negativos, de almacenar una determinada cantidad de unidades en stock. Fundamentalmente, esta función responde a la pregunta ¿qué se obtiene por tener una unidad adicional en stock? Esta función puede utilizarse para componer una política de pedido priorizado en la que todas las unidades se priorizan de acuerdo con sus rendimientos económicos específicos. Lokad recomienda el uso de la función de recompensa por existencias para la mayoría de las situaciones de optimización del inventario.


La perspectiva menos técnica

Desde un punto de vista puramente de pronóstico, la demanda futura se representa mejor mediante probabilidades asociadas a todos los futuros posibles; es decir, la probabilidad de tener demanda de 0 unidades, de 1 unidad, etc., y tales probabilidades se calculan para cada artículo (productos, SKIU, códigos de barras), según el contexto.

Sin embargo, si bien estas probabilidades ofrecen un panorama detallado del futuro, no dicen nada sobre las decisiones que deben tomarse sobre el inventario. Las decisiones de inventario no pueden basarse solamente en las probabilidades de la demanda; también deberían considerarse los riesgos financieros.

Por ejemplo, consideremos dos productos que tienen las mismas probabilidades de demanda. Si el primer producto es de larga vida, mientras que el segundo tiene una vida breve en anaquel, desde una perspectiva de inventario, tiene sentido almacenar más unidades en stock del producto de larga vida.

La recompensa por existencias es una función matemática que calcula la rentabilidad de agregar una unidad adicional de stock de un artículo dado teniendo en cuenta un pronóstico probabilístico de la demanda futura, unas variables económicas que reflejan el rendimiento esperado cuando se proporciona el artículo y los costos esperados cuando la unidad queda en stock por falta de demanda.

El equipo de Lokad considera la función de recompensa por existencias es el pilar de la optimización del inventario moderna. Las soluciones que aporta la función de recompensa por existencias generalmente son mejores que las obtenidas a través de abordajes ingenuos que consisten en poner como objetivo un nivel de servicio o una tasa de llenado específicos. De hecho, esos abordajes ignoran las desventajas, es decir, los costos asociados con la imposibilidad de vender los artículos en stock.

Factores económicos de la recompensa por existencias

El análisis de la recompensa por existencias es un análisis económico en el sentido de que busca establecer los rendimientos financieros de una posición de inventario. Para lograr esto tenemos que introducir algunos factores económicos básicos que afectan los rendimientos obtenidos del inventario.

La perspectiva económica no debería limitarse a un análisis superficial de maximización de la rentabilidad. En particular, los costos en que se incurre por los clientes expuestos a situaciones de desabastecimiento son una parte integral del análisis. Sin embargo, el abordaje proporciona el marco para equilibrar los costos de inventario con los costos de situaciones de desabastecimiento, pero encontrar ese equilibrio en general depende exclusivamente de cada sector.

Definamos tres variables asociadas a una sola SKU cuando se considera una duración equivalente al tiempo de entrega:

  • $M$ es el margen bruto por la venta de 1 unidad
  • $S$ es la penalización de desabastecimiento (negativa) por no vender 1 unidad
  • $C$ es la penalización de costo de almacenamiento (negativa) por no vender 1 unidad en stock

Estas variables son fundamentales en el sentido de que no puede realizarse ninguna optimización del inventario sin una estima de esas variables. Sin siquiera una estima rudimentaria de esas variables, cualquier metodología de pedido está destinada a padecer uno o más de los problemas enumerados a continuación:

  • El método no logra reflejar los riesgos del inventario asociados a la demanda futura que puede no verificarse. Por lo tanto, si bien el método puede proporcionar buenos niveles de servicio, al final acaba por crear inventario muerto.
  • El método no logra reflejar los costos en los que se incurre del lado del cliente con los desabastecimientos, y tampoco refleja las pérdidas de oportunidades de no servir a los clientes.
  • El método no logra reflejar la importancia de servir la unidad en cuestión y generar una ganancia que en verdad sostenga al inventario mismo.

Sobre la base de estas consideraciones, veamos dos escenarios simples según sea que la demanda exceda las existencias o no. Supongamos que $k$ es la cantidad de unidades en stock, y que $y$ es la cantidad de unidades solicitada por los clientes.

Si las existencias exceden la demanda, es decir, $k \geq y$, la recompensa inmediata asociada a las existencias es $yM+(k-y)C$. De hecho, $yM$ da cuenta de las $y$ unidades que se sirven con las recompensas correspondientes, mientras que $(k-y)C$ da cuenta de los costos de almacenamiento para las $(k-y)C$ unidades no vendidas al final de un período determinado.

Si la demanda excede las existencias, es decir, $k < y$, la recompensa inmediata se expresa como $kM+(y-k)S$. En este caso, las primeras $k$ unidades se sirven de modo adecuado y corresponden a $kM$ de recompensas, pero luego faltan $y-k$ unidades y se incurre en $(y-k)S$ de penalización por desabastecimiento.

Definición de la función de recompensa por existencias

En la sección anterior, calculamos la recompensa inmediata; sin embargo, la optimización del inventario es un proceso de repetición. Las unidades de stock que no se venden en el próximo período temporal pueden venderse en el período siguiente, lo que genera una ganancia tardía. Otra posibilidad es que las unidades que no se venden durante el próximo período temporal tampoco se vendan en el período que sigue, lo que generaría mayores costos de almacenamiento atrasados. La función de recompensa por existencias aborda estos desafíos teniendo en cuenta no solo el período temporal siguiente, sino todos los períodos que futuros.

Definimos la función de recompensa por existencias como: $$R(t, k)= \begin{cases} kM+(y_t-k)S & \text{if $y_t \geq k$ (stockout)} \\ y_tM+(k-y_t)C + \alpha R^*(t+1, k-y_t) & \text{if $y_t < k$ (leftover)} \end{cases}$$ donde:

  • $k$ es la cantidad de unidades almacenadas en stock
  • $y_t$ es la demanda para el período $t$
  • $M$, $S$ y $C$ son las variables económicas presentadas anteriormente
  • $\alpha$ es un factor de descuento del que hablaremos más adelante
  • $R^*$ es idéntico a $R$ pero con $S=0$. También de esto hablaremos más adelante.

A primera vista, esta fórmula puede parecer un tanto abrumadora, pero es en realidad un modelo directo de una sola SKU con $k$ unidades en stock enfrentando una demanda de $y_t$ unidades. De hecho, con excepción del componente $\alpha R^*(t+1, k-y_t)$, esta expresión es como la recompensa inmediata que hemos descrito en la sección anterior.

Por lo tanto, para tener en cuenta todos los períodos temporales siguientes, se realizan dos ajustes. Primero, tenemos una llamada recursiva a la función de recompensa misma, lo que significa que la recompensa es la suma de las recompensas (o de las pérdidas) del próximo período más todas las recompensas (o las pérdidas) de todos los períodos temporales siguientes. A primera vista, puede resultar un poco confuso tener una función que "camina" indefinidamente hacia el futuro, pero esto simplemente refleja el hecho de que el inventario no vendido pasa de un período al siguiente.

En segundo lugar, introducimos $\alpha$ como un factor de descuento para las recompensas futuras. Este abordaje se inspira en el método de flujo de fondos descontados, que refleja el hecho de que una ganancia generada en un futuro lejano tiene menos valor que una ganancia generada en un futuro cercano. A la inversa, la misma lógica se aplica también a los costos: un costo inmediato tiene más impacto que un costo que se verificará en un futuro lejano.

Por último, para llevar a cabo la recurrencia, en lugar de utilizar $R$, se utiliza $R^*$, que ignora los costos de los desabastecimientos. Esto refleja que no es responsabilidad de las existencias actuales evitar los desabastecimiento para cualquier otro período de tiempo de entrega que no sea el actual. De hecho, por definición, el tiempo de entrega representa la duración que cubrirán las existencias actuales. Para el siguiente período temporal habrá, por definición, otra oportunidad de comprar más existencias (veremos de qué manera el caso de no reorden puede incluirse en la sección siguiente). Por lo tanto, la responsabilidad de no llegar a una situación de desabastecimiento durante un período temporal subsiguiente recae sobre una decisión de inventario posterior.

Cálculo probabilístico de la función de recompensa por existencias

La expresión de la función de recompensa por existencias $R$ depende de la demanda futura $y_t$, que generalmente no se conoce. No obstante, $R$ puede calcularse de todos modos si hay pronósticos disponibles. Para calcular $R$, le sugerimos que utilice un pronóstico probabilístico de la demanda futura, es decir, no solo un cálculo de la demanda futura promedio, sin cálculos de toda la distribución de probabilidad. Sobre la base de este dato, podemos introducir $\hat{R}$, es decir, el cálculo empírico de $R$, que se vale de un pronóstico de demanda probabilístico. La función $\hat{R}$ se escribe del siguiente modo: $$ \begin{align} \hat{R}(t,k)= & \sum_{y |y \geq k} \mathbf{P}(Y_t=y) ( kM+(y-k)S ) \\ & + \sum_{y|y < k} \mathbf{P}(Y_t=y) ( yM+(k-y)C + \alpha \hat{R}^*(t+1, k-y) ) \end{align} $$ Esta expresión transforma la expresión original $R$ en probabilidades condicionales. La primera línea refleja los escenarios de desabastecimiento, mientras que la segunda línea refleja los escenarios de existencias sobrantes. Ambas líneas se ponderan con respecto a sus respectivas probabilidades.

Como veremos en la sección siguiente, $\hat{R}$ puede calcularse con fines prácticos. De hecho, Lokad proporciona una función integrada llamada stockrwd que implementa precisamente esta fórmula. Abordaremos este punto en más detalle en la sección siguiente.

En la práctica, la única medida disponible es $\hat{R}$, porque $R$ no puede calcularse efectivamente, ya que la demanda futura aún no se conoce. Por lo tanto, cuando nos referimos a la función de recompensa por existencias, efectivamente hablamos de su cálculo $\hat{R}$ y no de la función "real" $R$. Es preciso señalar también que la precisión del cálculo $\hat{R}$ depende naturalmente de la precisión de los pronósticos probabilísticos subyacentes. Sin embargo, este tema excede los objetivos del presente documento.

Propiedades de la función de recompensa por existencias

La función de recompensa por existencias puede escribirse $R(k, M, S, C)$ para enfatizar las variables económicas. La función de recompensa por existencias es acumulativa con respecto a sus componentes: $$\begin{align} R(k, M, S, C) = & R(k, M, 0, 0) + \\ & R(k, 0, S, 0) + \\ & R(k, 0, 0, C) \end{align}$$ Luego, la función de recompensa por existencias es lineal con respecto a sus parámetros $M$, $S$ y $C$: $$\begin{align} R(k, aM, bS, cC) = & aR(k, M, 0, 0) + \\ & bR(k, 0, S, 0) + \\ & cR(k, 0, 0, C) \end{align}$$ Estas propiedades se extienden naturalmente a stockrwd, la función de Envision proporcionada por Lokad.

Las funciones stockrwd en Envision

La función stockrwd es una función de Envision, una herramienta de Lokad, que implementa la función de recompensa por existencias, o bien su cálculo probabilístico, siempre que haya a disposición un pronóstico probabilístico. Si nos interesara el incremento en la recompensa por la unidad número  k en stock, definimos la función de Envision como: $$\text{stockrwd}: k \to R(k)-R(k-1)$$

La sintaxis correspondiente en Envision es la siguiente:
// componente de recompensa marginal
RM = stockrwd.m(Demand, AM) * M 
// componente de penalización por desabastecimiento
RS = stockrwd.s(Demand) * S 
// componente de costo de almacenamiento
RC = stockrwd.c(Demand, AC) * C 
// recomposición de la recompensa por existencias 
// con sumas puntuales
R = RM + RS + RC
Envision descompone la función de recompensa por existencias en sus tres componentes. Debido a que los componentes son lineales con respecto a sus respectivas variables económicas, estas se dejan fuera de la llamada a la función stockrwd(). Esta descomposición facilita la inspección de las cantidades económicas generadas por la función de recompensa por existencias y simplifica el ajuste de las suposiciones económicas que guían el cálculo.

Se espera que el primer argumento Demand sea una distribución. Esta distribución representa la demanda probabilística y generalmente es elaborada por el motor de pronóstico. Como tal, se espera que Demand sea no solo una distribución, sino también una variable aleatoria (masa igual a 1).

Las últimas tres variables M, S y C son las variables económicas definidas al principio de este documento. Los argumentos AM y AC son dos factores de descuento distintos. En la práctica, se espera que S y C sean negativos. También se espera que los valores AM y AC estén incluidos en el segmento $[0;1[$.

La función devuelve R, una distribución que refleja $k \to R(k) - R(k-1)$. Atención: esta distribución no es una variable aleatoria, sino una función de recompensa económica. En realidad, la definición formal implica que ni siquiera es una distribución de soporte compacta. Envision cuenta con algoritmos específicamente pensados para gestionar este tipo de distribuciones no compactas.

Veamos una definición típica de las variables económicas:
M = SellPrice - BuyPrice
// 0.5 arbitrario
S = -0.5 * (SellPrice - BuyPrice) 
// 0.5 arbitrario
C = -0.3 * BuyPrice * mean(Leadtime) / 365 
// 'AM' para componente marginal
AM = 0.3 
// 'AC' para componente de costo de almacenamiento
AC = 1 - 0.2 * mean(LeadTime) / 365
Tenemos:

  • M se define como el margen bruto por unidad.
  • S se define arbitrariamente como 0,5 veces el margen bruto. Naturalmente, el impacto puede variar de un sector a otro de acuerdo con la tolerancia del cliente a las situaciones de desabastecimiento.
  • C se expresa como costos de almacenamiento anuales que representan el 30 % del precio de compra inicial (por año). El factor C refleja períodos de mean(LeadTime) días en lugar de años.
  • AM, el factor de descuento para la recompensa marginal, se expresa como un declive marcado del 70 % entre un período y el siguiente.
  • AC, el factor de descuento para el costo de almacenamiento, se expresa como un descuento anual del 20 % en recompensas futuras. Del mismo modo, el valor se escala para adecuarse al tiempo de entrega mediante mean(Leadtime) / 365.

En la práctica, se espera que también los tiempos de entrega probabilísticos sean pronosticados por el motor de pronóstico. Como consecuencia, en el script anterior, suponemos que Leadtime es una distribución.

Factores de descuento para margen y costo de almacenamiento

El factor de descuento A documentado anteriormente no está pensado para ser utilizado del mismo modo para los tres componentes de la función de recompensa por existencias.

Para el componente marginal de la recompensa por existencias, se mantiene la oportunidad de comprar más inventario en otro momento futuro. Por lo tanto, el factor de descuento debería penalizar fuertemente las cantidades compradas que solo generarían margen en períodos futuros. De hecho, por definición, se mantiene la oportunidad de comprar stock en otro momento para afrontar esos períodos futuros. Por eso, sugerimos un descuento importante AM = 0.3.

Para el componente de penalización por desabastecimiento de la recompensa por existencias, por definición, el factor de descuento es siempre cero. Por lo tanto, el factor de descuento no afecta este componente.

Para el componente de costo de almacenamiento de la recompensa por existencias, el stock es un activo financiero en declive. Para AC, sugerimos un 20 % de descuento anual, porque el inventario solo genera costos con el tiempo, y porque hay que tener en cuenta el costo de oportunidad: el dinero invertido ahora para comprar stock no estará disponible luego, cuando la demanda futura se haya observado.

Pedidos pendientes y recompensa por existencias

Los pedidos pendientes complican la situación. Cuando existen pedidos pendientes, la demanda futura es solo parcialmente desconocida, ya que se supone que las cantidades de pedidos pendientes son conocidas. Además, debido a que los clientes han hecho un esfuerzo adicional al aceptar los productos en pedido pendiente, el cumplimiento de esos pedidos generalmente se considera incluso más importante que el cumplimiento de pedidos normales. El script a continuación ilustra el modo en que la función de recompensa por existencias puede combinarse con los pedidos pendientes.
MB = 0.5 * SellPrice // arbitrario
SB = 0.5 * SellPrice // arbitrario

MBU = MB * uniform(1, Backorder)
SBU = SB * uniform(1, Backorder)

RM = MBU + (stockrwd.m(Demand, AM) * M) >> Backorder
RS = SBU + zoz(stockrwd.s(Demand) * S) >> Backorder
RC = (stockrwd.c(Demand, AC) * C) >> BackOrder
R = RM + RS + RC // recomposición simple
Las dos variables económicas MB y SB representan el margen por unidad y la penalización por desabastecimiento para las unidades en pedido pendiente mismas. Podríamos haber utilizado M y S, pero, como se indicó anteriormente, los pedidos pendientes generalmente se consideran más importantes que los pedidos normales.

El script aprovecha ampliamente el operador de desplazamiento >> proporcionado por Envision. De hecho, debido a que se supone que las cantidades en pedido pendiente son demanda conocida, la distribución de recompensas se desplaza hacia la derecha de consecuencia. Atención: desplazar la demanda primero, es decir, Demand, no arrojaría los mismos resultados. De hecho, lo que el desplazamiento de la demanda le comunicaría a la recompensa por existencias es que en cada período futuro, la cantidad Backorder sería demanda garantizada.

Ilustración visual de la recompensa por existencias

Llegados a este punto, tal vez la función de recompensa por existencias siga pareciendo un poco críptica. A continuación, una representación visual de las transformaciones de serie asociadas con la demanda al aplicar un análisis de recompensa por existencias en presencia de pedidos pendientes.

Image

El primer gráfico —titulado Demanda futura— representa un pronóstico de demanda probabilístico asociado con una determinada SKU. La curva representa una distribución de probabilidades, siendo el área total debajo de la curva igual a uno. En el fondo, esta demanda futura se asocia implícitamente a un pronóstico probabilístico de tiempo de entrega, también representado como una distribución de probabilidades. Una distribución de este tipo habitualmente se genera a través de un motor de pronóstico probabilístico.

El gráfico Tasa de llenado marginal representa la fracción de demanda adicional capturada por cada unidad adicional de stock. Dicho de otro modo, este gráfico demuestra lo que sucede con la tasa de llenado a medida que el stock aumenta. Debido a que aquí estamos representando un tasa de llenado marginal, el área total debajo de la curva sigue siendo igual a uno. La distribución de la tasa de llenado marginal puede calcularse con la función fillrate().

El gráfico Demanda con pedidos pendientes es idéntico al gráfico Demanda futura, con la excepción de que se han introducido 8 unidades para representar un pedido pendiente. El pedido pendiente representa una demanda garantizada, ya que estas unidades ya han sido compradas por clientes. Como resultado, cuando se introducen unidades en pedido pendiente, la distribución de probabilidad de la demanda se desplaza hacia la derecha, siendo que las unidades en pedido pendiente son demanda garantizada. El operador de desplazamiento >> está disponible como parte del álgebra de distribución para calcular esa transformación sobre la distribución inicial.

El gráfico Tasa de llenado con pedidos pendientes también es muy similar al gráfico Tasa de llenado marginal original, pero también ha sido desplazado 8 unidades hacia la derecha. Aquí, la tasa de llenado trazada solo se asocia con la demanda incierta, lo que explica que la forma de la distribución se mantenga igual.

El gráfico Margen representa la recompensa económica marginal calculada por la función de recompensa por existencias tomando como dato de entrada el gráfico Demanda con pedidos pendientes. La recompensa por existencias puede visualizarse como una distribución, pero no es una distribución de probabilidades: el área debajo de la curva no es igual a uno, sino que es igual al margen total que debería capturarse con un inventario ilimitado. A la izquierda del gráfico, cada unidad en pedido pendiente produce el mismo margen, algo que no sorprende, ya que no existe incertidumbre en la captura del margen dado que las unidades ya han sido compradas.

El gráfico Penalización por desabastecimiento representa el segundo componente de la función de recompensa por existencias. La forma de la distribución puede resultar un poco inesperada, pero simplemente refleja que, por la construcción misma de la función de recompensa por existencias, el área total debajo de la curva es cero. Intuitivamente, al comenzar por un nivel de stock de cero, tenemos la suma de todas las penalizaciones por desabastecimiento, ya que estamos perdiendo toda la demanda. Luego, a medida que nos desplazamos hacia la derecha con niveles de stock mayores, vamos satisfaciendo cada vez más demanda y, por lo tanto, reduciendo cada vez más las penalizaciones por desabastecimientos, hasta que ya no quedan penalizaciones, porque toda la demanda ha sido satisfecha. La penalización por desabastecimiento derivada de no satisfacer los pedidos pendientes se representa como mayor que la penalización por no satisfacer la demanda que sigue. Aquí estamos ilustrando la suposición de que los clientes que ya han realizado un pedido pendiente generalmente tiene expectativas más elevadas de servicio que los clientes que aún no han comprado ningún artículo.

El gráfico Costos de almacenamiento representa el tercer y último componente de la función de recompensa por existencias. Debido a que no existe un límite superior para los costos de almacenamiento —siempre es posible almacenar una unidad más de stock, lo que aumenta los costos de almacenamiento—, la distribución es divergente: tiende al infinito negativo a la derecha. El área total debajo de la curva es infinito negativo, si bien es una perspectiva más bien teórica. A la derecha, los costos de almacenamiento asociados con las unidades en pedido pendiente son iguales a cero: de hecho, debido a que esas unidades ya han sido compradas por los clientes, no harán incurrir en costos de almacenamiento algunos, debido a que esas unidades se enviarán a los clientes en cuanto sea posible.

La recompensa por existencias final —no representada más arriba— se obtendría sumando los tres componentes de la función de recompensa por existencias. La distribución resultante se interpretaría como el ROI para cada unidad adicional de stock por comprar. Esta distribución generalmente comienza con valores positivos, siendo las primeras unidades de stock rentables, pero converge hacia el infinito negativo a medida que nos desplazamos hacia niveles de stock mayores dados los costos de almacenamiento ilimitados.

El término soporte generalmente se refiere a los niveles de demanda asociados con probabilidades diferentes de cero. En los gráficos anteriores, el término _soporte_ se refiere de modo general a toda la gama que Envision debe procesar como valores diferentes de cero. En particular, vale la pena mencionar que existen varios cálculos que requieren que el soporte de distribución se extienda para asegurar que la distribución final resultante no se trunque.

  • La operación de desplazamiento, que sucede cuando hay pedidos pendientes, requiere el soporte para ser aumentada por el número de unidades en pedido pendiente.
  • Los componentes de margen y costo de almacenamiento de la función de recompensa por existencias no tienen límites teóricos a la derecha y puede requerir arbitrariamente grandes extensiones del soporte.
  • Las limitaciones de pedido, como las MOQ, pueden requerir contar con niveles de inventario que sean aún mayores que los alcanzados por las distribuciones desplazadas. La evaluación adecuada de la cola de la distribución es la clave para calcular si la MOQ puede satisfacerse de modo rentable o no.

Un dato estratégico importante de la ilustración anterior es la necesidad de extender el cálculo de la función de recompensa por existencias más allá del rango de la demanda diferente de cero. De hecho, cada vez que haya MOQ, la empresa puede verse obligada a comprar productos superando una cobertura de nivel de servicio del 100 % de la demanda futura para el período siguiente. La función de recompensa por existencias cubre también esas situaciones. El impacto de las MOQ se aborda con mayor detalle en el siguiente apartado. En la práctica, el tiempo de ejecución de Envision se encarga de ajustar automáticamente el soporte para asegurar que las distribuciones no se trunquen durante los cálculos.

Presentación de situaciones típicas

La función de recompensa por existencias es clara, en el sentido de que refleja el resultado financiero de una situación de inventario de un modo relativamente simple. De hecho, como hemos visto, sería poco inteligente eliminar cualquiera de las partes de este modelo, ya que no reflejaría los tres estados básicos de una unidad SKU: vendida, en falta o en existencias. Al ajustar las variables económicas, la recompensa por existencias puede modificarse para que refleje situaciones asociadas con sectores específicos.

Sector aeronáutico

En el sector aeronáutico, se necesitan piezas de recambio para garantizar el mantenimiento adecuado de los aviones. Una pieza de recambio NO-GO en falta desencadena incidentes AOG (aeronave en tierra) que generalmente cuestan mucho más que la pieza de recambio en cuestión.

En este contexto, es razonable tener:

  • M=0, a menos que las piezas se proporcionen por un precio determinado, proporcionarlas no presenta una ventaja.
  • S= constante, debido a que todas las piezas NO-GO son capaces por igual de hacer que la aeronave se quede en tierra, la penalización de la situación de desabastecimiento es uniforme.
  • C= constante (anualizada), debido a que la mayor parte de las piezas tiene una vida útil prolongada, es aceptable, como primer abordaje, aproximar el costo de almacenamiento anual como una constante.

Periódicos

Con respecto al inventario de periódicos, consideramos que un artículo puede venderse solo durante el período temporal siguiente, ya que de otro modo pierde todo su valor de mercado en la iteración siguiente. Los periódicos representan el arquetipo de este tipo de artículos, pero no son el único caso. Comportamientos similares se observan también en artículos altamente estacionarios o perecederos, que ofrecen una ventana de tiempo muy reducida para la venta.

En este contexto, tendríamos:

  • M, el margen bruto
  • S, una fracción del margen bruto
  • C = 0, ya que nada pasa de un período al siguiente
  • A = 0, sucede lo mismo que en anterior, ya que no puede obtenerse ninguna recompensa en los períodos futuros.