forecast financiero sector farmacéutico
Miguel Ángel Rodrigo Technical Product Manager

El forecast financiero en el sector farmacéutico

Realizar un forecasting de ventas fiable de forma apropiada tiene un gran impacto positivo en diferentes áreas de la compañía, pero debe efectuarse adecuadamente y utilizarse de manera correcta.

A los equipos comerciales les permite tener un baremo con el que medir sus objetivos de venta, lo cual impacta de manera natural en el rendimiento. Por otro lado, tener previsiones permite realizar reflexiones retrospectivas informadas donde revisar, en base a datos, si las previsiones eran excesivamente optimistas o si, por el contrario, es necesario hacer correcciones sobre cómo se trabaja el próximo año.

Un forecast anual, o incluso trimestral, permite tener una estructura de deuda a corto y largo plazo bien balanceada

En el caso de logística, no es de mucha utilidad contar con predicciones de venta anuales. En general, las ventas no van a variar de manera drástica e imprevista al corto plazo. Además, un forecast financiero a largo plazo (trimestres, o años enteros) no contará con la precisión suficiente para ser empleados como principal fuente de información por las áreas de producción o logística. Sin embargo, es posible realizar predicciones a menor plazo que puedan tener en cuenta variaciones a corto plazo debido a efectos pasajeros, como ofertas comerciales propias o de terceros o la falta de stock de un competidor. Este tipo de forecast no prioriza la precisión de este tipo de ventas, difíciles de predecir por su propia naturaleza, sino la agilidad de disponer de esta información de manera automatizada, sin necesidad de disponer de un equipo alerta 24/7.

Finalmente, el más importante de todos los impactos de un buen forecast quizás sea el menos visible desde fuera: la vertical financiera de la compañía. Un forecast anual, o incluso trimestral, permite tener una estructura de deuda a corto y largo plazo bien balanceada, apoyándose en unos flujos de caja previsibles.

¿Por qué no es fácil realizar estas predicciones en el sector farmacéutico?

Sin embargo, en el sector farmacéutico existen una serie de retos adicionales a la hora de realizar una buena previsión de ventas que no son desconocidos para Izertis. Cada uno de estos retos son lo suficientemente complejos para suponer un caso de uno en sí mismos. Como ejemplo:

  • ¿Qué impacto tendrá un nuevo lanzamiento?

Las cifras de prevalencia e incidencia de una enfermedad son conocidas, pero no dejan de ser estimaciones con diferente precisión según la enfermedad.

La mejora diferencial de este nuevo lanzamiento con respecto a los medicamentos existentes es una variable crucial muy difícil de medir.

La inversión comercial tiene un gran impacto que varía según el área terapéutica, los competidores etc. Por lo que no es fácil saber qué efecto tendrá el gasto en las diferentes partidas comerciales de un medicamento que aún no se vende.

  • ¿Qué impacto tendrá la aprobación de una nueva indicación para un medicamento existente?
  • ¿Cómo será la curva de degradación de ingresos para un medicamento en el cual caduca una patente?
  • ¿Qué impacto tiene el gasto en cada partida comercial en las ventas?
  • Con total seguridad se está invirtiendo de más en ciertas acciones y de menos en otras. Si nos podemos permitir realizar tests controlados con ciertos medicamentos en ciertas regiones, se puede estimar el impacto aislado de ese cambio mediante técnicas de análisis de impacto causal.
  • ¿Cómo podemos predecir las ventas en un mercado regulado por licitaciones (como Holanda, Emiratos Árabes, la mayoría de los países africanos, etc.)?

Para cada uno de estos casos de uso existen diferentes soluciones: encontrar lanzamientos similares y realizar una regresión según el nivel de similitud para luego ponderarlo según variables del mercado, experimentar pequeños cambios en la inversión en materia comercial en pequeñas regiones, emplear análisis de impacto causal para determinar qué variables han causado el cambio, etc. Cada caso de uso debe tratarse de manera diferente según el mercado de cada medicamento, los objetivos y la información disponible dentro y fuera de la compañía.

Las ventas de ciertos productos están correlacionadas, ¿cómo podría incorporar esta información en los modelos?

Los modelos forecasting en el sector farma tienen un reto recurrente, como es el de utilizar la información de ventas del resto del porfolio para alimentar los modelos de predicción de un producto concreto.

Usando estos embeddings podemos generar un solo modelo que prediga las ventas de múltiples marcas

Una solución trivial, pero errónea, sería codificar cada producto mediante one-hot. La manera correcta es empleando embeddings, donde cada marca se representa por un vector numérico aprendido automáticamente, de manera que marcas similares se corresponderán con vectores cercanos y aquellas diferentes, por vectores más lejanos. Esta representación mediante embeddings permite comprimir la información de las marcas introduciéndola en el modelo de manera mucho más eficiente, además de eliminar información arbitraria que sólo aporta ruido (como el orden de las marcas). Este mapeo de cada marca con un vector numérico se puede generar durante el propio entrenamiento del modelo, o idealmente se pueden pre-entrenar de manera semi-supervisada usando información adicional. Esta información adicional ni siquiera tiene que ser sólo para productos propios, puede emplearse también información de productos competidores.

Una forma muy adecuada de hacerlo, en el caso de productos farmacéuticos, sería empleando las indicaciones que tiene cada medicamento. De esta forma es posible crear embeddings que, dado un producto, nos devuelvan un vector que se encuentre cercano en un espacio vectorial a otros productos que tengan indicaciones similares, sin necesidad de emplear ninguna de información sobre ventas.

Usando estos embeddings podemos generar un solo modelo que prediga las ventas de múltiples marcas según la seleccionada. Este modelo habrá sido entrenado con información mucho más rica que si se entrena exclusivamente con sus propias ventas.

¿Por qué no puede utilizarse una solución pre-empaquetada?

En cada caso se dispone de datos diferentes y se quiere llegar a una solución distinta. La condición principal para el éxito en este tipo de proyectos consiste en exprimir al máximo cada dato disponible. Esto incluye incorporar en los modelos datos abstractos no estructurados que no son trivialmente traducibles a lenguaje matemático.

Un error común es asumir que una LSTM siempre funcionará mejor

Para abordar estos grandes de retos de predicción en base a la definición de modelo de inteligencia artificial planteamos dos maneras:

  • Usando modelos de análisis de series temporales, como ARIMA, que aplica a aquellas casuísticas en la que se cuenta con poco datos asociados a series muy estacionarias. Funciona bien cuando se requiere de una predicción en horizonte temporal corto (p.e. semanas).
  • Modelos de regresión clásicos, creando características adicionales que sean datos temporales previos de la característica a predecir (conocidos como lags). 
  • Existe una solución híbrida: las redes neuronales recurrentes (RNN), como una LSTM. Conceptualmente son lo mismo que el modelo anterior, solo que los lags se generan y se ponderan automáticamente durante el entrenamiento.

Un error común es asumir que una LSTM siempre funcionará mejor, por ser el modelo más avanzado y moderno de los tres sugeridos. Sin embargo, es frecuente que en la práctica haya limitaciones de disponibilidad de datos que hagan que esto no sea así.

Es posible crear un solo modelo que prediga el siguiente momento temporal

Finalmente, tal y como demuestra el premio al mejor paper de AAAI 2021, también es posible emplear transformers para predecir series temporales.

Una vez que se ha decidido cómo modelar, es posible crear un solo modelo que prediga el siguiente momento temporal, después usar esta nueva predicción como si fuera un dato real y así predecir la siguiente. Esta técnica (rolling forecasting) produce los modelos más fáciles de crear y mantener (que no es poca cosa), pero no las mejores predicciones.

Otra manera es crear un modelo único para cada horizonte temporal deseado. Por ejemplo, crear 6 modelos, cada uno entrenado para predecir el horizonte temporal concreto: uno para el siguiente mes, otro para el valor dentro de dos meses etc. Esta técnica ofrece mejores resultados a costa de tener una arquitectura lógica más compleja y difícil de mantener.

¿Cómo puedo estimar el impacto de algún evento?

¿Qué impacto tienen las aprobaciones de nuevas indicaciones en un medicamento? ¿Cómo puede afectar a las ventas el lanzamiento de un competidor?

La diferencia entre el forecast y la realidad nos servirá para conocer el dato del impacto causal

Para poder responder a estas preguntas, se puede recurrir a una rama de las matemáticas aplicadas que intenta analizar cuánto del impacto en el cambio de una variable se debe a un determinado evento: análisis de impacto causal.

Si pudiéramos irnos al pasado y ver cuánto de la variación en ventas se debe al nuevo evento, sería posible entrenar un modelo de forma relativamente sencilla. Pero el reto lo tenemos en que no disponemos de esta información, puesto que no conocemos el dato de cuánto se debe a este evento y cuánto a otras variables. Para resolverlo podemos desplegar un modelo para hacer un forecast a partir de la ocurrencia del evento. La diferencia entre el forecast y la realidad nos servirá para conocer el dato del impacto causal. Evidentemente, este dato se encuentra sesgado, ya que hay variables adicionales no controladas implicadas en el cambio, pero si observamos un número suficientemente grande de estos eventos, podremos compensar el impacto de las diferentes variables y quedarnos solamente con la única que afecta siempre el impacto del evento que deseamos estimar.