Diferentes modelagens podem ser utilizados para identificar mudanças na evolução de indicadores e o estado atual da epidemia. Os modelos comportamentais mas amplamente utilizados são os modelos tipo SIR (Susceptible, Infected, Recovered), apresentado originalmente por Kermack and McKendrick (1927), e suas variantes, incluindo o SIRD (Susceptible, Infected, Recovered, Deceased). Um interessante resumo introdutório está disponível em Wikipedia. Essa classe de modelos junto aos modelos generalizados de crescimento têm sido aliados poderosos para avaliar a eficiência de medidas de mitigação não farmacológicas (distanciamento social, uso de máscara, etc) para o combate a epidemia (Vasconcelos, et al.; 2020a,b; Rede ModInterv, ModInterv). Para o Recife usamos o modelo SIRD para descrever a propagação e a progressão clínica da COVID-19 por levar em consideração o monitoramento do número de casos registrados e o número de óbitos (Vasconcelos, et al.; 2020c).
No modelo SIR simples (sem nascimentos ou mortes e parâmetros constantes), indivíduos susceptíveis \((S)\) tornam-se infectados e passam para a classe infectada \((I)\)). Após algum tempo, os indivíduos infectados se recuperam e passam para a classe recuperada (ou imune) \((R)\). Uma vez imunes, eles permanecem assim por toda a vida (ou seja, não deixam a classe recuperada). As equações que descrevem a dinâmica deste modelo epidemiológico em função do tempo \(t\) são: \[\begin{align*} \frac{dS(t)}{dt} &=-\frac{\beta S(t) I(t)}{N} \label{dSdt}, \\ \frac{dI(t)}{dt} &=\frac{\beta S(t) I(t)}{N}-(\gamma_1+\gamma_2)I(t) \label{dIdt},\\ \frac{dR(t)}{dt} &=\gamma_1 I(t),\\ \frac{dD(t)}{dt} &=\gamma_2 I(t), \end{align*}\] em que \(S(t)\), \(I(t)\), \(R(t)\), e \(D(t)\) são o número de indivíduos no momento \(t\) nas classes de susceptíveis, infectados, recuperados, e falecidos respectivamente; enquanto \(N\) é o número total de indivíduos na população, ou seja, \(N=S(t)+I(t)+R(t)+D(t)\). Os valores iniciais são escolhidos para \(S(0)=s_0\), \(I(0)=i_0\), com \(s_0+i_0=N\), e \(R(0)=0=D(0)\). Os parâmetros \(\gamma_1\) e \(\gamma_2\) são as taxas às quais o indivíduo infectado se recupera ou morre, respectivamente. O parâmetro \(\beta\) é a taxa de transmissão.
Consideramos então um modelo modificado do SIR chamado de SIRD onde nas equações de \(\frac{dS(t)}{dt}\) e \(\frac{dI(t)}{dt}\) o tamanho da popilação \(N\) (No caso do Recife \(N=1645727.\) Fonte: IBGE) é substituído por apenas uma fração da população nas classes \(S\) e \(I\), o que leva em conta o fato de que os recuperados (assumindo que se tornam imunes) e o falecidos não contribuem para a transmissão. Assim, encontramos \[\begin{align*}\label{SIRD1} \frac{dS}{dt} &=-\frac{\beta S(t) I(t)}{I(t)+S(t)} \\\label{SIRD2} \frac{dI}{dt} &=\frac{\beta S(t) I(t)}{I(t)+S(t)}-(\gamma_1+\gamma_2)I(t)\\ \frac{dR}{dt} &=\gamma_1 I(t)\\ \frac{dD}{dt} &=\gamma_2 I(t). \label{dDdt} \end{align*}\]
Suposições
Adaptação para COVID-19: SIRD com taxa de transmissão dinâmico
O modelo SIRD com parâmetros constantes tem-se mostrado insuficiente para acomodar adequadamente a dinâmica da epidemia da COVID-19 principalmente quando a população é submetida a intervenção pela adoção de alguma medida de mitigação ou política pública para a contenção da epidemia. A solução mais simples para este problema é permitir que o parâmetro epidemiológico \(\beta\) mude no tempo (parâmetro dinâmico) de acordo a uma função de decaimento de tipo exponencial (Caccavo, 2020: Canto, et al., 2020; Vasconcelos, et al. 2020c). Desta forma, condideramos \[\begin{align*} \begin{split} \beta(t) = \begin{cases} \beta_0,\ t<\tau_0\\ \beta_0\left(\beta_1 + (1-\beta_1)e^{-\frac{(t-\tau_0)}{\tau_1}} \right),\ t\ge \tau_0, \end{cases} \end{split} \label{betat} \end{align*}\] em que \(\tau_0\) é o tempo de início da intervenção e \(\tau_1\) é a duração média das intervenções. Aqui \(\beta_0\) é a taxa de transmissão inicial do patógeno e o produto \(\beta_1\) representa a taxa de transmissão no final da epidemia. O time da Rede ModInterv implementou computacionalmente algoritmos em python para essa classe de modelos.
Referências
Kermark, M. & Mckendrick, A., (1927). Contributions to the mathematical theory of epidemics. Part I. Proc. r. soc. a, 115(5), pp.700-721.
Vasconcelos G.L., Macêdo A.M.S., Ospina R., Almeida F.A.G., Duarte-Filho G.C., Brum A.A. & Souza I.C.L. (2020a). Modelling fatality curves of COVID-19 and the effectiveness of intervention strategies. PeerJ, 8: e9421. DOI: (https://doi.org/10.7717/peerj.9421)
Vasconcelos, G. L., Macêdo, A. M., Duarte-Filho, G. C., Araújo, A. A., Ospina, R., & Almeida, F. A. (2020b). Complexity signatures in the COVID-19 epidemic: power law behaviour in the saturation regime of fatality curves. medRxiv. DOI:(https://doi.org/10.1101/2020.07.12.20152140)
Macêdo, A. M., Brum, A. A., Duarte-Filho, G. C., Almeida, F. A., Ospina, R., & Vasconcelos, G. L. (2020c). A comparative analysis between a SIRD compartmental model and the Richards growth model. medRxiv. DOI: (https://doi.org/10.1101/2020.08.04.20168120)
Caccavo, D. (2020). Chinese and Italian COVID-19 outbreaks can be correctly described by a modified SIRD model. medRxiv. DOI: (https://doi.org/10.1101/2020.03.19.20039388)
Canto, F. J. A., Avila-Vales, E. J., & Garcıa-Almeida, G. E. (2020). SIRD-based models of COVID-19 in Yucatan and Mexico. researchgate.net
Gráficos de Shewhart tem esse nome em homenagem ao seu criador, Walter Shewhart, e servem para acompanhar periodicamente a evolução de um processo, que no contexto de uma epidemia como a de COVID-19, caracteriza-se pelos efeitos da doença ao longo do tempo, observados através de indicadores como o número diário de óbitos, por exemplo.
Em Recife, essa ferramenta está sendo utilizada para monitorar o número de casos confirmados, o número de óbitos, de leitos de UTI ocupados, de chamadas de SAMU para atendimento de casos de síndrome respiratória, e o número de casos de síndrome respiratória aguda grave (SRAG).
Como interpretar?
A Figura 1 abaixo dá um exemplo genérico de Gráfico de Shewhart para um indicador Q(t). Seus elementos básicos incluem uma linha central, situada no valor médio de Q(t), e duas linhas que representam limites superior e inferior. Variação de pontos em torno da linha central decorrem apenas de flutuações próprias do fenômeno, e indicam que a evolução do processo se dá de forma consistente com o valor médio e limites calculados.
O que se observa nos 10 primeiros dias na Figura 1 são flutuações indicando que até esse dia, os dados se comportam de forma consistente com uma mesma média (em torno de 17) e desvio-padrão. Dessa forma, quando vemos o aumento no valor do indicador do dia 1 para o dia 2, ou do dia 6 para o dia 7, por exemplo, não devemos nos confundir e pensar que se trata de uma evolução crescente do processo monitorado. Essa mesma confusão deve ser evitada quando vemos uma diminuição nos valores de Q(t) do dia 5 para o dia 6, ou do dia 8 para o dia 9, por exemplo.
Observando o comportamento dos pontos da Figura 1, no entanto, fica claro que do dia 11 em diante o que observamos é um comportamento do processo que não está mais coerente com o comportamento que observávamos até o dia 10. Claramente há uma mudança de parâmetros, e a média de Q(t) não está mais no patamar de 17. Ajusta-se então o Gráfico de Shewhart para acomodar fases, que representam períodos sob os quais o processo evolui de acordo com uma mesma média e desvio-padrão, resultando na Figura 2 abaixo.
Identificam-se na Figura 2, três fases, cada uma definida de forma a ser razoável assumir que seus dados possuem comportamento estável, ou seja variações ali observadas são próprias do fenômeno e ocorrem em torno de uma mesma média e mesmo desvio-padrão. Consequentemente, é coerente dizer que da Fase 1 para a Fase 2 houve um aumento efetivo na média que rege o processo. Em seguida, da Fase 2 para a Fase 3, observa-se novo aumento no comportamento do processo, dessa vez de magnitude ainda maior que o aumento observado entre as Fases 1 e 2.
É ilustrativo notar que, através do Gráfico de Shewhart da Figura 2 fica claro que a mudança para mais no valor de Q(t), registrado entre os dias 11 e 12, aera devido a variação usual dos dados e não significava mudança no comportamento médio do processo. Por outro lado, a mudança para mais registrada entre os dias 20 e 21, essa sim, foi indicativa de mudança no valor médio, implicando crescimento do fenômeno observado.
Adaptação para COVID-19
Gráficos de Shewhart para dados de COVID-19 precisam ser adaptados porque os indicadores importantes para monitorar a evolução da epidemia não necessariamente apresentam média e desvio-padrão constantes. Lloyd Provost (API Assoicates for Health Improvement), um renomado Estatístico americano, propôs uma forma eficaz de adaptação, descrita em Perla et al. (2020). A rapidez com que a epidemia evolui, no entanto, faz com que seja importante incorporar flexibilidade a escolha de pontos (datas) que definem fases no Gráfico. O time do CASTLab (Ferraz et al., 2020) implementou computacionalmente um algoritmo que permite essa flexibilização e propôs uma forma de identificar fases com base numa regra tradicional de Controle Estatístico de Processos, chamada de regra do deslocamento. De acordo com essa regra, observar uma sequencia de sete pontos consecutivos acima ou abaixo da linha central do Gráfico de Shewhart sugere que houve mudança no comportamento do processo.
Referências
Perla, R., Provost, S.M., Parry, G.J., Little, K., Provost, L.P. (2020). Understanding Variation in COVID-19 Reported Deaths with a novel Shewhart Chart application. International Journal for Quality in Health Care.
Ferraz, C., Petenate, A.J., Wanderley, A.L., Ospina, R., Torres, J. e Peruzzi-Moreira, A. (2020) COVID-19: Monitoramento por Gráficos de Shewhart. Artigo submetido a Revista Brasileira de Estatística.
A criação do DADO — Dados e Análises para Decisões e Operações — é um passo fundamental que o RECIFE dá para criar uma cultura de construção de cenários para desenho e evolução de estratégias para a cidade, ao mesmo em que estabelece uma plataforma de dados e algoritmos para facilitar e instrumentar a tomada de decisão sobre qualquer operação de interesse da cidade.
Recife foi uma das cidades pioneiras no uso de informática no Brasil; o primeiro computador da prefeitura, na antiga Divisão de Mecanização, foi instalado em 1963 - era a gestão municipal começando a automatizar o processamento de impostos e pagamentos. Tal pioneirismo do espaço público foi fundamental para que um ecossistema como o Porto Digital tivesse a expressão que tem hoje, seis décadas depois.
Nestas seis décadas, o volume de informação disponível para a gestão municipal e a demanda para usá-lo cresceu ordens de magnitude. Por outro lado, como mostra esta pandemia, não é mais possível tratar a complexidade de eventos tão grandes e interligados com tantas facetas da sociedade e economia apenas com inteligência, intuição e experiência. Dados e suas análises, usando sistemas milhões de vezes mais sofisticados do que o primeiro computador da prefeitura, passaram a ser fundamentais para decidir o que e como fazer, em quase qualquer situação, de forma econômica e flexível.
O trabalho deste grupo, neste estágio de criação, é ajudar a criar os cenários para tomada de decisão e convivência com a pandemia de COVID-19, que pode estar conosco por muito tempo. Mas DADO é um esforço de criação de estrutura a partir da conjuntura: muitos outros problemas, inclusive de saúde pública, exigem um planejamento bem mais sofisticado do que vem sendo feito no Brasil até agora. A partir do Recife, o papel de DADO é liderar um esforço amplo, nacional, multidisciplinar e em rede, com instituições de todas as competências e de todo o mundo, de usar dados e algoritmos para criar análises e cenários que possam, paulatinamente, melhorar muito os processos de tomada de decisão no setor público e não só em tempos de crise, como agora.
Para o Núcleo de Gestão do Porto Digital é uma honra, e uma grande responsabilidade, ser parte do começo desta iniciativa, para a qual dedicamos toda a nossa energia, foco e um time de especialistas de classe mundial.
Recife, junho de 2020