Apresentação

Row

DADO: Dados e Análises para Decisões e Operações


A criação do DADO — Dados e Análises para Decisões e Operações — é um passo fundamental que o RECIFE dá para criar uma cultura de construção de cenários para desenho e evolução de estratégias para a cidade, ao mesmo em que estabelece uma plataforma de dados e algoritmos para facilitar e instrumentar a tomada de decisão sobre qualquer operação de interesse da cidade.

Recife foi uma das cidades pioneiras no uso de informática no Brasil; o primeiro computador da prefeitura, na antiga Divisão de Mecanização, foi instalado em 1963 - era a gestão municipal começando a automatizar o processamento de impostos e pagamentos. Tal pioneirismo do espaço público foi fundamental para que um ecossistema como o Porto Digital tivesse a expressão que tem hoje, seis décadas depois.

Nestas seis décadas, o volume de informação disponível para a gestão municipal e a demanda para usá-lo cresceu ordens de magnitude. Por outro lado, como mostra esta pandemia, não é mais possível tratar a complexidade de eventos tão grandes e interligados com tantas facetas da sociedade e economia apenas com inteligência, intuição e experiência. Dados e suas análises, usando sistemas milhões de vezes mais sofisticados do que o primeiro computador da prefeitura, passaram a ser fundamentais para decidir o que e como fazer, em quase qualquer situação, de forma econômica e flexível.

O trabalho deste grupo, neste estágio de criação, é ajudar a criar os cenários para tomada de decisão e convivência com a pandemia de COVID-19, que pode estar conosco por muito tempo. Mas DADO é um esforço de criação de estrutura a partir da conjuntura: muitos outros problemas, inclusive de saúde pública, exigem um planejamento bem mais sofisticado do que vem sendo feito no Brasil até agora. A partir do Recife, o papel de DADO é liderar um esforço amplo, nacional, multidisciplinar e em rede, com instituições de todas as competências e de todo o mundo, de usar dados e algoritmos para criar análises e cenários que possam, paulatinamente, melhorar muito os processos de tomada de decisão no setor público e não só em tempos de crise, como agora.

Para o Núcleo de Gestão do Porto Digital é uma honra, e uma grande responsabilidade, ser parte do começo desta iniciativa, para a qual dedicamos toda a nossa energia, foco e um time de especialistas de classe mundial.


Recife, junho de 2020

Silvio Meira
Presidente do conselho do Porto Digital,
PhD em Computação

Row



Row



Row



Indicadores

Row

Painel RECIFE

01 de dezembro de 2020

Row

Total de casos (fonte: CIEVS/Recife)

41.132

Casos nas últimas 24h (fonte: CIEVS/Recife)

222

Total de mortes (fonte: CIEVS/Recife)

2.543

Mortes nas últimas 24h (fonte: CIEVS/Recife)

0

Row

Casos em investigação (fonte: CIEVS/Recife)

394

Casos recuperados (fonte: CIEVS/Recife)

37.689

Hospitalizados (fonte: CIEVS/Recife)

103

Row

Isolamento Social (fonte: Inloco)

Índice de mobilidade
(Variação percentual em relação a uma linha base, fonte: Google Maps)

0%

Taxa de ocupação (UTI) — Total do Estado (fonte: SEPLAG/PE)

Row

Curvas Epidemiológicas: óbitos por semana epidemiológica (fonte: CIEVS/Recife, nota: formSUS, por data de óbito)

Row

Curvas Epidemiológicas: Notificações SRAG (Síndrome Respiratória Aguda Grave) por semana epidemiológica (fonte: CIEVS/Recife, nota: formSUS)

Row

Curvas Epidemiológicas (Casos novos nas últimas 24h, fonte: CIEVS/Recife)

Row

Curvas Epidemiológicas (Óbitos novos nas últimas 24h, fonte: CIEVS/Recife)

Row

Curvas Epidemiológicas (Notificações SRAG novas por dia de notificação, fonte: CIEVS/Recife)

Row

Comparação Brasil, Pernambuco e Recife (fonte: Minstério da Saúde)

Row

Taxa de crescimento Brasil, Pernambuco e Recife (fonte: Minstério da Saúde)

Análises

Row

Óbitos diários por COVID19 nas capitais (média móvel de 7 dias, por número de dias desde a terceira morte, dados: Minstério da Saúde)

Row

Óbitos diários por COVID19 nas capitais (média móvel de 7 dias por 100 mil habitantes , por número de dias desde a terceira morte, dados: Minstério da Saúde)

Row

Casos por dia em Recife e Mesorregiões de Pernambuco (fonte: Minstério da Saúde)

Row

Casos por dia em Recife e Mesorregiões de Pernambuco (proporção, fonte: Minstério da Saúde)

Row

Óbitos por dia em Recife e Mesorregiões de Pernambuco (fonte: Minstério da Saúde)

Row

Óbitos por dia em Recife e Mesorregiões de Pernambuco (proporção, fonte: Minstério da Saúde)

Row

Curva de chamadas ao SAMU por problemas respiratórios (fonte: PCR)

Row

Chamadas ao Atende em Casa (fonte: PCR)

Row

Óbitos nos últimos 60 dias por 100 mil habitantes (Média Móvel)

Row

Óbitos acumulados por 100 mil habitantes (Média Móvel)

Row

Relatório de mobilidade da google (fonte: Google Maps)

Modelos SIRD

Row

Incidência Acumulada de óbitos para a cidade de Recife

Row

Incidência de óbitos diários para a cidade de Recife

Row

Nota Técnica

Modelos SIRD: o que são e para que servem?


Diferentes modelagens podem ser utilizados para identificar mudanças na evolução de indicadores e o estado atual da epidemia. Os modelos comportamentais mas amplamente utilizados são os modelos tipo SIR (Susceptible, Infected, Recovered), apresentado originalmente por Kermack and McKendrick (1927), e suas variantes, incluindo o SIRD (Susceptible, Infected, Recovered, Deceased). Um interessante resumo introdutório está disponível em Wikipedia. Essa classe de modelos junto aos modelos generalizados de crescimento têm sido aliados poderosos para avaliar a eficiência de medidas de mitigação não farmacológicas (distanciamento social, uso de máscara, etc) para o combate a epidemia (Vasconcelos, et al.; 2020a,b; Rede ModInterv, ModInterv). Para o Recife usamos o modelo SIRD para descrever a propagação e a progressão clínica da COVID-19 por levar em consideração o monitoramento do número de casos registrados e o número de óbitos (Vasconcelos, et al.; 2020c).

No modelo SIR simples (sem nascimentos ou mortes e parâmetros constantes), indivíduos susceptíveis \((S)\) tornam-se infectados e passam para a classe infectada \((I)\)). Após algum tempo, os indivíduos infectados se recuperam e passam para a classe recuperada (ou imune) \((R)\). Uma vez imunes, eles permanecem assim por toda a vida (ou seja, não deixam a classe recuperada). As equações que descrevem a dinâmica deste modelo epidemiológico em função do tempo \(t\) são: \[\begin{align*} \frac{dS(t)}{dt} &=-\frac{\beta S(t) I(t)}{N} \label{dSdt}, \\ \frac{dI(t)}{dt} &=\frac{\beta S(t) I(t)}{N}-(\gamma_1+\gamma_2)I(t) \label{dIdt},\\ \frac{dR(t)}{dt} &=\gamma_1 I(t),\\ \frac{dD(t)}{dt} &=\gamma_2 I(t), \end{align*}\] em que \(S(t)\), \(I(t)\), \(R(t)\), e \(D(t)\) são o número de indivíduos no momento \(t\) nas classes de susceptíveis, infectados, recuperados, e falecidos respectivamente; enquanto \(N\) é o número total de indivíduos na população, ou seja, \(N=S(t)+I(t)+R(t)+D(t)\). Os valores iniciais são escolhidos para \(S(0)=s_0\), \(I(0)=i_0\), com \(s_0+i_0=N\), e \(R(0)=0=D(0)\). Os parâmetros \(\gamma_1\) e \(\gamma_2\) são as taxas às quais o indivíduo infectado se recupera ou morre, respectivamente. O parâmetro \(\beta\) é a taxa de transmissão.

Consideramos então um modelo modificado do SIR chamado de SIRD onde nas equações de \(\frac{dS(t)}{dt}\) e \(\frac{dI(t)}{dt}\) o tamanho da popilação \(N\) (No caso do Recife \(N=1645727.\) Fonte: IBGE) é substituído por apenas uma fração da população nas classes \(S\) e \(I\), o que leva em conta o fato de que os recuperados (assumindo que se tornam imunes) e o falecidos não contribuem para a transmissão. Assim, encontramos \[\begin{align*}\label{SIRD1} \frac{dS}{dt} &=-\frac{\beta S(t) I(t)}{I(t)+S(t)} \\\label{SIRD2} \frac{dI}{dt} &=\frac{\beta S(t) I(t)}{I(t)+S(t)}-(\gamma_1+\gamma_2)I(t)\\ \frac{dR}{dt} &=\gamma_1 I(t)\\ \frac{dD}{dt} &=\gamma_2 I(t). \label{dDdt} \end{align*}\]

Suposições

  • O modelo considera uma população homogênea, isto é, todos os indivíduos possuem mesma probabilidade de serem infectados e as taxas de contato de cada indivíduo são iguais. Esta consideração de homogeneidade é válida para grandes populações, no que tange a análise da modelagem.
  • O período de tempo em que uma epidemia ocorre é muito menor que o tempo de existência da população, ou seja, o tamanho desta pode ser considerado constante no período, e os nascimentos e mortes não relacionadas à doença podem ser ignorados.
  • A qualquer instante de tempo, cada indivíduo encontra-se em um determinado estado com relação a doença.

Adaptação para COVID-19: SIRD com taxa de transmissão dinâmico

O modelo SIRD com parâmetros constantes tem-se mostrado insuficiente para acomodar adequadamente a dinâmica da epidemia da COVID-19 principalmente quando a população é submetida a intervenção pela adoção de alguma medida de mitigação ou política pública para a contenção da epidemia. A solução mais simples para este problema é permitir que o parâmetro epidemiológico \(\beta\) mude no tempo (parâmetro dinâmico) de acordo a uma função de decaimento de tipo exponencial (Caccavo, 2020: Canto, et al., 2020; Vasconcelos, et al. 2020c). Desta forma, condideramos \[\begin{align*} \begin{split} \beta(t) = \begin{cases} \beta_0,\ t<\tau_0\\ \beta_0\left(\beta_1 + (1-\beta_1)e^{-\frac{(t-\tau_0)}{\tau_1}} \right),\ t\ge \tau_0, \end{cases} \end{split} \label{betat} \end{align*}\] em que \(\tau_0\) é o tempo de início da intervenção e \(\tau_1\) é a duração média das intervenções. Aqui \(\beta_0\) é a taxa de transmissão inicial do patógeno e o produto \(\beta_1\) representa a taxa de transmissão no final da epidemia. O time da Rede ModInterv implementou computacionalmente algoritmos em python para essa classe de modelos.

Referências

Kermark, M. & Mckendrick, A., (1927). Contributions to the mathematical theory of epidemics. Part I. Proc. r. soc. a, 115(5), pp.700-721.

Vasconcelos G.L., Macêdo A.M.S., Ospina R., Almeida F.A.G., Duarte-Filho G.C., Brum A.A. & Souza I.C.L. (2020a). Modelling fatality curves of COVID-19 and the effectiveness of intervention strategies. PeerJ, 8: e9421. DOI: (https://doi.org/10.7717/peerj.9421)

Vasconcelos, G. L., Macêdo, A. M., Duarte-Filho, G. C., Araújo, A. A., Ospina, R., & Almeida, F. A. (2020b). Complexity signatures in the COVID-19 epidemic: power law behaviour in the saturation regime of fatality curves. medRxiv. DOI:(https://doi.org/10.1101/2020.07.12.20152140)

Macêdo, A. M., Brum, A. A., Duarte-Filho, G. C., Almeida, F. A., Ospina, R., & Vasconcelos, G. L. (2020c). A comparative analysis between a SIRD compartmental model and the Richards growth model. medRxiv. DOI: (https://doi.org/10.1101/2020.08.04.20168120)

Caccavo, D. (2020). Chinese and Italian COVID-19 outbreaks can be correctly described by a modified SIRD model. medRxiv. DOI: (https://doi.org/10.1101/2020.03.19.20039388)

Canto, F. J. A., Avila-Vales, E. J., & Garcıa-Almeida, G. E. (2020). SIRD-based models of COVID-19 in Yucatan and Mexico. researchgate.net

Bairros

Row

Bairros com maior número de casos

Row

Bairros com maior número de casos (últimas 24h)

Row

Espalhamento temporal dos casos novos por bairro

Row

Taxa de crescimento de novos casos por bairro (5 piores)

Row

Maiores taxas de crescimento de novos casos

Row

Maiores taxas de crescimento de novos casos (Casos por 10k habitantes)

Row

Maiores taxas de crescimento de novos óbitos

Row

Maiores taxas de crescimento de novos óbitos por 10 mil habitantes

Mapas

Row

Força de infeção e casos ativos

Row

Mapa dos bairros

Shewhart

Row

Gráfico de Shewhart para a série de Óbitos Diários

Row

Gráfico de Shewhart para a série de Casos Diários

Row

Gráfico de Shewhart para a série de chamadas ao SAMU por causas respiratórias

Row

Gráfico de Shewhart para a série de notificação de SRAG

Row

Nota Técnica

Gráficos de Shewhart: O que são e para que servem?


Gráficos de Shewhart tem esse nome em homenagem ao seu criador, Walter Shewhart, e servem para acompanhar periodicamente a evolução de um processo, que no contexto de uma epidemia como a de COVID-19, caracteriza-se pelos efeitos da doença ao longo do tempo, observados através de indicadores como o número diário de óbitos, por exemplo.

Em Recife, essa ferramenta está sendo utilizada para monitorar o número de casos confirmados, o número de óbitos, de leitos de UTI ocupados, de chamadas de SAMU para atendimento de casos de síndrome respiratória, e o número de casos de síndrome respiratória aguda grave (SRAG).

Como interpretar?

A Figura 1 abaixo dá um exemplo genérico de Gráfico de Shewhart para um indicador Q(t). Seus elementos básicos incluem uma linha central, situada no valor médio de Q(t), e duas linhas que representam limites superior e inferior. Variação de pontos em torno da linha central decorrem apenas de flutuações próprias do fenômeno, e indicam que a evolução do processo se dá de forma consistente com o valor médio e limites calculados.

Figura 1
Figura 1: Gráfico de Shewhart para Q(t): monitoramento inicial.


O que se observa nos 10 primeiros dias na Figura 1 são flutuações indicando que até esse dia, os dados se comportam de forma consistente com uma mesma média (em torno de 17) e desvio-padrão. Dessa forma, quando vemos o aumento no valor do indicador do dia 1 para o dia 2, ou do dia 6 para o dia 7, por exemplo, não devemos nos confundir e pensar que se trata de uma evolução crescente do processo monitorado. Essa mesma confusão deve ser evitada quando vemos uma diminuição nos valores de Q(t) do dia 5 para o dia 6, ou do dia 8 para o dia 9, por exemplo.

Observando o comportamento dos pontos da Figura 1, no entanto, fica claro que do dia 11 em diante o que observamos é um comportamento do processo que não está mais coerente com o comportamento que observávamos até o dia 10. Claramente há uma mudança de parâmetros, e a média de Q(t) não está mais no patamar de 17. Ajusta-se então o Gráfico de Shewhart para acomodar fases, que representam períodos sob os quais o processo evolui de acordo com uma mesma média e desvio-padrão, resultando na Figura 2 abaixo.

Figura 1
Figura 2: Gráfico de Shewhart para Q(t): monitoramento avançado.


Identificam-se na Figura 2, três fases, cada uma definida de forma a ser razoável assumir que seus dados possuem comportamento estável, ou seja variações ali observadas são próprias do fenômeno e ocorrem em torno de uma mesma média e mesmo desvio-padrão. Consequentemente, é coerente dizer que da Fase 1 para a Fase 2 houve um aumento efetivo na média que rege o processo. Em seguida, da Fase 2 para a Fase 3, observa-se novo aumento no comportamento do processo, dessa vez de magnitude ainda maior que o aumento observado entre as Fases 1 e 2.

É ilustrativo notar que, através do Gráfico de Shewhart da Figura 2 fica claro que a mudança para mais no valor de Q(t), registrado entre os dias 11 e 12, aera devido a variação usual dos dados e não significava mudança no comportamento médio do processo. Por outro lado, a mudança para mais registrada entre os dias 20 e 21, essa sim, foi indicativa de mudança no valor médio, implicando crescimento do fenômeno observado.

Adaptação para COVID-19

Gráficos de Shewhart para dados de COVID-19 precisam ser adaptados porque os indicadores importantes para monitorar a evolução da epidemia não necessariamente apresentam média e desvio-padrão constantes. Lloyd Provost (API Assoicates for Health Improvement), um renomado Estatístico americano, propôs uma forma eficaz de adaptação, descrita em Perla et al. (2020). A rapidez com que a epidemia evolui, no entanto, faz com que seja importante incorporar flexibilidade a escolha de pontos (datas) que definem fases no Gráfico. O time do CASTLab (Ferraz et al., 2020) implementou computacionalmente um algoritmo que permite essa flexibilização e propôs uma forma de identificar fases com base numa regra tradicional de Controle Estatístico de Processos, chamada de regra do deslocamento. De acordo com essa regra, observar uma sequencia de sete pontos consecutivos acima ou abaixo da linha central do Gráfico de Shewhart sugere que houve mudança no comportamento do processo.

Referências

Perla, R., Provost, S.M., Parry, G.J., Little, K., Provost, L.P. (2020). Understanding Variation in COVID-19 Reported Deaths with a novel Shewhart Chart application. International Journal for Quality in Health Care.

Ferraz, C., Petenate, A.J., Wanderley, A.L., Ospina, R., Torres, J. e Peruzzi-Moreira, A. (2020) COVID-19: Monitoramento por Gráficos de Shewhart. Artigo submetido a Revista Brasileira de Estatística.

Testes

Row

Número de testes acumulado (fonte: seplag/pe)

Row

Número de testes por dia (fonte: seplag/pe)

Outros Países e Cidades

Row

Brasil e alguns países: casos diários por 1 milhão de habitantes (Média Móvel (dados: Johns Hopkins Coronavirus Resource Center (CRC))

Row

Brasil e alguns países: óbitos diários por 1 milhão de habitantes (Média Móvel (dados: Johns Hopkins Coronavirus Resource Center (CRC))

Row

Recife e algumas cidades do mundo : casos diários por 100 mil de habitantes (Real e Média Móvel com 7 dias)