2026-04-24 · 6 min

Por que publiquei o Panorama SUSEP

Relato pessoal do trajeto até o lançamento do Panorama SUSEP v1.0: motivação, custo técnico, e por que open notebook em vez de relatório fechado.

Relato pessoal do trajeto até o lançamento do Panorama SUSEP v1.0, escrito em paralelo ao próprio estudo, motivado por uma tentativa de explicar a um futuro leitor o cálculo entre publicar e não publicar, e por que a primeira alternativa, apesar do custo evidente, parece ainda assim mais defensável.

Quando se decide publicar pesquisa em ambiente aberto, em vez de mantê-la em relatório fechado de consultoria ou em arquivo institucional restrito, a primeira reação esperada de quem observa de fora é classificar a decisão como ingenuidade ou idealismo, e essa classificação não é totalmente injusta, em virtude do conjunto de custos reais que a publicação implica e que raramente são compensados por retorno financeiro proporcional. Todavia, frente ao desconforto inicial de assumir esse custo, há uma série de desdobramentos que tornam a alternativa fechada menos atrativa do que parece à primeira vista, e é justamente sobre essa ponderação que pretendo me debruçar neste texto.

O mercado segurador brasileiro foi, por anos, um ambiente que eu sabia existir mas não conseguia enxergar com nitidez. Sabia que a SUSEP publicava dados, que a CNseg compilava relatórios setoriais anuais, que consultorias internacionais comercializavam recortes pagos e relativamente caros, mas a primeira vez que tentei desenhar um panorama macro do mercado por unidade federativa percebi que não havia, em lugar algum acessível e gratuito, uma visão estruturada que servisse como ponto de partida para um leitor curioso, um jornalista econômico, um atuário em outra empresa, ou um regulador interessado em comparar a região dele com a média nacional. O vazio é estranho, em virtude de os dados estarem lá, públicos, no portal da SUSEP, em SQLite e CSV, atualizados periodicamente, com licença que permite redistribuição, e com ferramentas de processamento amplamente disponíveis. O que faltava era alguém com tempo de hobby, vocabulário técnico mínimo de seguros, e disposição para montar a infraestrutura editorial em volta dos números, de modo que eles deixassem de ser tabela inerte e passassem a constituir narrativa auditável.

A tese inicial: relatório fechado é o caminho seguro

A prática dominante do setor, ainda que não declarada explicitamente, opera sob a premissa de que pesquisa séria justifica-se por relatório fechado. O documento PDF de sessenta páginas, com sumário executivo, gráficos estáticos colados como imagens, e citação genérica de fonte, é a forma esperada. Quem produz essa pesquisa argumenta, com razão parcial, que o controle editorial é maior, que o cliente paga pelo material e tem direito à exclusividade, que a errata pública seria desgaste desnecessário, e que o detalhamento metodológico apenas confunde o leitor não-técnico. Esse conjunto de argumentos sustenta uma indústria inteira de consultoria setorial, e seria intelectualmente desonesto descartá-lo de saída.

A contra-tese, porventura menos óbvia, é que cada uma dessas justificativas opera contra a possibilidade de a pesquisa servir como evidência citável a longo prazo. Relatório fechado não é replicável, em virtude de a metodologia raramente ser exposta o suficiente. Cliente exclusivo é audiência limitada, em virtude de a publicação não circular além do contrato. Errata pública seria desgaste apenas se o erro for tratado como vergonha, em vez de como parte do processo. E o detalhamento metodológico só confunde o leitor não-técnico se a estrutura editorial não souber separar narrativa principal de proveniência auditável.

A antítese desdobrada: o custo real de publicar

Frente à atração da contra-tese, é necessário reconhecer com honestidade o custo de publicar. O Panorama SUSEP rodou pela primeira vez em três tardes, num pipeline ingênuo que agregava o que a SUSEP mandasse, somava sem ressalvar runoff, e produzia um número total de prêmio direto que batia com o que a CNseg reporta. Achei que estava pronto. Não estava. As semanas seguintes foram de cascateamento sucessivo de auditorias técnicas que revelaram seis problemas estruturais, cada um capaz, por si só, de invalidar uma análise inteira:

Retificação: a SUSEP republica períodos anteriores quando descobre erro, e o pipeline precisava distinguir versão original de retificada para não duplicar.
Runoff: empresas que pararam de operar continuam reportando sinistros antigos por anos, e somar isso ao prêmio do ano corrente cria sinistralidade artificialmente inflada.
CR4 e HHI por cogrupo: medir concentração de mercado por CNPJ ignora que três das quatro maiores são do mesmo conglomerado, distorcendo a leitura competitiva.
Float guard: a aritmética em ponto flutuante acumulava erro suficiente para quebrar a identidade Σ_uf = total_nacional em alguns ramos, exigindo agregação em inteiros e arredondamento controlado.
Outlier ramo 196 RS 2024: a enchente catastrófica do Rio Grande do Sul produziu sinistralidade de 4,27 num único recorte, valor verdadeiro mas que arrebenta qualquer escala visual sem tratamento explícito.
Sanity contra CNseg: o número total tinha que bater com o relatório oficial, não como prova de correção mas como teto de plausibilidade. Quando diverge muito, há erro de pipeline antes de qualquer conclusão analítica.

Cada um desses fixes foi documentado, versionado, e está reproduzível pelo make reproduce no repositório panorama-susep. O leitor que duvidar de qualquer número pode baixar os dados brutos, rodar o pipeline, e chegar exatamente nos mesmos JSONs que alimentam o site. Esse é o contrato. E o custo de chegar a esse contrato foi de fato muito superior ao custo de produzir o relatório fechado equivalente.

A pergunta de inflexão

Ressalto que dispender esse custo, sem retorno financeiro proporcional, em projeto que não paga conta no mês seguinte, suscita uma série de perguntas que merecem ser feitas em voz alta antes de a decisão ser tomada. Por que insistir em método quando a prática dominante do setor é narrativa solta? Por que se expor a erro público quando o relatório fechado oferece o conforto da opacidade? Por que dispender três semanas em pipeline ingênuo que vai ser refeito do zero? Por que registrar errata antes mesmo do primeiro erro? Em que momento a paranóia metodológica vira paralisia? E, talvez a mais difícil de todas, por que assumir que existe leitor interessado o suficiente para que o esforço de auditabilidade tenha qualquer leitor?

Acredito que a resposta razoável a essas perguntas não está em nenhuma das duas posições extremas, nem na ortodoxia do relatório fechado, nem no idealismo do open notebook puro. Talvez fosse interessante reconhecer que a publicação aberta, quando bem estruturada, oferece três vantagens operacionais que compensam o custo no horizonte longo, ainda que não no curto.

A terceira via: open notebook como infraestrutura

Em primeiro lugar, erros são descobertos cedo. Em ambiente aberto, com pipeline público e dados sob licença permissiva, qualquer leitor crítico pode identificar inconsistência, e essa identificação acontece antes que o número errado vire fundamento de outra análise minha daqui a seis meses. Em ambiente fechado, esse mesmo erro vive escondido até virar problema sério. Em segundo lugar, a versão final fica mais simples. Quando se sabe que o pipeline vai estar exposto, há pressão real para cortar atalho desnecessário, ressalvar onde a evidência é fraca, e evitar conclusão que não sobreviva à primeira pergunta crítica. Relatório fechado acumula apêndice e qualificação justamente porque ninguém vai conferir. Em terceiro lugar, e talvez o mais relevante, a obra ganha vida própria. Um estudo aberto é citável, indexável, lincável; uma URL com query string que reproduz exatamente o recorte visualizado vale, em pesquisa, mais do que dez gráficos numa apresentação fechada que ninguém pode replicar.

Em última instância, nada disso é original. É a tradição do open notebook science aplicada a um nicho que historicamente operou em ambiente fechado, em consultoria paga, ou em academia que não chegou ao público interessado. Se o estudo servir como evidência de que esse modo é viável para pesquisa setorial brasileira, o objetivo paralelo está cumprido. O objetivo principal, mais simples, é que o próximo leitor que quiser saber qual a sinistralidade do ramo de automóvel em Santa Catarina em 2024 não precise rodar pipeline, contratar consultoria, ou desistir. Precise apenas abrir o link.

— Natan, abr/2026