Genealogia, Skills dos Agentes e o Humano no Loop

De tempo em tempo, volta minha vontade de mapear a genealogia da família, um óbvio privilégio quando se tem tempo. Também é um exercício para entender como tudo está documentado e catalogado no mundo inteiro. Podemos sentir que esse tipo de registro é extremamente recente e as informações estão sempre flutuando de forma caótica e desalinhada.

Dados não estruturados, informações conflitantes, palavras lotadas de erros de grafia, inúmeras fontes da verdade. Isso te lembra alguma coisa? É um prato cheio para as LLMs!

Eu fiz esse processo de pesquisa 10 anos atrás e, com a chegada dos agentes mais versáteis, que controlam seu computador, vi que a ferramenta encaixava bem. Seja o OpenClaw, seja o Cowork, ou mesmo o Codex e o Claude Code.

Tem sido bastante interessante trabalhar diretamente no Claude Code: ele pega o que eu já fiz da árvore genealógica, que tem até formatos próprios, como o GEDCOM, e trabalha em cima daquele monte de sites. Não só os gigantes como Ancestry e FamilySearch, mas também sites pequenos de cidades e museus. Para isso o próprio Claude Code faz buscas e requests usando APIs, e às vezes simulando navegação com Playwright e navegadores headless.

Em 6 dias, fiz muito mais com ele do que em meses lá atrás:

Avanço da minha árvore

Pedi para o agente descrever o avanço da árvore que eu tinha antes (feita de forma inteiramente manual) para o que fizemos em 6 dias de conversas:

Quando começamos, partimos de um GEDCOM exportado do Ancestry com 82 pessoas e profundidade de bisavós o mais antigo nascido em 1847. Em cerca de duas semanas de pesquisa com o Claude Code, cruzando a API do FamilySearch, OCR de mais de 300 documentos e entrevistas com 12 parentes, o acervo saltou para 419 pessoas catalogadas, recuando até 1435 ancestrais portugueses na linhagem materna paulista. A linha mais bem documentada chega a 10 gerações (nonavós), com registros paroquiais de Queirã e Aboadela em Portugal.

Evolução da árvore genealógica: de 82 para 419 pessoas, cada ponto é uma pessoa plotada por década de nascimento

A mistura Smalltalk

Um agente consegue fazer muito bem o que precisei aqui: manipular linha de comando, gerar scripts simples e trabalhar com os resultados. Fica aquela mistura que temos visto muito: código fonte, execução e manipulação de base de dados dentro do mesmo ambiente.

Mais uma vez, lembrando a provocação que o Sérgio fez: isso lembra bastante o Smalltalk e afins… mas dessa vez é o contexto do seu agente, do seu Claude Code, do seu OpenClaw.

O humano no loop: quando o agente é quem faz as perguntas

Foi bastante divertido esse exercício de Inteligência Artificial aplicada a um trabalho que não é exatamente programação ou software.

É incrível ver como funciona: eu vou populando o agente com os dados que já tinha: certidões, documentos de cartório. Ele busca informações na internet e me traz de volta perguntas. Perguntas que precisam do humano. Eu tenho que confirmar se uma informação está correta. Ou buscar uma certidão em um cartório. Até mesmo fazer uma pergunta para um tio-avô ou para alguém da família que saiba daquilo. E retornar.

Isso bate e volta num loop contínuo: de um lado eu, do outro lado um agente que mistura criação de código, execução e base de dados. Tudo no mesmo repositório git: algo considerado uma das piores práticas de engenharia de software, não é mesmo?

Disposable software

Mas volto a dizer e linkar para o meu post sobre software perecível. Esses sisteminhas que criamos, usamos e jogamos fora vão ser cada vez mais comuns. Aliás: eles já eram comuns, agora o ciclo ficará mais curto e intenso.

Essas práticas vão aparecer de forma muito orgânica e não vamos mais distinguir tão claramente o que é sistema operacional, o que é app, o que são os dados, se é script temporário ou não… Claro, vai demorar e talvez não seja exatamente assim, mas haverá cada vez mais software de uso extremamente particular. Todo mundo vai ser programador (de skills com markdown? vou falar disso) ou tecnologista, ou citizen developer, ou outro termo futuro que pegar melhor.

Como reutilizar um software tão acoplado assim?

Alguns amigos me pediram ajuda com suas árvores, animados com os resultados. Não funcionaria bem compartilhar meu repositório GitHub, que está amarrado aos meus arquivos e à minha genealogia (inclusive, os YAMLs que uso para representar cada pessoa estão no mesmo repositório de scripts, tudo misturado!).

Acredito que, num futuro breve, vamos parar de compartilhar scripts e pequenos programas pessoais, para verdadeiramente trocar arquivos Markdown que delimitam skills de agentes.

Por isso pedi para o Claude Code gerar, em um one-shot, uma skill compartilhável. Aqui está a skill inicial de genealogia, junto com meu prompt e notas do agente. Saiu quase perfeita, mas vazou um pouco de contexto e idiossincrasias da minha família.

Iterei um pouco e fiz a publicação oficial da skill de genealogia aqui. Basta entregar esse link para seu Claude Code (ou qualquer outro agente, experimente mandar para seu OpenClaw!) e pedir para ele começar a desvendar sua genealogia. Ficarei honrado de saber o quanto você conseguiu evoluir a sua, usando esse pequeno arquivo!