Genealogia, Skills dos Agentes e o Humano no Loop

De tempo em tempo, volta minha vontade de mapear a genealogia da família, um óbvio privilégio quando se tem tempo. Também é um exercício para entender como tudo está documentado e catalogado no mundo inteiro. Podemos sentir que esse tipo de registro é extremamente recente e as informações estão sempre flutuando de forma caótica e desalinhada.

Dados não estruturados, informações conflitantes, palavras lotadas de erros de grafia, inúmeras fontes da verdade. Isso te lembra alguma coisa? É um prato cheio para as LLMs!

Eu fiz esse processo de pesquisa 10 anos atrás e, com a chegada dos agentes mais versáteis, que controlam seu computador, vi que a ferramenta encaixava bem. Seja o OpenClaw, seja o Cowork, ou mesmo o Codex e o Claude Code.

Tem sido bastante interessante trabalhar diretamente no Claude Code: ele pega o que eu já fiz da árvore genealógica, que tem até formatos próprios, como o GEDCOM, e trabalha em cima daquele monte de sites. Não só os gigantes como Ancestry e FamilySearch, mas também sites pequenos de cidades e museus. Para isso o próprio Claude Code faz buscas e requests usando APIs, e às vezes simulando navegação com Playwright e navegadores headless.

Em 6 dias, fiz muito mais com ele do que em meses lá atrás:

Avanço da minha árvore

Pedi para o agente descrever o avanço da árvore que eu tinha antes (feita de forma inteiramente manual) para o que fizemos em 6 dias de conversas:

Quando começamos, partimos de um GEDCOM exportado do Ancestry com 82 pessoas e profundidade de bisavós o mais antigo nascido em 1847. Em cerca de duas semanas de pesquisa com o Claude Code, cruzando a API do FamilySearch, OCR de mais de 300 documentos e entrevistas com 12 parentes, o acervo saltou para 419 pessoas catalogadas, recuando até 1435 ancestrais portugueses na linhagem materna paulista. A linha mais bem documentada chega a 10 gerações (nonavós), com registros paroquiais de Queirã e Aboadela em Portugal.

Evolução da árvore genealógica: de 82 para 419 pessoas, cada ponto é uma pessoa plotada por década de nascimento

A mistura Smalltalk

Um agente consegue fazer muito bem o que precisei aqui: manipular linha de comando, gerar scripts simples e trabalhar com os resultados. Fica aquela mistura que temos visto muito: código fonte, execução e manipulação de base de dados dentro do mesmo ambiente.

Mais uma vez, lembrando a provocação que o Sérgio fez: isso lembra bastante o Smalltalk e afins… mas dessa vez é o contexto do seu agente, do seu Claude Code, do seu OpenClaw.

O humano no loop: quando o agente é quem faz as perguntas

Foi bastante divertido esse exercício de Inteligência Artificial aplicada a um trabalho que não é exatamente programação ou software.

É incrível ver como funciona: eu vou populando o agente com os dados que já tinha: certidões, documentos de cartório. Ele busca informações na internet e me traz de volta perguntas. Perguntas que precisam do humano. Eu tenho que confirmar se uma informação está correta. Ou buscar uma certidão em um cartório. Até mesmo fazer uma pergunta para um tio-avô ou para alguém da família que saiba daquilo. E retornar.

Isso bate e volta num loop contínuo: de um lado eu, do outro lado um agente que mistura criação de código, execução e base de dados. Tudo no mesmo repositório git: algo considerado uma das piores práticas de engenharia de software, não é mesmo?

Disposable software

Mas volto a dizer e linkar para o meu post sobre software perecível. Esses sisteminhas que criamos, usamos e jogamos fora vão ser cada vez mais comuns. Aliás: eles já eram comuns, agora o ciclo ficará mais curto e intenso.

Essas práticas vão aparecer de forma muito orgânica e não vamos mais distinguir tão claramente o que é sistema operacional, o que é app, o que são os dados, se é script temporário ou não… Claro, vai demorar e talvez não seja exatamente assim, mas haverá cada vez mais software de uso extremamente particular. Todo mundo vai ser programador (de skills com markdown? vou falar disso) ou tecnologista, ou citizen developer, ou outro termo futuro que pegar melhor.

Como reutilizar um software tão acoplado assim?

Alguns amigos me pediram ajuda com suas árvores, animados com os resultados. Não funcionaria bem compartilhar meu repositório GitHub, que está amarrado aos meus arquivos e à minha genealogia (inclusive, os YAMLs que uso para representar cada pessoa estão no mesmo repositório de scripts, tudo misturado!).

Acredito que, num futuro breve, vamos parar de compartilhar scripts e pequenos programas pessoais, para verdadeiramente trocar arquivos Markdown que delimitam skills de agentes.

Por isso pedi para o Claude Code gerar, em um one-shot, uma skill compartilhável. Aqui está a skill inicial de genealogia, junto com meu prompt e notas do agente. Saiu quase perfeita, mas vazou um pouco de contexto e idiossincrasias da minha família.

Iterei um pouco e fiz a publicação oficial da skill de genealogia aqui. Basta entregar esse link para seu Claude Code (ou qualquer outro agente, experimente mandar para seu OpenClaw!) e pedir para ele começar a desvendar sua genealogia. Ficarei honrado de saber o quanto você conseguiu evoluir a sua, usando esse pequeno arquivo!

3 comentários

Participe da discussão no X e LinkedIn

X @RicLazzaro Ricardo di Lazzaro F 20 fev 2026

Super interessante! Imagina se ele conseguir ainda cruzar com os dados genéticos públicos do GEDMATCH?

LinkedIn @jbenignocardoso José Henrique Cardoso 🇧🇷 🇪🇸 🇵🇹 19 fev 2026

Interessante, parece mesmo que caminhamos para pseudoespecificações, como o skill do Claude Code, e nos afastaremos do código. Acabo de sair de um post do Akita (https://akitaonrails.com/2026/02/09/ai-agents-qual-seria-a-melhor-linguagem-de-programacao-para-llms/) sobre linguagens voltadas a LLMs. Sem falar do post do Elon Musk sobre o fim das linguagens de programação: do prompt para o binário, diretamente. Curioso para ver onde chegaremos com tudo isso.

Paulo Silveira

acho bem por ai e vai alem: independente da linguagem, do mecanismo de especificacao, vai ter tambem de adicionar um contexto particular seu, do seu time (ou da sua empresa, mas mais dificil ainda). esse contexto é que vai tirar a possivel ambiguidade do "texto corrido". e cada um tem o seu. esse da arvore genealogica acaba sendo um exemplo exagerado disso.

LinkedIn @ilha Adalberto Brant 20 fev 2026

Poxa que projeto legal Paulo Silveira, rodando aqui em 3, 2, 1.

Paulo Silveira

Adalberto Caldeira Brant Filho depois me manda o que conseguiu!

Você também pode gostar