Sabe aquela reportagem que saiu recentemente sobre a IA conseguindo desvendar o que estava escrito em um documento antigo?
Então, estava eu navegando nos microfilmes feitos dos registros da Igreja Católica de Minas Gerais e encontrei um documento de 1831 que trata de uma análise da consanguinidade de pretendentes a casamento.
Alguns documentos eu consigo decifrar, mas esse eu não consegui. Tive então a super ideia de pedir uma ajuda para as IAs mais usadas atualmente e ver quem ia ganhar.
Tanto ChatGPT quanto o LeChat (Mistral) foram um fracasso. O DeepSeek se recusou a fazer o serviço.
Não somente não conseguiram entender o texto como ALUCINARAM e cuspiram coisas que não tinha no texto.
O documento está em um livro de processos matrimoniais no âmbito da Igreja Católica entre os anos de 1830-1836. Eu não consigo entender direito o documento, mas sei que ele fala de José e Anna Theodora que tem impedimento por parentesco de x grau, diz algo sobre prima-irmã. Depois diz que são pobres, alguma coisa de "raptada" e o resto não entendi.
Basicamente o LeChat da Mistral alucinou demais e me transcreveu o documento assim, como se fosse um caso de disputa de terras:
Transcrição Parcial e Interpretação:
[i]Cabeçalho:
"Benedicto aos [ilegível] do Conselho [ilegível] [3 de agosto de 1831]"
Primeiro Parágrafo:
Parece tratar-se de uma comunicação ou registro envolvendo pessoas e propriedades.
"[...] José Joaquim de [ilegível] e sua mulher, Dona Teodora [...]"
"[...] moradores na freguesia de Santo Antônio, [...]"
"[...] foram justos e legítimos possuidores de um pedaço de terra [...]"
"[...] onde construíram uma casa e plantaram roças, [...]"
Segundo Parágrafo:
"[...] não tendo sido incomodados por ninguém, até que um certo orador [...]"
"[...] alegou que a terra pertencia a ele, e que os mesmos estavam de má-fé [...]"
"[...] os réus provaram que a terra foi dada a eles por uma pessoa falecida, e que sempre foi de sua posse pacífica."
Assinaturas:
Há várias assinaturas no final, incluindo a de um "Padre" e outras pessoas envolvidas.
Observações:
Data: O documento é datado de 3 de agosto de 1831.
Contexto: Parece ser um registro de disputa de terras ou uma reclamação envolvendo moradores de uma freguesia (paróquia) em Minas Gerais.
Termos Jurídicos: Há menção a termos como "justos e legítimos possuidores" e "posse pacífica", indicando um contexto legal ou eclesiástico."
Já segundo o ChatGPT o documento diz:
(Topo da página)Remettido ao Snr.
Vigário (?) Ouvidor (?)
(?) Comarca do Rio das Mortes
3 de setembro de 1831
(Corpo principal do texto — letra muito clara, ornamental)
Digo que José Vieira [?], filho de Rosa (?) residente no bairros de S. [?]
ella achou-se [?] de legítimos filhos, feitos por palavra de [?]. (?) Certifico e dou por verdade (?) como padrinhos foram [?] de [?], sendo segundo grau de consanguinidade [?] posto o conteúdo conforme à lei da primeira instância da ordenança.
E que tudo faço para efeito público e para a justiça sobre o caso em andamento, e para mais firmeza dou lugar à presente que fica de fé para ser guardada e conservada por via pública.
(Assinaturas e fecho)
O que o documento parece ser
É uma certidão paroquial feita por um padre ou escrivão da paróquia, em 1831, confirmando:
- a filiação de um homem chamado José Vieira (sobrenome provável),
- filho de uma mulher chamada Rosa,
- mencionando que os filhos eram legítimos,
- que havia padrinhos e que se observava o grau de consanguinidade,
- e que o documento serviria para efeitos jurídicos (“para a justiça sobre o caso em andamento”).
Que uma IA não entenda a caligrafia da época eu julgo mais do que normal e aceitável, mas que ela pose de sabichona e crie informações é ridículo.
Já vi pessoas tentando decifrar documentos antigos com ajuda de IA e compartilhando umas com as outras os "achados". Exceto que, ao tentar eu fazê-lo pela primeira vez, me deparei com alucinação pura. Posso não entender tudo o que está escrito mas tenho certeza que, ao percorrer o documento com os olhos, não existe nenhuma palavra que pareça ser relacionada à construção de uma casa.
Sim, o meu prompt foi básico, escrevi como uma pessoa normal faria, não uma nerd que sabe que precisa de uma engenharia de prompt para facilitar para a IA. Depois de ler o primeiro resultado, iterei novamente e dei um contexto, o que melhorou a resposta MAS depois de ver uma alucinação, você não confia nem mesmo na resposta "corrigida".
Sei que é chover no molhado, mas não tem como confiar nessas coisas sem ter uma base (nesse caso, eu sabia sobre o que era o documento) e sem refletir, vigiar e analisar o resultado.
No mais, não tenho certeza se precisamos de uma GenIA para esse tipo de transcrição mas ainda não encontrei um OCR para documentos antigos treinado nas caligrafias dos mineiros :p
(para quem quiser ver o documento em detalhes, precisa de uma conta no site: www.familysearch.org/ark:/61903/3:1:S3HT-D1QW-SV?lang=en&i=79)





