Use este identificador para citar ou acessar este item: https://metabuscador.uspdigital.usp.br/xmlui/handle/doc/18004
DOI: https://hdl.handle.net/11449/318412
Título: Documentos presidenciais da Biblioteca da Presidência da República: base de metadados (versão 1)
Presidential documents from the Library of the Presidency of the Republic: metadata database (version 1)
Assunto: Políticas públicas;Governo federal;Presidência da República;Documentos oficiais;Dados de pesquisa
Descrição: Planilha contendo metadados estruturados de 8.606 documentos oficiais publicados na Biblioteca da Presidência da República, abrangendo discursos, entrevistas, pronunciamentos, mensagens oficiais e outros tipos de documentos produzidos por presidentes brasileiros. Esta versão inclui apenas metadados — não contém o texto completo dos documentos. Descrição detalhada: Este conjunto de dados reúne metadados extraídos por raspagem automatizada da Biblioteca da Presidência da República, abrangendo 8.606 documentos oficiais publicados entre diferentes governos, de 1985 (governo Sarney), até 2022 (governo Bolsonaro). Os metadados incluem: identificador único (document_id), nome do presidente, tipo de documento (em sua forma original), data (ISO, quando disponível), ano e mês, título conforme publicado, URL original do documento na Biblioteca da Presidência da República, nome de arquivo, idioma (pt-BR), fonte e notas de processamento. Esta versão disponibiliza apenas os metadados para fins de reprodutibilidade, rastreamento e uso em pesquisas sobre comunicação governamental, agenda presidencial, prioridades governamentais e estudos de políticas públicas. O texto integral dos documentos não está incluído nesta versão. A base foi organizada a partir de raspagem sistemática, com limpeza, padronização leve, conversão de datas e unificação de colunas essenciais. As categorias originais provenientes da própria Biblioteca da Presidência foram preservadas, sem recodificação temática.
This dataset compiles structured metadata for 8,606 official documents published in the Library of the Presidency of the Republic, encompassing speeches, interviews, statements, official messages, and other types of documents produced by Brazilian presidents from 1985 (Sarney administration) to 2022 (Bolsonaro administration). The metadata include: unique identifier (document_id), president’s name, original document type, date (ISO format, when available), year and month, title as published, original URL in the Library of the Presidency of the Republic, file name, language (pt-BR), source, and processing notes. This version provides metadata only, for purposes of reproducibility, traceability, and use in research on presidential agendas, government priorities, public policy studies, and governmental communication. The full text of the documents is not included in this release. The dataset was constructed through systematic web scraping, followed by cleaning, standardization, date conversion, and consolidation of essential fields. The original categories assigned by the Library of the Presidency were preserved, with no thematic recoding.
Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)
Processo CNPQ: 312490/2023-2
Autor(es):  
URI: https://metabuscador.uspdigital.usp.br/xmlui/handle/doc/18004
Outros identificadores: https://hdl.handle.net/11449/318412
5810332148425938
0000-0002-1423-898X
Fomento:  
Número do Projeto:  
Termo de uso: info:eu-repo/semantics/openAccess
Data: 14-Jan-2026
22-Nov-2025
Data de Disponibilização: 16-Jan-2026
Formato: Arquivo pdf
csv
text/csv
application/pdf
Tipo: info:eu-repo/semantics/dataset
Editora / Evento / Instituição: Universidade Estadual Paulista (UNESP)
Idioma : por
Aparece nas coleções:Repositório Institucional UNESP



Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.