Description:
Este banco de dados busca reunir os N-Gram’s das 434 pessoas que formaram a rede de relações sociais do artista franco-americano Marcel Duchamp (BRAGA, 2023). Para tanto, utilizamos o Google Books N-Gram Viewer, uma plataforma que permite ao usuário pesquisar a frequência com que uma palavra, expressão ou frase foi utilizada no corpus digitalizado de livros do acervo Google Books. Por exemplo: se o usuário digita “Marcel Duchamp” na barra do buscador N-Gram Viewer, a plataforma calcula quantos Two-Grams existem em uma amostra selecionada de livros, e quantos desses Two-Grams correspondem à expressão “Marcel Duchamp”. Em 2022, 0.0000165233% de todos os Two-Grams publicados naquele ano (de acordo com a amostra de livros utilizadas pelo Google) correspondia à expressão “Marcel Duchamp”. Se, ao invés de “Marcel Duchamp”, o usuário digitasse “Duchamp”, a plataforma calcularia todos os One-Gram disponíveis na amostra selecionada de livros, e calcularia quantos desses One-Grams correspondem à expressão “Duchamp”. Se o usuário digitasse “Marcel Duchamp Urinol”, a plataforma calcularia quantos Three-Gram’s correspondem à expressão digitada, e assim por diante. Além disso, a plataforma permite que o usuário manipule quatro filtros de busca: (i) Intervalo: o intervalo de tempo em que os livros da amostra foram publicados;
(ii) Corpus: qual corpus de livros será utilizado para a busca – livros em inglês, livros em francês, livros com caracteres chineses;
(iii) Case-Insensitive: o buscador precisa ou não precisa distinguir letras maiúsculas das minúsculas;
(iv) Smoothing: é a maneira como os dados são calculados; para que a visualização das tendências fique mais “clara”, os dados apresentados em cada anos podem ser calculados com base em uma média dos anos imediatamente anteriores e imediatamente posteriores. Por exemplo: se eu selecionar o smoothing 1, a plataforma vai calcular a proporção de Two-Grams que correspondem à expressão “Marcel Duchamp” com base em uma média dos resultados do ano 2022, mais os resultados de 1 ano anterior e um ano posterior; portanto, o resultado de 2022 é igual à média entre os anos 2021, 2022 e 2023.
O objetivo da plataforma Google Books N-Gram Viewer é observarmos as oscilações no número de vezes em que uma dada expressão é utilizada ao longo do tempo; portanto, é uma proxy para mensurarmos o nível de interesse, popularidade e prestígio de dado objeto, tema, ou expressão, com base nos livros digitalizados pelo Google.
Para construir o presente banco de dados, foram coletados os N-Grams (One-Gram, Two-Grams, Three-Grams, dependendo da extensão do nome da pessoa) para cada um dos 434 sujeitos pertencentes à rede de relações de Marcel Duchamp. Para todos esses sujeitos, coletamos uma observação por década, sempre em um ano terminado em 9: 2019, 2009, 1999, 1989, ..., 1959, 1949, ..., 1919, 1909, 1899, de modo a percorrer as oscilações de interesse por cada uma das pessoas ao longo de todo o século XX e começo do século XXI. Multiplicando as 434 pessoas por 13 décadas, temos um total de 5642 observações no banco de dados (Felipe Eduardo Lázaro Braga).