2024-10-022024-10-02https://labtecgc.udesc.br/dspace-lab-01/handle/hdl-lab-01-s01/8282Tomando uma amostra de 48 documentos publicados sobre a Bibliometria Brasileira, de 1973 a 2020, são analisadas as características textuais dessa literatura publicada. Foram utilizadas técnicas de mineração de textos, com foco principalmente na identificação da frequência de uso dos termos com o pacote tm de R. O algoritmo Latent Dirichlet Allocation (LDA) agrupou os documentos da amostra em 5 tópicos diferentes com a identificação das palavras mais recorrentes em cada assunto agrupado. Essas questões são mostradas com a construção de um dendrograma relevante e adequado para os documentos. A análise de clusteres com o algoritmo correspondente ao método de Ward identificou três clusteres homogêneos. Finalmente, foi construída uma rede de relações das palavras ou tokens dos 48 documentos analisados neste trabalho.application/pdfCopyright (c) 2021 Revista ACBBibliometría. Informetría. Cienciometría. Brasil. Minería de textosInformation ScienceLa bibliometría brasileña: minería de textosinfo:eu-repo/semantics/article