2024-06-282024-06-28https://labtecgc.udesc.br/dspace-lab-01/handle/hdl-lab-01-s01/7382Objective: to compare the methods of Natural Language Processing and Bibliographic Coupling normalized via Salton Cosine applied to the ten most accessed articles of 2020 in the Scientometrics journal. Methodology: It calculates the similarity between all articles according to five perspectives, namely: similarities between active forms of the full text, active forms of abstracts, keywords in common, bibliographic coupling between documents and bibliographic coupling of authors. Furthermore, it calculates the Pearson and Spearman correlations, applies the Wilcoxon non-parametric test at a 5% significance level, and represents the normalized values in a boxplot. Results: It finds that the specificities of each method significantly influence the achievement of a significant correlation between the measures in which the two coupling calculations would correlate more strongly with each other, as well as two calculations based on natural language processing. Note that the coupling calculations correlated significantly, as for each document coupling value there is necessarily at least one author coupling value. About calculations based on natural language processing, there is a strong correlation between full texts and abstracts, as there is a content dependence between both. The Wilcoxon test measured significant differences between all pairs of compared measurements. Conclusions: It concludes a strong correlation between full texts and abstracts, and between bibliographic coupling methods. However, there is a significant difference between the calculated values.Objetivo: compara los métodos de Procesamiento del Lenguaje Natural y Acoplamiento Bibliográfico normalizados a través del Coseno de Salton aplicados a los diez artículos más consultados de 2020 de la revista Scientometrics. Metodología: Calcular una similitud entre todos los artigos segundo cinco perspectivas, sendo elas: similitudes entre formas activas do texto completo, formas activas dos resumos, palavravas-chaves em comum, acoplamento bibliográfico entre documentos e acoplamento bibliográfico de autores. Además, calcula las correlaciones de Pearson y Spearman, aplica la prueba no paramétrica de Wilcoxon a un nivel de 5% de significancia y representa los valores normalizados en el diagrama de caja. Resultados: Encuentra que las especificidades de cada método influyen significativamente en el logro de una correlación significativa entre las medidas en las que los dos cálculos de acoplamiento se correlacionarían más fuertemente entre sí, así como dos cálculos basados en el procesamiento del lenguaje natural. Tenga en cuenta que los cálculos de acoplamiento se correlacionaron significativamente, ya que para cada valor de acoplamiento de documento hay necesariamente al menos un valor de acoplamiento de autor. En cuanto a los cálculos basados en el procesamiento del lenguaje natural, existe una fuerte correlación entre los textos completos y los resúmenes, ya que existe una dependencia de contenido entre ambos. La prueba de Wilcoxon midió diferencias significativas entre todos los pares de medidas comparadas. Conclusiones: Concluye una fuerte correlación entre textos completos y resúmenes, y entre métodos de acoplamiento bibliográfico. Sin embargo, existe una diferencia significativa entre los valores calculados.Objetivo: compara os métodos de Processamento de Linguagem Natural e Acoplamento Bibliográfico normalizados via Cosseno de Salton aplicados aos dez artigos mais acessados de 2020 do periódico Scientometrics. Metodologia: Calcula a similaridade entre todos os artigos segundo cinco perspectivas, sendo elas: similaridades entre formas ativas do texto completo, formas ativas dos resumos, palavravas-chaves em comum, acoplamento bibliográfico entre documentos e acoplamento bibliográfico de autores. Ademais, calcula as correlações de Pearson e Spearman, aplica o teste não [S. lparamétrico de Wilcoxon a nível de 5% de significância e representa os valores normalizados em boxplot. Resultados: Constata que as especificidades de cada método influenciam significativamente na obtenção de correlação significativa entre as medidas em que os dois cálculos de acoplamento se correlacionariam de maneira mais forte entre si, assim como dois cálculos baseados no processamento de linguagem natural. Observa que os cálculos de acoplamento, correlacionaram-se de maneira significativo, pois, para cada valor de acoplamento de documentos há necessariamente, ao menos um valor de acoplamento de autores. Com relação aos cálculos baseados no processamento de linguagem natural, verifica forte correlação entre textos completos e resumos, visto que há uma dependência de conteúdo entre ambos. O teste de Wilcoxon, aferiu diferenças significativas entre todos os pares de medidas comparadas. Conclusão: Conclui forte correlação entre textos completos e resumos, e, entre os métodos de acoplamento bibliográfico. Entretanto, guarda distinção significativa entre os valores calculados.application/pdfCopyright (c) 2023 Bianca Savegnago de Mira, Rafael Gutierres Castanhahttp://creativecommons.org/licenses/by/4.0Acoplamento bibliográficoÍndice de similaridadeProcessamento de linguagem naturalBibliographic couplingSimilarity indexNatural language processingAcoplamiento bibliográficoÍndice de similitudProcesamiento natural del lenguajeNatural language processing and bibliographic coupling: an analysis of the proximity between the most accessed articles of the Scientometrics JournalProcesamiento del lenguaje natural y enlace bibliográfico: un análisis de la proximidad entre los artículos más acceso de la Revista ScientometricsProcessamento de linguagem natural e acoplamento bibliográfico: uma análise da proximidade entre os artigos mais acessados do periódico Scientometricsinfo:eu-repo/semantics/article