Identification of cancer specialists in Brazil on a big data platform
a case study mining the Lattes Platform with the aid of data prospection softwares
DOI:
https://doi.org/10.5380/atoz.v14.91962Keywords:
Cancer, Oncology, Lattes Platform, ScriptLattes, Medicine, SpecialistsAbstract
Introduction: Data from different sources are generated every second, thus requiring new solutions to process and manage them quickly. Many public and private organizations have used Big Data analysis as a management strategy. In the field of Oncology, Big Data analysis is capable of providing valuable subsidies to decision makers, whether for the design of public policies or the allocation of resources for research. This work proposes a methodology for prospecting and analyzing data from CV Lattes in order to identify specialist researchers in the field of oncology. Method: In this study, the computational tool ScriptLattes was used in combination with the KNIME software for data extraction and analysis. Essential information was obtained from researchers who work in oncology, in the Medicine subarea. The methodology involved the identification of specialists, main productions, geographic distribution and collaboration networks. Results: The Lattes platform revealed 198 researchers adhering to the criteria and filters applied in the search strategy, of which 134 specialists were identified with a degree in medicine and productions in the field of oncology. Scientific articles are the main production among the most prominent specialists. There was a greater concentration of these specialists in the southeastern region of the country and the presence of a network of collaborations involving most of the most productive specialists. Conclusion: The strategies and methodologies presented in this study allow the prospection of information and construction of the scenario of Brazilian specialists in oncology, being promising to support ST&I managers in decision-making.
References
Antons, D., Grünwald, E., Cichy, P., & Salge, T. O. (2020). The application of text mining methods in innovation research: current state, evolution patterns, and development priorities. R&D Management, 50, 329-351. https://doi.org/10.1111/radm.12408.
Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. Proceedings of the International AAAI Conference on Web and Social Media, 3(1), 361-362. https://doi.org/10.1609/icwsm.v3i1.13937, Artigo 1.
Bibloteca Virtual em Saúde. (2023). INCA lança a Estimativa 2023 – Incidência de Câncer no Brasil. Biblioteca Virtual em Saúde. https://bvsms.saude.gov.br/inca-lanca-a-estimativa-2023-incidencia-de-cancer-no-brasil/
Bordin, A. S., Gonçalves, A. L., & Todesco, J. L. (2014). Análise da colaboração científica departamental através de redes de coautoria. Perspectivas em Ciência da Informação, 19, 37–52. https://doi.org/10.1590/1981-5344/1796
Brito, A. G. C., Quoniam, L., & Mena-Chalco, J. P. (2016). Exploração da Plataforma Lattes por assunto: Proposta proposta de metodologia. Transinformação, 28(1), 77–86. https://doi.org/10.1590/2318-08892016002800006
Cafezeiro, I., Costa, L. C. D., & Kubrusly, R. D. S. (2016). Ciência da Computação, Ciência da Informação, Sistemas de Informação: Uma reflexão sobre o papel da informação e da interdisciplinaridade na configuração das tecnologias e das ciências. Perspectivas em Ciência da Informação, 21, 111-133. https://doi.org/10.1590/1981-5344/2681
Chaves, H., Florencio, F., Silveira, C., Antunes, A., Mena-Chalco, J., & Magalhães, J. (2023). Scientific and technological connections between specialists in injectable oncology: Aa contribution to public health from the analysis of the Lattes database. Informatio, 28, 390–-4414. https://doi.org/10.35643/info.28.2.9
Chaves, H., Silva, J., Hir, M., Silveira, C., Mena-Chalco, J., & Magalhães, J. (2024). Estudo comparativo das produções científicas e tecnológicas dos especialistas seniores em Covid-19 após um ano de pandemia no Brasil. Tempus Actas de Saúde Coletiva, 16. https://doi.org/10.18569/tempus.v16i3.3123
Conselho Nacional de Desenvolvimento Científico e Tecnológico (2025). Plataforma Lattes. https://lattes.cnpq.br/>. Acesso em: 25 out. 2022./
Costa, R. (2021). O papel da ciência de dados na medicinaINA. Revista Portuguesa de Cirurgia, 0(49), 17–18. https://doi.org/10.34635/rpc.860
Ferraz, R. R. N., & Quoniam, L. M. (2013). A utilização da ferramenta computacional Scriptlattes para avaliação das competências em pesquisa no Brasil. PRISMA.COM, 222-2341. https://ojs.letras.up.pt/index.php/prismacom/article/view/1944
Ferraz, R. R. N., Barnabé, A. S., Quoniam, L., Santos, A. M. dos, & Mariosa, D. F. (2018). Aspectos históricos da criação dos grupos de pesquisa em dengue no Brasil com a utilização da ferramenta computacional ScriptGP. Ciência & Saúde Coletiva, 23, 837–848. https://doi.org/10.1590/1413-81232018233.00862016
Ferraz, R. R. N., Quoniam, L., Pimenta, D. N., Mena-Chalco, J. P., & Nigro, C. A. (2015). Extração e disponibilização on line de indicadores de desempenho e prospecção dos resultados das pesquisas em dengue com a utilização da ferramenta computacional Scriptlattes. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, 20(43), 93–114. https://doi.org/10.5007/1518-2924.2015v20n43p93
Ferraz, R., Quoniam, L., & Maccari, E. (2015). A utilização da ferramenta Scriptlattes para extração e disponibilização on-line da produção acadêmica de um programa de pós-graduação stricto sensu em Administração. Revista Brasileira de Pós-Graduação, 11. https://doi.org/10.21713/2358-2332.2014.v11.445
Giordano, D. M., Bruning, E., & Bordin, A. S. (2015). Uso do scriptLattes e Gephi na Análise da Colaboração Científica. Anais do Computer on the Beach, 239–248. https://doi.org/10.14210/cotb.v0n0.p239
Instituto Nacional de Câncer. (2019a). ABC do Câncer: abordagens básicas para o controle do câncer. INCA - Instituto Nacional de Câncer. https://www.inca.gov.br/publicacoes/livros/abc-do-cancer-abordagens-basicas-para-o-controle-do-cancer
Instituto Nacional de Câncer. (2019b). Estimativa 2020: —Apresentação | INCA -. Instituto Nacional de Câncer. https://www.inca.gov.br/estimativa
Instituto Nacional de Câncer. (2022a). O que é câncer? Instituto Nacional de Câncer - INCA. https://www.gov.br/inca/pt-br/assuntos/cancer/o-que-e-cancer
Instituto Nacional de Câncer. (2022b). INCA estima 704 mil casos de câncer por ano no Brasil até 2025. Instituto Nacional de Câncer - INCA. https://www.gov.br/inca/pt-br/assuntos/noticias/2022/inca-estima-704-mil-casos-de-cancer-por-ano-no-brasil-ate-2025
Magalhães, J. L., Quoniam, L., Mena-Chalco, J. P., & Santos, A. (2014). Extração e tratamento de dados na base lattes para identificação de core competencies em dengue. Informação & Informação, 19(3), 30. https://doi.org/10.5433/1981-8920.2014v19n3p30
Magalhães, J., Hir, M., Quoniam, L., Hartz, Z., & Oliveira, D. A. de. (2020). A management tool to aid in the tropical outbreak of the 21st century: senior scientists and their knowledge of the triple threat dengue, zika and chikungunya. Problems of Management in the 21st Century, 15(1), 40–55. https://doi.org/10.33225/10.33225/pmc/20.15.40
Magalhães, J., Hir, M., Quoniam, L., Hartz, Z., & Oliveira, D. A. de. (2020). A management tool to aid in the tropical outbreak of the 21st century: senior scientists and their knowledge of the triple threat dengue, zika and chikungunya. Problems of Management in the 21st Century, 15(1), 40–55. https://doi.org/10.33225/10.33225/pmc/20.15.40
Magalhães, J., Martins, M. R. O., & Hartz, Z. (2014). Big Data em medicina tropical: Um panorama do conhecimento científico e tecnológico em malária no mundo e a contribuição de Portugal. Anais do Instituto de Higiene e Medicina Tropical, 13, 47–58. https://doi.org/10.25761/anaisihmt.171
Martino, B. D., Aversa, R., Cretella, G., Esposito, A., & Kołodziej, J. (2014). Big data (lost) in the cloud. International Journal of Big Data Intelligence, 1(1/2), 3. https://doi.org/10.1504/IJBDI.2014.063840
Mena-Chalco, J. P., & Cesar Junior, R. M. C. (2009). SscriptLattes: aAn open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 105(4). https://doi.org/10.1007/BF03194511
Mena-Chalco, J., & Cesar Junior, R. (2009). ScriptLattes: An open-source knowledge extraction system from the Lattes platform. J. Braz. Comp. Soc., 15, 31–-39. https://doi.org/10.1007/BF03194511
Mena-Chalco, J., & Cesar Junior, R. (2013). Prospecção de dados acadêmicos de currículos Lattes através de scriptLattes , pp. (p. 109–128). https://doi.org/10.13140/RG.2.1.5183.8561
Moraes, I. S., Novaes, F. C. P., Moreira, W. (2019). Os profissionais da informação: avaliação de currículo Lattes no domínio da organização do conhecimento na era do big data. E-prints in Library & Information Science. http://eprints.rclis.org/38552/
Motta, L. J., Ferraz, R. R. N., Quoniam, L., & Mena-Chalco, J. P. (2017). Prospecção acadêmica dos projetos financiados sobre dengue no Brasil: Uso uso da ferramenta Scriptlattes como apoio ao planejamento de pesquisas em Saúde Pública. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, 22(50), https://doi.org/10.5007/1518-2924.2017v22n50p114
National Cancer InstituteIH. (2021, outubro 13). The Tech Revolutionizing Cancer Research and Care. NCI (nciglobal,ncienterprise) [CgvArticle]. https://www.cancer.gov/news-events/nca50/stories/technologies-and-innovations
National Cancer InstituteNIH. (2022). A to Z List of Cancer Types—NCI (nciglobal,ncienterprise) [CgvHomeLanding]. https://www.cancer.gov/types
Nigro, C. A. (2016). Uso das ferramentas computacionais Scriptlattes, ScriptGP e Patent2net para análise da produção bibliográfica e tecnológica sobre a dengue. http://bibliotecatede.uninove.br/handle/tede/1548
Oliveira, D. T. de, Rocha, L. de O., & Silva, P. N. (2023). Recuperação de informação no Currículo Lattes: Proposição de requisitos aplicando técnicas de filtragem para recuperação da produção acadêmica. Ciência da Informação em Revista, 10, 1–19. https://doi.org/10.28998/cirev.2023v10lk
Silva, C. R. B. da, Teixeira, M. de O., & Silva, C. H. da. (2022). A produção científica sobre hanseníase dos líderes e vice-líderes dos grupos de pesquisa no Diretório de Grupos de Pesquisa (DGP). Asklepion: Informação em Saúde, 2, 162–181. https://doi.org/10.21728/asklepion.2022v2nesp.p162-181
Silveira, C., Hir, M. E., & Chaves, H. K. (2022). An Approach to Information Management as a Subsidy of Global Health Actions: A Case Study of Big Data in Health for Dengue, Zika, and Chikungunya. In J. L. Magalhães, Z. Hartz, G. Jamil, H. Silveira, & L. Jamil (Eds.), Handbook of Research on Essential Information Approaches to Aiding Global Health in the One Health Context (pp. 219-234). IGI Global Scientific Publishing. https://doi.org/10.4018/978-1-7998-8011-0.ch012
World Health Organization. (2022). Cancer. https://www.who.int/health-topics/cancer#tab=tab_1
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 AtoZ: novas práticas em informação e conhecimento

This work is licensed under a Creative Commons Attribution 4.0 International License.
Atoz is a open access journal and the authors have permission and are encouraged to deposit their papers in personal web pages, institutional repositories or portals before (pre-print) or after (post-print) the publication at AtoZ. It is just asked, when and where possible, the mention, as a bibliographic reference (including the atributted URL), to the AtoZ Journal.
The authors license the AtoZ for the solely purpose of disseminate the published work (peer reviewed version/post-print) in aggregation, curation and indexing systems.
The AtoZ is a Diadorim/IBICT green academic journal.
All the journal content (including instructions, editorial policies and templates) - except where otherwise indicated - is under a Creative Commons Attribution 4.0 International, since October 2020.
When published by this journal, articles are free to share (copy and redistribute the material in any support or format for any purpose, even commercial) and adapt (remix, transform, and create from the material for any purpose , even if commercial). You must give appropriate credit , provide a link to the license, and indicate if changes were made
AtoZ does not apply any charges regarding manuscripts submission/processing and papers publication.
























