Identificação de especialistas em câncer no Brasil em plataforma de big data
um estudo de caso minerando a Plataforma Lattes com auxílio de softwares de extração e exploração de dados
DOI:
https://doi.org/10.5380/atoz.v14.91962Palavras-chave:
Câncer, Oncológicos, Plataforma Lattes, ScriptLattes, Medicina, Especialistas.Resumo
Introdução: Dados de diversas fontes são gerados a cada segundo, exigindo, assim, novas soluções para processá-los e gerenciá-los de maneira rápida. Muitas organizações públicas e privadas têm utilizado a análise de Big Data como estratégia de gestão. No campo da Oncologia, a análise de Big Data é capaz de fornecer subsídios valiosos à tomadores de decisão, seja para o desenho de políticas públicas, a alocação de recursos para pesquisa. Neste trabalho propõe-se uma metodologia para prospecção e análise de dados de CV Lattes visando identificar pesquisadores especialistas no campo da oncologia. Método: Utilizou-se, neste estudo, a ferramenta computacional ScriptLattes em combinação com o software KNIME para extração e análise de dados. Foram obtidas informações essenciais dos pesquisadores que atuam em oncologia, na subárea Medicina. A metodologia envolveu a identificação de especialistas, principais produções, distribuição geográfica e redes de colaboração. Resultados: A Plataforma Lattes revelou 198 pesquisadores aderentes aos critérios e filtros aplicados na estratégia de busca, dos quais 134 especialistas foram identificados com graduação em medicina e produções na área de oncologia. Artigos científicos figuram como principal produção entre os especialistas de maior destaque. Observou-se maior concentração desses especialistas na Região Sudeste do país e a presença de uma rede de colaborações envolvendo a maior parte dos especialistas mais produtivos. Conclusão: As estratégias e metodologias apresentadas neste estudo permitem a prospecção de informações e construção do cenário de especialistas brasileiros em oncologia, sendo promissoras para subsidiar gestores de CT&I na tomada de decisões.
Referências
Antons, D., Grünwald, E., Cichy, P., & Salge, T. O. (2020). The application of text mining methods in innovation research: current state, evolution patterns, and development priorities. R&D Management, 50, 329-351. https://doi.org/10.1111/radm.12408.
Bastian, M., Heymann, S., & Jacomy, M. (2009). Gephi: An Open Source Software for Exploring and Manipulating Networks. Proceedings of the International AAAI Conference on Web and Social Media, 3(1), 361-362. https://doi.org/10.1609/icwsm.v3i1.13937, Artigo 1.
Bibloteca Virtual em Saúde. (2023). INCA lança a Estimativa 2023 – Incidência de Câncer no Brasil. Biblioteca Virtual em Saúde. https://bvsms.saude.gov.br/inca-lanca-a-estimativa-2023-incidencia-de-cancer-no-brasil/
Bordin, A. S., Gonçalves, A. L., & Todesco, J. L. (2014). Análise da colaboração científica departamental através de redes de coautoria. Perspectivas em Ciência da Informação, 19, 37–52. https://doi.org/10.1590/1981-5344/1796
Brito, A. G. C., Quoniam, L., & Mena-Chalco, J. P. (2016). Exploração da Plataforma Lattes por assunto: Proposta proposta de metodologia. Transinformação, 28(1), 77–86. https://doi.org/10.1590/2318-08892016002800006
Cafezeiro, I., Costa, L. C. D., & Kubrusly, R. D. S. (2016). Ciência da Computação, Ciência da Informação, Sistemas de Informação: Uma reflexão sobre o papel da informação e da interdisciplinaridade na configuração das tecnologias e das ciências. Perspectivas em Ciência da Informação, 21, 111-133. https://doi.org/10.1590/1981-5344/2681
Chaves, H., Florencio, F., Silveira, C., Antunes, A., Mena-Chalco, J., & Magalhães, J. (2023). Scientific and technological connections between specialists in injectable oncology: Aa contribution to public health from the analysis of the Lattes database. Informatio, 28, 390–-4414. https://doi.org/10.35643/info.28.2.9
Chaves, H., Silva, J., Hir, M., Silveira, C., Mena-Chalco, J., & Magalhães, J. (2024). Estudo comparativo das produções científicas e tecnológicas dos especialistas seniores em Covid-19 após um ano de pandemia no Brasil. Tempus Actas de Saúde Coletiva, 16. https://doi.org/10.18569/tempus.v16i3.3123
Conselho Nacional de Desenvolvimento Científico e Tecnológico (2025). Plataforma Lattes. https://lattes.cnpq.br/>. Acesso em: 25 out. 2022./
Costa, R. (2021). O papel da ciência de dados na medicinaINA. Revista Portuguesa de Cirurgia, 0(49), 17–18. https://doi.org/10.34635/rpc.860
Ferraz, R. R. N., & Quoniam, L. M. (2013). A utilização da ferramenta computacional Scriptlattes para avaliação das competências em pesquisa no Brasil. PRISMA.COM, 222-2341. https://ojs.letras.up.pt/index.php/prismacom/article/view/1944
Ferraz, R. R. N., Barnabé, A. S., Quoniam, L., Santos, A. M. dos, & Mariosa, D. F. (2018). Aspectos históricos da criação dos grupos de pesquisa em dengue no Brasil com a utilização da ferramenta computacional ScriptGP. Ciência & Saúde Coletiva, 23, 837–848. https://doi.org/10.1590/1413-81232018233.00862016
Ferraz, R. R. N., Quoniam, L., Pimenta, D. N., Mena-Chalco, J. P., & Nigro, C. A. (2015). Extração e disponibilização on line de indicadores de desempenho e prospecção dos resultados das pesquisas em dengue com a utilização da ferramenta computacional Scriptlattes. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, 20(43), 93–114. https://doi.org/10.5007/1518-2924.2015v20n43p93
Ferraz, R., Quoniam, L., & Maccari, E. (2015). A utilização da ferramenta Scriptlattes para extração e disponibilização on-line da produção acadêmica de um programa de pós-graduação stricto sensu em Administração. Revista Brasileira de Pós-Graduação, 11. https://doi.org/10.21713/2358-2332.2014.v11.445
Giordano, D. M., Bruning, E., & Bordin, A. S. (2015). Uso do scriptLattes e Gephi na Análise da Colaboração Científica. Anais do Computer on the Beach, 239–248. https://doi.org/10.14210/cotb.v0n0.p239
Instituto Nacional de Câncer. (2019a). ABC do Câncer: abordagens básicas para o controle do câncer. INCA - Instituto Nacional de Câncer. https://www.inca.gov.br/publicacoes/livros/abc-do-cancer-abordagens-basicas-para-o-controle-do-cancer
Instituto Nacional de Câncer. (2019b). Estimativa 2020: —Apresentação | INCA -. Instituto Nacional de Câncer. https://www.inca.gov.br/estimativa
Instituto Nacional de Câncer. (2022a). O que é câncer? Instituto Nacional de Câncer - INCA. https://www.gov.br/inca/pt-br/assuntos/cancer/o-que-e-cancer
Instituto Nacional de Câncer. (2022b). INCA estima 704 mil casos de câncer por ano no Brasil até 2025. Instituto Nacional de Câncer - INCA. https://www.gov.br/inca/pt-br/assuntos/noticias/2022/inca-estima-704-mil-casos-de-cancer-por-ano-no-brasil-ate-2025
Magalhães, J. L., Quoniam, L., Mena-Chalco, J. P., & Santos, A. (2014). Extração e tratamento de dados na base lattes para identificação de core competencies em dengue. Informação & Informação, 19(3), 30. https://doi.org/10.5433/1981-8920.2014v19n3p30
Magalhães, J., Hir, M., Quoniam, L., Hartz, Z., & Oliveira, D. A. de. (2020). A management tool to aid in the tropical outbreak of the 21st century: senior scientists and their knowledge of the triple threat dengue, zika and chikungunya. Problems of Management in the 21st Century, 15(1), 40–55. https://doi.org/10.33225/10.33225/pmc/20.15.40
Magalhães, J., Hir, M., Quoniam, L., Hartz, Z., & Oliveira, D. A. de. (2020). A management tool to aid in the tropical outbreak of the 21st century: senior scientists and their knowledge of the triple threat dengue, zika and chikungunya. Problems of Management in the 21st Century, 15(1), 40–55. https://doi.org/10.33225/10.33225/pmc/20.15.40
Magalhães, J., Martins, M. R. O., & Hartz, Z. (2014). Big Data em medicina tropical: Um panorama do conhecimento científico e tecnológico em malária no mundo e a contribuição de Portugal. Anais do Instituto de Higiene e Medicina Tropical, 13, 47–58. https://doi.org/10.25761/anaisihmt.171
Martino, B. D., Aversa, R., Cretella, G., Esposito, A., & Kołodziej, J. (2014). Big data (lost) in the cloud. International Journal of Big Data Intelligence, 1(1/2), 3. https://doi.org/10.1504/IJBDI.2014.063840
Mena-Chalco, J. P., & Cesar Junior, R. M. C. (2009). SscriptLattes: aAn open-source knowledge extraction system from the Lattes platform. Journal of the Brazilian Computer Society, 105(4). https://doi.org/10.1007/BF03194511
Mena-Chalco, J., & Cesar Junior, R. (2009). ScriptLattes: An open-source knowledge extraction system from the Lattes platform. J. Braz. Comp. Soc., 15, 31–-39. https://doi.org/10.1007/BF03194511
Mena-Chalco, J., & Cesar Junior, R. (2013). Prospecção de dados acadêmicos de currículos Lattes através de scriptLattes , pp. (p. 109–128). https://doi.org/10.13140/RG.2.1.5183.8561
Moraes, I. S., Novaes, F. C. P., Moreira, W. (2019). Os profissionais da informação: avaliação de currículo Lattes no domínio da organização do conhecimento na era do big data. E-prints in Library & Information Science. http://eprints.rclis.org/38552/
Motta, L. J., Ferraz, R. R. N., Quoniam, L., & Mena-Chalco, J. P. (2017). Prospecção acadêmica dos projetos financiados sobre dengue no Brasil: Uso uso da ferramenta Scriptlattes como apoio ao planejamento de pesquisas em Saúde Pública. Encontros Bibli: revista eletrônica de biblioteconomia e ciência da informação, 22(50), https://doi.org/10.5007/1518-2924.2017v22n50p114
National Cancer InstituteIH. (2021, outubro 13). The Tech Revolutionizing Cancer Research and Care. NCI (nciglobal,ncienterprise) [CgvArticle]. https://www.cancer.gov/news-events/nca50/stories/technologies-and-innovations
National Cancer InstituteNIH. (2022). A to Z List of Cancer Types—NCI (nciglobal,ncienterprise) [CgvHomeLanding]. https://www.cancer.gov/types
Nigro, C. A. (2016). Uso das ferramentas computacionais Scriptlattes, ScriptGP e Patent2net para análise da produção bibliográfica e tecnológica sobre a dengue. http://bibliotecatede.uninove.br/handle/tede/1548
Oliveira, D. T. de, Rocha, L. de O., & Silva, P. N. (2023). Recuperação de informação no Currículo Lattes: Proposição de requisitos aplicando técnicas de filtragem para recuperação da produção acadêmica. Ciência da Informação em Revista, 10, 1–19. https://doi.org/10.28998/cirev.2023v10lk
Silva, C. R. B. da, Teixeira, M. de O., & Silva, C. H. da. (2022). A produção científica sobre hanseníase dos líderes e vice-líderes dos grupos de pesquisa no Diretório de Grupos de Pesquisa (DGP). Asklepion: Informação em Saúde, 2, 162–181. https://doi.org/10.21728/asklepion.2022v2nesp.p162-181
Silveira, C., Hir, M. E., & Chaves, H. K. (2022). An Approach to Information Management as a Subsidy of Global Health Actions: A Case Study of Big Data in Health for Dengue, Zika, and Chikungunya. In J. L. Magalhães, Z. Hartz, G. Jamil, H. Silveira, & L. Jamil (Eds.), Handbook of Research on Essential Information Approaches to Aiding Global Health in the One Health Context (pp. 219-234). IGI Global Scientific Publishing. https://doi.org/10.4018/978-1-7998-8011-0.ch012
World Health Organization. (2022). Cancer. https://www.who.int/health-topics/cancer#tab=tab_1
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Copyright (c) 2025 AtoZ: novas práticas em informação e conhecimento

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
A revista AtoZ é um periódico científico de acesso aberto e o copyright dos artigos e da entrevista pertence aos respectivos autores/entrevistados com cessão de direitos para a AtoZ no que diz respeito à inclusão do material publicado (revisado por pares/postprint) em sistemas/ferramentas de indexação, agregadores ou curadores de conteúdo.

Todo o conteúdo da Revista (incluindo-se instruções, política editorial e modelos) está sob uma licença Creative Commons Atribuição 4.0 Não Adaptada, a partir de Outubro de 2020.
Ao serem publicados por esta Revista, os artigos são de livre uso para compartilhar (copiar e redistribuir o material em qualquer suporte ou formato para qualquer fim, mesmo que comercial) e adaptar (remixar, transformar, e criar a partir do material para qualquer fim, mesmo que comercial). É preciso dar o crédito apropriado , prover um link para a licença e indicar se mudanças foram feitas .
A AtoZ não cobra qualquer tipo de taxa para submissão e/ou processamento e/ou publicação de artigos.















