Descrição
Trata-se de uma ferramenta que coleta dados de notícias, comentários e metadados de portais de notícias, gerando relatórios de coleta. O usuário informa os termos de busca e a ferramenta faz a raspagem de dados em cinco portais, que se destacam como os maiores no quesito veiculação de notícias generalistas. Esses portais apresentam atualização contínua, são direcionados a um público heterogêneo, quatro dos quais : 1) Folha de S. Paulo, do Grupo Folha; 2) G1, do Grupo Globo; 3) CNN Brasil, da Novus Media, ligado a CNN internacional; 4) Portal R7, do Grupo Record. Por fim, o portal Metrópoles não está ligado a nenhum grupo midiático do país
Diferencial Tecnológico
As notícias e os comentários gerados pelos usuários representam uma rica fonte de informação utilizada nos mais diversos domínios, como a previsão de preços na bolsa de valores, análise de percepção midiática (como os leitores estão recebendo/consumindo notícias), pesquisa de imagem institucional, estudos de desinformação e discurso de ódio, dentre tantas outras aplicações. Neste ensejo, percebeu-se uma lacuna quanto à ferramenta para busca, agregação e indexação de notícias e seus comentários, o que suscitou o desenvolvimento do NewsCrawlerBr: raspador de notícias e comentários de portais de notícias brasileiros. Ele é um software modular, escalável e de fácil utilização.
Objetivos da Universidade
TRANSFERÊNCIA DE TECNOLOGIA