Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil

dc.contributor.advisor1Feitosa, Eduardo Luzeiro
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/5939944067207881por
dc.contributor.referee1Souto, Eduardo James Pereira
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3875301617975895por
dc.contributor.referee2Batista, Daniel Macêdo
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2934786440085983por
dc.creatorSilva, Adeilson Souza da
dc.creator.Latteshttp://lattes.cnpq.br/7277627592187255por
dc.date.issued2015-09-25
dc.description.abstractThe growth in the number of users in social networks, especially Twitter, become themselves susceptible to creation and propagation of automated posts. On Twitter, the Trend Topics list represents the most talked subjects in a particular region and can be misused by automated accounts. Then, it is necessary to understand and study how these users behave in order to create measures to combat them and ensure that published data have credibility. Using a real database collected from the Twitter Trend Topics in Brazil, from December 2013 to June 2014, with 2.853,822 accounts and 11,294,861 tweets, a methodology to detect automated behavior in Trend Topics was proposed. For this, we studied several text characteristics and user behavior to identify attributes capable of distiguish human users and automated users. Also were proposed six (6) new features based on the concept of entropy. Using this set of attributes with ma-chine learning algorithms for supervised classification, it was possible to detect 92 % of automated accounts in the database used and thus get an insight into the behavior of these users.eng
dc.description.resumoO crescimento no número de usuários fez com que as redes sociais, especialmente o Twitter, tornassem-se suscetíveis a criação e propagação de postagens automatizadas. No Twitter, a lista de tópicos de tendência representa os assuntos mais comentados em determinada região e pode ser utilizada indevidamente por contas automatizadas. É necessário então entender e estudar a forma como esses usuários se comportam a fim de criar medidas para combatê-los e garantir que os dados publicados possuam credibilidade. Utilizando uma base de dados real coletada dos tópicos de tendência do Twitter no Brasil, no período de dezembro de 2013 a junho de 2014, com 2.853.822 contas e 11.294.861 tweets, uma metodologia para detectar comportamento automatizado nos tópicos de tendência do Twitter foi proposta. Para tanto, foram estudadas diversas características de texto e do comportamento dos usuários para identificar atributos capazes de dis- tiguir usuários humanos de usuários automatizados. Também foram propostas seis (6) novas características extraídas do texto dos tweets baseadas no conceito de Entropia. Utilizando esse conjunto de atributos com algoritmos de aprendizagem de máquina supervisionada para classificação, foi possível detectar 92% das contas automatizadas na base de dados utilizada e, assim, obter uma visão do comportamento desses usuários.por
dc.description.sponsorshipFAPEAM - Fundação de Amparo à Pesquisa do Estado do Amazonaspor
dc.formatapplication/pdf*
dc.identifier.citationSILVA, Adeilson Souza da. Detectando comportamento automatizado nos tópicos de tendência do Twitter no Brasil. 2015. 87 f. Dissertação (Mestrado em Informática) - Instituto de Computação, Universidade Federal do Amazonas, Manaus, 2015.por
dc.identifier.urihttps://tede.ufam.edu.br/handle/tede/6930
dc.languageporpor
dc.publisherUniversidade Federal do Amazonaspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Computaçãopor
dc.publisher.initialsUFAMpor
dc.publisher.programPrograma de Pós-graduação em Informáticapor
dc.rightsAcesso Abertopor
dc.subjectTweetspor
dc.subjectTópicos de Tendênciapor
dc.subjectEntropiapor
dc.subjectAprendizagem de Máquinapor
dc.subjectTrend Topicseng
dc.subjectEntropyeng
dc.subjectMachine Learningeng
dc.subject.cnpqCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOpor
dc.thumbnail.urlhttps://tede.ufam.edu.br//retrieve/27914/Disserta%c3%a7%c3%a3o_AdeilsonSilva_PPGI.pdf.jpg*
dc.titleDetectando comportamento automatizado nos tópicos de tendência do Twitter no Brasilpor
dc.title.alternativeDetecting automated behavior in Twitter trend topics in Brazileng
dc.typeDissertaçãopor

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação_AdeilsonSilva_PPGI.pdf
Tamanho:
4.22 MB
Formato:
Adobe Portable Document Format

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.23 KB
Formato:
Item-specific license agreed upon to submission
Descrição: