Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos

dc.contributor.advisor1Silva, Altigran Soares da
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3405503472010994por
dc.creatorBarros, Diego de Azevedo
dc.creator.Latteshttp://lattes.cnpq.br/1518552520629014por
dc.date.issued2016-07-12
dc.description.abstractA very important issue for the analysis of comments posted by users in social networks is the identification of the entities that are the target of these comments. However, correctly identifying the entities mentioned in texts produced by users is a challenging task, since the same entity can be mentioned in several different ways, depending on the user and on how the mention is being made. In addition, these comments are characterized by text with low-quality writing, misspellings, grammatical errors, etc. In this work, we present a case study on the problem of identification and disambiguation of mentions to entities in user-generated content, focused on the domain of games. The choice of this domain is due to the economic and cultural importance of this type of content and also because most of the work in recent literature related to this problems focuses on the context of electronics (televisions, smartphones, etc.). As a strategy for carrying out this case study, we have developed a tool called GameSpotter, which uses methods of named entity recognition - NER and named entity disambiguation - NED to identify and disambiguate mentions to games in comments posted on a real Web forum. Therefore, we have developed two alternative NER methods and one NED method focused on the domain of games. Our experimental results showed that our NER and NED methods are effective, achieving an average precision of 0.93 and 0.83 in the recognition and disambiguation mentions of games, respectively.eng
dc.description.resumoUm problema bastante relevante para a análise de comentários postados por usuários em redes sociais é a identificação das entidades que são o alvo destes comentários. No entanto, identificar corretamente as entidades mencionadas em textos produzidos pelos usuários é uma tarefa desafiadora, visto que uma mesma entidade pode ser mencionada de várias maneiras diferentes, dependendo do usuário e de como a menção está sendo feita. Além disso, esses comentários são caracterizados por texto com baixa qualidade de escrita, erros ortográficos, gramaticais, etc. Neste trabalho, apresentamos um estudo de caso sobre o problema de identificação e desambiguação de menções a entidades em conteúdo gerado por usuários, voltado para o domínio de jogos. A escolha deste domínio deve-se à importância econômica e cultural deste tipo de conteúdo e também ao fato de a maioria dos trabalhos na literatura relacionada recente abordar este problema no contexto de produtos eletrônicos (televisores, smartphones, etc.). Como estratégia para a realização deste estudo de caso, desenvolvemos uma ferramenta chamada GameSpotter, que utiliza métodos de reconhecimento de entidades nomeadas (named entity recognition - NER) e de desambiguação de entidades nomeadas (named entity disambiguation - NED) para identificar e desambiguar as menções a jogos nos comentários postados em um fórum real daWeb. Para tanto, desenvolvemos dois métodos alternativos NER e um método de NED voltados ao domínio de jogos. Nossos resultados experimentais mostraram que nossos métodos de NER e NED são efetivos, tendo alcançado em média uma precisão de 0,93 e 0,83 em relação ao reconhecimento e desambiguação de menções a jogos, respectivamente.por
dc.description.sponsorshipCAPES - Coordenação de Aperfeiçoamento de Pessoal de Nível Superiorpor
dc.formatapplication/pdf*
dc.identifier.citationBARROS, Diego de Azevedo. Identificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogos. 2016. 81 f. Dissertação (Mestrado em Informática) - Universidade Federal do Amazonas, Manaus, 2016.por
dc.identifier.urihttp://tede.ufam.edu.br/handle/tede/5291
dc.languageporpor
dc.publisherUniversidade Federal do Amazonaspor
dc.publisher.countryBrasilpor
dc.publisher.departmentInstituto de Computaçãopor
dc.publisher.initialsUFAMpor
dc.publisher.programPrograma de Pós-graduação em Informáticapor
dc.rightsAcesso Abertopor
dc.subjectFerramenta GameSpotterpor
dc.subjectDomínio de Jogopor
dc.subjectRegras de Desambiguaçãopor
dc.subjectMétodo de Desambiguaçãopor
dc.subject.cnpqCIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃOpor
dc.thumbnail.urlhttp://tede.ufam.edu.br//retrieve/14111/Disserta%c3%a7%c3%a3o%20-%20Diego%20de%20A.%20Barros.pdf.jpg*
dc.titleIdentificação e desambiguação de menções a produtos em conteúdo gerado por usuários : um estudo de caso no domínio de jogospor
dc.typeDissertaçãopor

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
Dissertação - Diego de A. Barros.pdf
Tamanho:
742.38 KB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Carregando...
Imagem de Miniatura
Nome:
license.txt
Tamanho:
2.19 KB
Formato:
Item-specific license agreed upon to submission
Descrição: