Abstract:
Desde seu surgimento, a Internet tem revolucionado os meios de comunicação servindo de
palco para o desenvolvimento de inúmeras aplicações, voltadas para propagação de
informações. Entre as plataformas que mais se destacam estão as mídias sociais, como: blogs,
fóruns, redes sociais, microblogs entre outras. As redes sociais são um tipo de mídia social, que
possibilitam a seus usuários criarem perfis pessoais e interagir com outras pessoas, onde é
permitido aos usuários publicarem seus próprios conteúdos ou compartilhar o conteúdo de
outras publicações. O Facebook é a rede social mais popular do momento, além de permitir às
pessoas comuns criarem perfis e interagirem entre si, possibilita que as organizações criem
páginas para se relacionar diretamente com o público. Este recurso conhecido com fan
pages, possibilita as empresas divulgarem seus produtos e serviços de forma gratuita, criar
eventos, promover ações publicitárias e muito mais. Todos estes recursos acabam gerando uma
série de dados sobre os seguidores das páginas que podem revelar padrões interessantes a serem
explorados pelas empresas. Porém devido ao fluxo gigantesco de dados trafegados em uma rede
social do porte do Facebook, a tarefa de recuperar informações úteis acaba se tornando um tanto
quanto complexa. Por este motivo, o presente estudo teve por objetivo criar um método de
extração e análise em fan pages do Facebook, sendo este composto por quatro etapas. A
metodologia foi construída baseada nas principais técnicas de extração e análise de dados em
redes sociais presentes na literatura e teve como trabalhos norteadores as metodologias
propostas por Neves (2013), Hea, Zha e Li (2013), Abrahams et al., (2013), Thomaz (2014) e
Santos (2014). Foram utilizadas técnicas de análise de sentimentos em textos, onde foi
desenvolvido um script na linguagem de programação python, usando a biblioteca
de PLN (Processamento de Linguagem Natural) TextBlod, além da aplicação da técnica de
mineração de regras de associação, com a ferramenta WEKA e o algoritmo Apriori. Embora o
processo tenha explorado o setor de turismo, ele pode ser aplicado em outros tipos de fan pages,
uma vez que os tipos de dados analisados serão os mesmos. Para verificar o modelo, as técnicas
propostas foram aplicadas sobre 3 páginas de agências de turismo no litoral do Piauí, no período
de 20 de dezembro de 2017 a 10 de abril de 2018. Foram recuperados 1811 comentários de
usuários nas páginas investigadas, onde deste total 42% foram submetidos à análise de
sentimentos em textos e 36% foram marcações feitas por outros usuários totalizando 78% de
aproveitamento dos dados adquiridos. Dos comentários submetidos a análise de sentimentos
50% foram classificados com neutros, 48% positivos e apenas 2% negativos, com estes
resultados pode-se concluir que a imagem do consumidor sobre as três agências analisadas pode
ser considerada boa.