Tags and keywords, freely chosen by users for annotating resources, offer a new way
for organizing and retrieving web resources that closely reflect the users’ interests and
preferences, as well as automatically generate folksonomies. Social tagging systems have
gained increasing popularity as a method for annotating and categorizing a wide range
of different web resources. They also attract researchers in social sciences because they
offer a huge quantity of user-generated annotations that reveal the interests of millions of
people. To date, the study using digital trace data methods continues to lack a theoretical
framework, particularly in social science research. This paper presents a methodology to use
big data from Web 2.0 in social research. At the same time, it applies a method to extract
data from a particular social bookmarking site (Delicious) and shows the sort of results that
this type of analysis can offer to social scientists. The illustration is made around the topic
of globalization of agriculture. Using data crawled from a large social tagging system can
have an important impact in the discovering of latent patterns, which is needed to provide
effective recommendations to different actors. In this paper, a sample of 851 users, 526 URLs
and 1,700 tags from the Delicious classification system on the subject of globalization were
retrieved and analyzed. Through the analysis, main users and websites around globalization
issues in Delicious emerged, along with discovering the most important tags that were applied
by users to describe the globalization of agriculture. The implications of these methodology
and findings for further research are discussed.
As etiquetas e palavras-chave escolhidas livremente pelos utilizadores ao anotarem os
seus recursos, oferecem uma nova forma de organizar e recuperar recursos na “web” que
refletem, de forma mais ajustada, os interesses e preferências dos utilizadores, criando
automaticamente e ao mesmo tempo “folksonomies”. Os sistemas sociais de “tagging” são
cada vez mais populares enquanto métodos de anotação e categorização de recursos na “web”.
Estes métodos também atraem a atenção dos investigadores das ciências sociais por causa da
imensa quantidade de anotações geradas pelos utilizadores, as quais revelam os interesses de
milhões de pessoas. Até o presente, o estudo dos métodos de análises de dados a partir de
registos digitais carece de um enquadramento teórico, particularmente nas ciências sociais.
Este artigo apresenta uma metodologia para usar “big data” gerada na “Web 2.0” em estudos
de investigação nas ciências sociais. Simultaneamente, o artigo apresenta resultados da
aplicação desta metodologia na extração de dados gerados pela aplicação de “bookmarking” no website da Delicious e mostra o tipo de resultados que este tipo de análise pode oferecer
aos cientistas sociais. A ilustração da metodologia centra-se no tópico da Globalização da
Agricultura. Utilizando dados extraídos a partir duma aplicação de “tagging” de ampla
difusão é possível descobrir padrões latentes, de grande importância para a elaboração de
recomendações eficazes a diferentes atores. Este artigo reflete a recolha e análise de uma
amostra de 851 utilizadores, 526 URLs e 1,700 etiquetas do software Delicious classificadas
no tópico “Globalização da Agricultura”. Através desta análise emergiram atores e websites
importantes no tópico selecionado, bem como as etiquetas mais relevantes utilizadas na
descrição da “Globalização da Agricultura”. Por fim, discutem-se os resultados e implicações
da metodologia descrita e as linhas de trabalho futuro.