Radiografía de la Twittósfera Chilena

Daniel Gómez M. [dgomez at dcc uchile cl]
Orbitando.com


Introducción

Twitter es un servicio de microblogging que permite la publicación de contenidos en la forma de textos cortos (updates o tweets), de máximo 140 caracteres. Cada usuario de la red puede relacionarse con otros usuarios, en la acción de seguir (follow), suscribiéndose a sus actualizaciones. De esta forma, cada miembro de la red posee un conjunto de usuarios que sigue (sus following o friends) y un conjunto de seguidores (sus followers).

El presente estudio busca analizar y caracterizar a un subconjunto de esta red: la red de usuarios chilenos en Twitter. Para ello se desarrolló un sistema capaz de navegar por la red, recuperando los contactos de cada usuario, a partir de un conjunto inicial de chilenos. Sobre este conjunto, la tarea consistió en identificar a los usuarios chilenos, logrando construir el conjunto que es la base de este trabajo.

Se define un usuario chileno (o cuenta-twitter chilena), como aquel usuario que publica updates desde Chile, o bien, que es un chileno viviendo en el extranjero. La condición base para determinar pertenencia a Chile, es el hecho de que el usuario indique explícitamente su ubicación en Chile. En caso de no indicarlo, se procede a analizar un conjunto de factores (location, bio, url, entre otros), lo que se combina con el análisis de la red de sus contactos, calculando el porcentaje de chilenos que posee entre sus friends y sus followers.

La información presentada corresponde a los datos recopilados de las cuentas, al 25 de Septiembre de 2009. De aquí en adelante, se utilizará la palabra usuario indistintamente de la palabra cuenta.




Usuarios

La base de este estudio son los usuarios, sus relaciones y características. En primer lugar se analizan los usuarios de la red de Chile, caracterizándolos y agrupándolos en base a la información disponible de cada uno: nombre de usuario, nombre completo, ubicación, fecha de inscripción, bio, url.


Total de cuentas empadronadas: 95012
Esta cifra corresponde al conjunto de usuarios chilenos encontrados.


Cuentas privadas: 10569
Proporción de cuentas establecidas como "privadas", es decir, sólo pueden ser leídas por usuarios autorizados por su creador.


Crecimiento de twitter en chile
Cantidad de nuevas cuentas de twitter creadas mes a mes, a partir de Julio/2006. En este diagrama se aprecia el comportamiento de twitter, en Chile: luego de casi 2 años de crecimiento muy lento, a partir de Marzo/2009 se observa un notable incremento de nuevos usuarios.

Antiguedad
La siguiente es la lista de los primeros usuarios inscritos en twitter, en Chile. El primer inscrito data de Julio del 2006.
   
corvalanlara / Daniel Corvalan-Lara 15/07/2006
panxodj / Francisco Romero 08/08/2006
ckarnal / Jorge 08/08/2006
seba / Pachan 11/08/2006
cleiva / Carlos Leiva Burotto 04/10/2006
OjoPiojo / Rodrigo Guaiquil 12/10/2006
paulbeelen / Paul Beelen 22/10/2006
rormeno / rormeno 11/11/2006


Ubicación (location)
Para el dato de ubicación (campo location), el caso base corresponde a cuando el usuario indica explícitamente la palabra "chile". Un segundo caso es que el usuario indique una ubicación, donde no aparece la palabra Chile. En este caso puede tratarse de alguna localidad del país, o bien, una ubicación no reconocible (por ejemplo, en el extranjero). El tercer caso, el más desafortunado, es cuando no se indica ningún valor en este campo (location vacío).

Distribución geográfica
Utilizando la información del campo location, se agruparon los usuarios según el lugar al que declaran pertenecer. En primer lugar, se identificaron ubicaciones en las tres metrópolis del país: Santiago, Valparaíso y Concepción. Para ello se agruparon todas las comunas que conforman cada metrópoli, incluyendo seudónimos para las ciudades. Por otro lado, se realizó una agrupación simple, por ciudades, buscando la existencia de cierta cadena dentro del campo location. Con esta información se construyeron los siguientes dos listados:
metrópolis
  # usuarios
gran santiago 15217
gran valparaíso 2442
gran concepción 1619
   
ciudades
ciudad {cadena buscada} # usuarios
santiago {santiag} 14249
concepcion {conce} 1453
viña del mar {vina} 1248
valparaiso {valp} 970
temuco {temuco} 572
antofagasta {antofa} 564
valdivia {valdivia} 450
serena {serena} 373
rancagua {rancagua} 275


Nombres de usuario (screen_name)
Los nombres de usuario en cada cuenta es el identificador único utilizado en el sistema. Haciendo un sencillo análisis sobre los nombres utilizados, se puede graficar la distribución de frecuencias del largo de los nombres de usuario.


Nombres
Además del nombre de usuario, cada cuenta tiene registrado el nombre real del autor. En base a esta información, es posible encontrar aquellos nombres más utilizados en la red de Chile.
 
nombres de hombres
  # usuarios
Rodrigo 1595
Juan 1510
Felipe 1464
Cristian 1256
Pablo 1207
Carlos 1121
Francisco 1108
Sebastián 1068
 
nombres de mujeres
  # usuarios
María 1087
Carolina 998
Daniela 968
Camila 769
Claudia 720
Francisca 669
Andrea 558
Constanza 545


Distribución de dominios (url)

Analizando la información contenida en el campo url, se realizó una clasificación de los sitios-web/blogs de cada uno, basados en el dominio. Los mayores grupos encontrados fueron los sitios bajo el dominio .cl, y los blogs creados en blogspot. Los otros dominios relevantes son otras redes sociales: flickr, fotolog, myspace y facebook. Los porcentajes están calculados sobre el total de usuarios que registran url: 20228.


Clasificación de usuarios
Utilizando la información de la bio (la descripción), se realizó una segmentación de los usuarios, basado en la actividad o profesión que declaran. Esto se realizó buscando cadenas genéricas (periodis..., ingenier..., diseñ...). Notar que cada conjunto no es disjunto, ya que alguien podría declarar dos profesiones y aparecería dos veces en el conteo.
 
númerod de usuarios según actividad
  # usuarios
periodista 1118
ingeniero 990
diseñador 899
   
informatico 361
fotografo 281
psicologo 243
ing. comericial 204
arquitecto 197
medico 189
abogado 114


Categorización de usuarios
Mediante una clasificación realizada a mano, fue posible catalogar a los usuarios más relevantes en un conjunto de categorías: políticos, personajes, marcas, instituciones, grupos, etc. El resultado de esto es la posibilidad de rankear a los usuarios en cada categoría, lo que permite tener un mejor acercamiento a las características de la red y sus usuarios. A continuación se presentan los rankings de usuarios para políticos, personajes de otros medios (tv, radio), y de marcas, basados en el número de followers de cada uno.
 
políticos
  # usuarios
sebastianpinera / Sebastian Piñera19291
marco2010 / MarcoEnriquezOminami17595
JosePinera / José Piñera3632
sebastianbowen / Sebastián Bowen3567
felipeharboe / Felipe Harboe B2839
nelsonavila / Nelson Ávila2643
lagosweber / Ricardo Lagos Weber2579
Orrego / Claudio Orrego2145
 
personajes de otros medios
  # usuarios
SoledadOnetto / Soledad Onetto G.15050
copano / Nicolas Copano14434
IvanValenzuela / Ivan Valenzuela11822
matiasdelrio / Matias del Rio10464
tvn_mauricio / Mauricio Bustamante6970
carolaurrejola / Carolina Urrejola5764
patricionavia / patricionavia5744
DMatamala Daniel Matamala5234
 
marcas
  # usuarios
PepsiMusicChile / Pepsi Music Chile3129
LGxat / Comunidad GT 3602750
paloaltowine / Palo Alto2039
movistarchile / Movistar Chile2014
FalabellaOnline / Falabella.com1949
fronterawine / Frontera Wine1645
naturawine / Natura Wine1474
cinemarkchile / Cinemark Chile1462


Estructura

La red de usuarios está construida sobre la relación de seguir que se da entre los usuarios. En base a esto, se pueden realizar algunos análisis que permiten agrupar y rankear a los usuarios en base al número de friends/followers de cada uno, asi como analizar las cifras del conjunto completo, buscando relaciones que revelen algunos comportamientos del grupo.


Friends
Cada usuario decide a que otros usuarios seguir, suscribiéndose a sus actualizaciones. De esta manera, cada usuario construye su conjunto de friends (followings). En base a esto, es posible mostrar un ranking de los usuarios con mayor número de friends.
 
usuarios con mayor número de friends
  # friends
HermanoGeoff / Geoffrey W. Thompson 21180
marco2010 / MarcoEnriquezOminami 19101
sebastianpinera / Sebastian Piñera 18085
tele13online / Tele 13 14510
copano / Nicolas Copano 12422
FaseJP / Joseph Aguilera 4851
fayerwayer / FayerWayer 4314


Si se toman todos los usuarios, se ordenan por su número de friends, y se grafican, se obtiene una distribucion que sigue una ley de potencia. Esto significa que son muy pocos los usuarios que tienen una gran cantidad de friends, y son muchos los que tienen pocos friends. Al graficar esto se obtiene la típica gráfica de la cola larga (long-tail). Sin embargo, esta gráfica no permite apreciar mucha información. En este caso, lo que se utiliza es una representación sobre un gráfico de escalas logarítmicas. El resultado se aprecia en la siguiente figura:


Followers
La otra cifra relevante, es el número de followers: la cantidad de usuarios que siguen los tweets de alguien. Este puede ser tomado como un indicador de "popularidad", ya que indica a cuantos miembros de la red llegan los updates realizados por un usuario. El siguiente es el ranking de los usuarios más seguidos en Chile.
 
usuarios con mayor número de followers
  # followers
HermanoGeoff / Geoffrey W. Thompson 20706
sebastianpinera / Sebastian Piñera 19291
marco2010 / MarcoEnriquezOminami 17595
SoledadOnetto / Soledad Onetto G. 15050
tele13online / Tele 13 14844
copano / Nicolas Copano 14434
IvanValenzuela / Ivan Valenzuela 11822
matiasdelrio / Matias del Rio 10464

Al representar estas cifras sobre el gráfico log-log, se obtiene la siguiente representación:

Friends/followers
Si se toma la cantidad de friends y de followers para cada usuario en la red, y se representan como un punto en un gráfico de escalas logarítmicas, se obtiene una buena forma de visualizar a los usuarios de twitter. Cada usuario está representado por un punto del gráfico, y las zonas más densamente marcadas representan la tendencia del grupo. En la parte alta del gráfico debieran encontrarse los usuarios que tienen muchos followers y pocos friends (el caso de personajes de televisión), mientras que en la parte de arriba, a la derecha, se encuentran los usuarios con alto número de friends y de followers (el caso de políticos). Finalmente, el hecho de que los puntos estén concentrados en la mitad superior del gráfico (diviéndolo por la diagonal principal), muestra el hecho de que en general los usuarios tiene más followers que friends.


Al revisar el gráfico anterior, agrupando los usuarios según su año de ingreso a twitter, se pueden observar algunas características interesantes.
Por un lado, se aprecia el hecho de que los usuarios más antiguos suelen tener un mayor número de followers que de friends, y a medida que se avanza en el tiempo, esta cifra tiende a equilibrarse (incluso la tendencia muestra que en los últimos usuarios, se tienen un poco más de friends que de followers). Esto puede deberse a que los nuevos usuarios suelen tomar la estrategia de agregar nuevos friends, esperando ser seguidos de vuelta, con lo se explicarían los casos con mayor número de friends que de followers. Por otro lado, el cambio de pendiente entre los gráficos revela otra situación: en los usuarios antiguos, cuando se tienen pocos friends se tiene en general una mayor cantidad de followers, esto podría deberse a que con el tiempo se acumulan followers (incluídos usuarios-spam), mientras que en los nuevos usuarios esto no sucede, hasta que el usuario ya tiene un número crítico de friends.


Usuarios extranjeros
Un resultado interesante se puede obtener si se analiza el conjunto de friends y followers de los chilenos, sólo tomando en cuenta a los usuarios extranjeros (miembros del conjunto de f/f de los chilenos). A continuación se presentan los rankings de los usuarios no-chilenos con mayor número de friends y followers, dentro de la red de Chile.
 
usuarios extranjeros más seguidos desde chile
  #followers-chi
BarackObama / Barack Obama / Washington, DC 4417
cnnbrk / CNN Breaking News / Everywhere 4198
aplusk / ashton kutcher / here 4089
britneyspears / Britney Spears / Los Angeles, CA3707
coldplay / Coldplay / London 3293
TheEllenShow / Ellen DeGeneres / California 2907
twitter / Twitter / San Francisco, CA 2769
nytimes / The New York Times / New York, NY 2758

 
usuarios extranjeros que más siguen a chilenos
  #friends-chi
puntohispano / Punto Hispano / México. 889
redbloguerosph / redbloguerosph / México 850
joralma / joralma / Cali - Colombia 689
jppod / Jppod.net Música / Venezuela 638
BarackObama / Barack Obama / Washington DC 597
el_pais / ELPAIS.com / Madrid 562
BuenosAiresCMS / Social_Media_Club_BA / Argentina 542
viabinaria / viabinaria / Barcelona 506



Actividad

Si bien el estudio, en su primera etapa, no recurre al contenido generado por los usuarios (los tweets), si se pueden realizar algunas estadísticas en base a las cifras de updates realizados por cada usuario, lo que permite realizar un análisis de comportamiento en función de dichas cifras.

Cuentas "activas"
Un primer resultado de interés es conocer la cantidad de cuentas o usuarios que realmente utilizan el sistema. Es aquí donde aparece el concepto de "cuenta activa". Sin embargo, no es clara la definición de este término. Un usuario activo podría ser aquel que ha enviado tweets en los últimos 7 días, o en los últimos 30 días, o que cumple un mínimo de tweets/día. El siguiente gráfico muestra la cantidad de usuarios que han enviado un tweet en los últimos 7, 30 y 365 días.

Número de updates
El número de updates (tweets) indica la cantidad de veces que el usuario ha actualizado su perfil de twitter. Este es el indicador más simple de la actividad de los usuarios. El siguiente es el ranking de los usuarios con mayor número de updates.
 
usuarios con mayor número de tweets
  # updates
Cooperativa / Cooperativa.cl 55498
infozeus / Juan Yáñez 55013
chileteinforma / Chile te informa 54082
latercera / La Tercera 43923
Gentz / # Gentzane 43047
twitter_emol / Noticias Emol 41373
emol / El Mercurio Online 41308
actiondatsun / action datsun 41308

Y la representación gráfica de estas cifras, en un gráfico logarítmico.


Una cifra interesante se obtiene del cociente entre el número de días en twitter (la antiguedad), y el número de updates. Esto da la tasa de updates por día para cada usuario, lo cual representa un excelente indicador de la actividad.
 
usuarios con mayor frecuencia de tweets/día
  # tweets/día
horachile / Hora Oficial 275.94
pilarsotomayor / pilar sotomayor 219.85
chileteinforma / Chile te informa 212.92
horaoficial / Hora Exacta 174.73
chile_jobs / Randy MarshPablo 160.72
Croquevielle / Pablo Croquevielle 118.33
twiterillo / José González 118.24
Afpa1 / Andrés Poblete 114.98

Favoritos
Se dice que un tweet es un "favorito" de un usuario, cuando éste lo marca como tal, y lo guarda en su conjunto personal de tweets destacados. El estudio de favoritos permite determinar cierto grado de calidad del contenido generado por los usuarios. Para estudiar esto, se recuperó el conjunto de favoritos de cada uno de los usuarios chilenos (excepto de aquellos con cuenta protegida), permitiendo realizar un análisis del total de favoritos dentro de la red de Chile.


El primer ranking interesante, es el de los usuarios "más favoriteados", es decir, aquellos usuarios que registran el mayor número de tweets seleccionados por otros usuarios.
 
usuarios que registran mayor número tweets favoriteados
  # favoritos
Francotirador / Christian Leal Reyes 3931
stark / JI Stark 3592
micronauta / Ignacio Rodríguez 2188
psyclaudita / Claudia Torres 1949
Huasonic / Cristian Labarca 1893
d0nfil0fi0 / Axel Christiansen Z. 1670
MLKtoSCL / MLKtoSCL 1565
Sauce / Sauce 1385

Por otro lado, si se agrupan los tweets favoriteados, por usuario, se obtiene el ranking de los usuarios que han sido favoriteados por el mayor número de personas distintas.
 
usuarios más favoriteados por usuarios distintos
  # usuarios
copano / Nicolas Copano 446
marco2010 / MarcoEnriquezOminami 439
tele13online / Tele 13 415
Huasonic / Cristian Labarca 332
sebastianpinera / Sebastian Piñera 308
SoledadOnetto / Soledad Onetto 287
stark / JI Stark 277
Francotirador / Christian Leal Reyes 271


Conclusiones


Habiendo analizado y caracterizado la red de twitter de Chile, es posible comprender mejor su composición y comportamiento. Con respecto a los datos, es necesario aclarar que las cifras del estudio corresponden al estado de la red en un día específico (25/09/2009), por lo que pueden haber diferencias con el presente, en cuanto a usuarios que ya no existen, o las cifras de friends o followers de cada uno. . Además, hay que tener siempre presente que el conjunto utilizado como base de este estudio, es una aproximación a la cifra real de chilenos en twitter: debieran existir algunos usuarios del conjunto que no son chilenos (falsos positivos) y usuarios chilenos que no fueron recuperados (falsos negativos). Sin embargo, esta muestra se aproxima de gran manera a la cifra total de usuarios en el país.

En los últimos meses se ha visto el explosivo crecimiento de twitter en Chile. De tener menos de 10mil usuarios, hasta el año pasado, a cerca de 100mil en la actualidad. Esta explosión de usuarios se debe fundamentalmente a la exposición de twitter en medios de comunicación masivos. La televisión en primer lugar, cuando un canal de televisión comenzó a utilizar twitter en sus noticiarios, como una forma de recoger opiniones de sus televidentes. Posteriormente, twitter comenzaría a generar más ruido, cuando personajes de la política comenzaron a utilizar la red como un nuevo canal de comunicación, lo cual tuvo repercusión en otros medios (televisión, diarios). Esto acercó la red a nuevos segmentos de la población.

Con respecto a la red de usuarios en twitter, en general se da un fenómeno que no se observa en otras redes sociales: existe una especie de "gran red" que, de una u otra forma, abarca a la gran mayoría de los usuarios. En esta gran red existe un conjunto de usuarios "líderes", que serían aquellos que son seguidos por muchos usuarios. Esto es clave en la forma en que funciona twitter: dada esa centralidad, es posible que se den verdaderas conversaciones en tiempo real, entre personas que eventualmente no se conocen, pero comparten el interés de comentar u opinar respecto a algún tema.

Respecto a la distribución de las cifras del estudio, la mayoría no debiera sorprender, ya que es conocido que las redes sociales suelen comportarse siguiendo la forma de una long-tail. Esto se cumple para el número de tweets, para los friends y followers, para el número de cuentas activas, etc. En este último caso, es evidente que del total de cuentas inscritas, una gran cantidad de éstas debieran ser cuentas inactivas o tener muy pocos contactos, mientras que una pequeña parte (el 10 o 20% del total de usuarios) es la responsable de generar la mayor parte del contenido.

Otro resultado que se desprende de las cifras, es el hecho de que Chile representa una porción muy pequeña del total de usuarios en el mundo, cerca del 0,2%. Y considerando la red de contactos de chilenos, se podría afirmar que más del 98% de twitter no conoce la existencia de Chile en la red.

Entre los nuevos usos de twitter, aparece su uso como forma de difusión de marcas comerciales o instituciones. En la actualidad son pocas las marcas que han aprovechado efectivamente esta red social, si bien llama la atención el uso de twitter por parte de marcas de vinos, que han establecido una red de contactos para promover sus productos, en una forma de promoción enfocada al público extranjero. Otras marcas nacionales han conseguido entrar tímidamente a la red, a través de promociones o concursos. Pero es evidente que hay mucho por hacer en este ámbito.

Por su parte, los usuarios han encontrado en twitter un canal de expresión, permitiendo una masificación del fenómeno iniciado con los blogs, y que hoy en día se manifiesta en la llamada Web 2.0, donde los usuarios son los grandes responsables del contenido en la Web. En este caso, generando opinión, compartiendo contenidos, interactuando con los demás. De esta forma, twitter contribuye al concepto de globalización, iniciado con los primeros medios de comunicación, y que en la actualidad toma forma a través de Internet.


Bibliografia / Referencias