EstatÃsticas da web: o que podemos concluir analisando 6.000 posts do Rec6?
|
Efetividade.net é a sua fonte de informações originais e atualizadas sobre produtividade pessoal,
efetividade, lifehacking, GTD e truques espertos para o seu dia-a-dia. Leia também:
|
Você sabia que a maioria das entradas que chegam a ser destaque no Rec6 completa em até 7 horas o percurso entre a sua postagem por um usuário e a primeira aparição na capa do site, e apenas 8% delas chegam à capa em menos de 60 minutos?
A demografia dos sites de comunidades é um campo de estudo que permite chegar a uma série de conclusões sobre o público que lá se reúne, seus interesses, comportamentos e preferências. Ao longo dos últimos 3 meses venho coletando diariamente dados estatÃsticos sobre as notÃcias publicadas na área de Tecnologia do Rec6, um dos mais populares agregadores de notÃcias nacionais no estilo Digg.
Minha intenção é usar esta informações para outras finalidades, não relacionadas diretamente ao Rec6. Ocorre que o Rec6 é um ponto de reunião de indivÃduos com vários perfis que interessam a outras atividades minhas, e estudar este tipo de informação ajuda a agregar valor a estas atividades, com informações, conclusões e insights que são difÃceis de obter através de pesquisas estruturadas comuns, porque o que as pessoas publicam (e, especialmente, o que votam) em sites de comunidade tem um grau de espontaneidade que nenhuma pesquisa consegue reproduzir. Ao mesmo tempo, analisar estes dados tem que levar em conta que as margens de erro são imponderáveis, e que as conclusões acabam sendo muito mais subjetivas do que as oriundas de pesquisas tradicionais.
As análises que farei para meu próprio uso não são de interesse geral, e provavelmente não chegarão a ser publicadas aqui. Mas enquanto eu populava o banco de dados com mais de 6000 posts coletados no Rec6 ao longo destes 3 meses, percebi que há uma série de dados ali que podem ser do interesse geral, porque são indicadores de sucesso ou destaque de posts.
É bom lembrar que o sucesso de um post no Rec6 não é um indicativo de qualidade, mas apenas de popularidade. E que ele também não é condicionado apenas pelo conteúdo ou tema dos posts, ou mesmo pela sorte: durante o horário comercial, observa-se sistematicamente que há perÃodos em que bastam 5 votos (em média) para um post chegar à capa, enquanto há outros em que um post com menos de 9 votos não chegará a obter destaque.

Não sou fominha, e nem acredito que guardar este tipo de conclusão só para mim me daria alguma vantagem – até porque mais gente deve intuir ou mesmo ter apurado os mesmos dados. Os dados agregados não mencionam individualmente nenhum post ou usuário, assim não há preocupações com privacidade ou outras questões individuais. Assim, resolvi compartilhar com vocês estes dados de interesse geral, e imagino até que a divulgação deles não irá alterar em muito o perfil das estatÃsticas mencionadas, porque tenho certeza absoluta que o número de pessoas que tem o interesse e mesmo a habilidade de usar estes dados para alavancar a divulgação de seu material é relativamente pequeno – e provavelmente são pessoas que têm material de qualidade para divulgar, portanto todo mundo sai ganhando.
Por falar em relativamente pequeno mas com qualidade, vale lembrar que o potencial de geração de tráfego do Rec6 ainda não é muito grande. Mas ele faz algo muito bem: dar projeção e notoriedade a blogs, dentro de um pequeno universo composto por uma série de formadores de opinião em seus próprios nichos, no melhor estilo long tail. A lista dos sites, temas e até palavras-chave que mais aparecem nos posts publicados e destacados por lá contém informações bastante interessantes sobre quem e o que faz sucesso entre este público bastante especÃfico, e selecionado.
Usando as estatÃsticas do Rec6 para escolher o horário certo de postar
Observações preliminares: As informações abaixo correspondem a uma amostra composta por pouco mais de 6000 artigos, publicados no Rec6 entre o final de fevereiro e o final de maio de 2007. Os dados foram processados de forma automatizada, e todas as análises apresentadas consideram a amostra completa, sem quebras por dias da semana, assuntos, site de origem ou outras. O grau em que estes dados podem ser usados para analisar outros fenômenos on-line não é determinado.
Como já adiantei na conclusão do artigo, a maioria das notÃcias que chega à capa do Rec6 faz o seu caminho (entre a inserção por um usuário e a chegada à capa) em 7h ou menos.
Algumas são bem mais velozes que as outras, entretanto. Entre as pouco mais de 1000 notÃcias que chegaram à capa entre as da amostra pesquisada, 8% das notÃcias chegaram à capa com 60 minutos (ou menos) de idade. Os sites campeões em notÃcias com estas caracterÃsticas são o TNow e o IDG Now, e as palavras mais freqüentes nos tÃtulos destas notÃcias são: blogs, Google, Internet, Linux, mundo, online, Rec6, sites, vÃdeos, Web, Windows, Yahoo e Youtube.
Aparentemente há 2 perÃodos privilegiados no dia, totalizando apenas 5h, para quem quer se aproveitar da demografia do Rec6 e aumentar suas chances de obter algum destaque adicional. Entre aquelas notÃcias que chegaram de forma acelerada ao destaque, 32% foram inseridas no sistemas entre 13 e 16h, e outras 18% entraram entre as 22h e a meia-noite. A outra metade das notÃcias se espalhou entre os demais perÃodos do dia.
Mas quem é menos impetuoso sabe que não há necessidade de apostar na velocidade, e que vale mais a pena procurar os horários em que há mais freqüência de as postagens chegarem a alcançar a capa, mesmo que demore um pouco mais. O perÃodo das 13 à s 16h também é a aposta mais segura neste caso, pois 22% do total das notÃcias que chegam até a capa foram inseridas nesta faixa de 3h no inÃcio da tarde. Logo em seguida vem a curta faixa entre as 11h e o meio-dia (mas cuidado: posts entre as 12 e as 13h não têm grande sucesso, historicamente), e depois dela segue o perÃodo entre 16 e 19h.
Comparando os 2 parágrafos acima, uma conclusão interessante (e óbvia, uma vez exposta) é que os posts inseridos no perÃodo noturno tendem a tomar um de 2 caminhos: ou chegam à capa rapidamente (em menos de 1h), ou não chegarão nunca mais – porque a virada da noite faz com que eles sejam rapidamente ultrapassados pelas levas de posts matinais.
Outra curiosidade relacionada aos horarios é que no perÃodo matinal uma notÃcia precisa de 8,6 votos (em média) para chegar à capa, enquanto à tarde bastam 6,5 votos (também em média), possivelmente devido ao desequilÃbrio numérico entre as pessoas que votam de manhã e as que votam de tarde, e entre os posts inseridos em cada um destes perÃodos.
Como curiosidade, a notÃcia que levou mais tempo para chegar à capa completou o seu percurso em um total de 40h, e falava sobre o Mac OS X Tiger. Ela está entre as 50 (cerca de 4,8% do total geral de notÃcias que chegaram à capa) que conseguiram chegar à página inicial mesmo levando mais do que 24h para isto.
E as conclusões?
As análises acima são básicas e genéricas por natureza, e eu ainda tenho milhares de registros para interpretar, correlacionar, extrapolar e interpolar de maneiras variadas.
Assim, deixo a cada um a possibilidade de interpretar estes dados como desejarem e puderem, e mesmo para compartilhar suas conclusões aqui nos comentários da notÃcia, ou em seus próprios sites e blogs.
Vale o comentário de que no caso de o perfil de uso do Rec6 mudar e se aproximar mais da popularidade do Digg, onde o número de usuários que vota excede de forma gigantesca o número daqueles que publicam material, é provável que as estatÃsticas a partir dos dados coletados no perÃodo atual tornem-se rapidamente ultrapassadas – e certamente os novos dados que poderão ser coletados identificarão um público bastante diferente do atual.
Ao Rec6 fica a sugestão de no futuro contribuir estatÃsticas (no estilo Zeitgeist) ao público que lhe oferece o conteúdo que ajuda a manter o site girando ;-) Seria uma adição bem-vinda e que certamente agregaria valor e diferenciação ao site, que justamente por se destacar dos demais Digg-like brasileiros pode se beneficiar bastante deste tipo de inovação.









Daniel Anderson Tiecher comentou:
em May 28 2007 @
O tráfego gerado pelo Rec6 pode não chegar nem perto do Digg ou do Slashdot mas todo novo visitante é válido, não concorda? Fazem três semanas que eu comecei a escrever no meu blog e nesse meio tempo tive duas notÃcias na capa do site. Ambas as notÃcias tratam de um dos assuntos mais postados (Linux). Contudo, não submeti elas ao site nos horários indicados. Vou adicionar a próxima notÃcia falando desses assuntos mais votados no horário que foi indicado no artigo e ver o que acontece.
Se desejar, posso lhe informar quais foram os resultados.
A propósito, excelente artigo. Mereceu aparecer na capa do Rec6 tão rápido.
Pedro comentou:
em May 28 2007 @
Daniel: “Vou adicionar a próxima notÃcia falando desses assuntos mais votados no horário que foi indicado no artigo e ver o que acontece.”
Vou adicionar.. Spammer de Rec6.. Só coloca noticias do próprio site.. Ele e esse Tnow mencionado no artigo..
Cab comentou:
em May 28 2007 @
Bem legal, deve ter dado trabalho coletar essas informações, porém não consegui chegar a uma conclusão, já já leio de novo com mais calma e acredito que não vou chegar a nenhuma conclusão mesmo assim, sou um daqueles usuários que normalmente apenas vota.
Sobre o comentário do Pedro, não vejo mal algum uma pessoa colocar uma notÃcia de sua própria página, afinal, ele ainda vai precisar dos votos dos outros usuários, não vai? No meu ponto de vista ele só tá facilitando o processo.
Max Castro comentou:
em May 28 2007 @
Gostei da tua pesquisa. Ponto positivo; mostra claramente que o Digg brasileiro está longe de aparecer por pura e simples falta de observação de mercado. O público que frequenta o Rec6, Linkk, Eu Curti, nunca representará o volume necessário para o surgimento do mesmo. Também achei interessante os horários de maior probabilidade de capa e coisas do tipo.
Informação importante; o autor sabe que o Digg é, ou já foi muito manipulado? Que ocorriam censuras com relação a posts contra o próprio Digg? Sabe que houve uma retaliação muito forte por parte de usuários sobre quem eram os “encapados” e quem não consegue nada? São informações importantes sobre o algorimo do Digg que tu deve levar em consideração. Muitos usuários do Digg (normalmente os que mais “diggam”) possuem classificação de credibilidade com relação ao karma.
Agora a questão que eu levanto, seria o Rec6 também manipulado? Existe algum tipo de censura?
Eu tenho muitas questões com relação a este assunto e gostaria de discutir mais sobre o mesmo.
Aguardo algum contato! Abraço!!
Bruno Godoi comentou:
em May 28 2007 @
Ótimo artigo. Tive algumas noticias na página do Rec6, e já havia percebido que leva-se pouco tempo da publicação até a página inicial, e que em momentos de picos de publicação fica muito dificil ter uma noticia publicada se não for do interesse de muitos.
Parabéns pelo estudo.
Pedro comentou:
em May 29 2007 @
Cab, uma noticia não seria problema. Mas esses caras só alimentam o Rec6 com os próprios posts. Ao absurdo de uma página toda só ter noticias de um deles, e todas enviadas por ele mesmo.
Daniel Anderson Tiecher comentou:
em May 29 2007 @
@Pedro
Como eu já havia falado, tenho o blog há pouco tempo. Meu número de visitantes únicos diariamente não passa da conta dos 100. A porcentagem de pessoas que envia uma notÃcia de outro site ao Rec6 é Ãnfima, tão Ãnfima que não devo ter uma notÃcia submetida ao Rec6 por um usuário do meu blog tão cedo. Então, qual o problema de eu querer promover meu trabalho? Acho que nenhum blogger gosta de escrever para nenhum leitor poder ler…
Como o Cab falou, se a notÃcia não for votada, ela não aparecerá na capa. Se minhas notÃcias aparecem na capa é porque elas têm algum valor aos usuários do Rec6. NotÃcias essas que se eu não tivesse submetido, dificilmente apareceriam por lá, não concorda?
Peço desculpas ao Augusto por usar sua seção de comentários desta maneira.
Pedro comentou:
em May 29 2007 @
Daniel, sites colaborativos de envio de noticias não são para auto divulgação. Para isso existe o blogblogs.com.br.
Se noticias submetidas dessa forma tivessem tanto valor, a matéria “Enterre no Rec 6″ não teria recebido 100 votos. Mostrando o descontentamento de quem usa o serviço. Se duvida é só procurar na categoria Tecnologia.
Esses envios em forma de Spam não agradam. Não adianta procurar justificativa.
Daniel Anderson Tiecher comentou:
em May 29 2007 @
Não estava me justificando, apenas respondendo ao seu comentário. Será que não tenho esse direito?
O valor de uma matéria é bastante pessoal, tanto que, contestar o valor dos votos dados por uma comunidade num site colaborativo é simplesmente loucura. Todos pensam de maneira diferente, se você pensa que uma determinada notÃcia não é boa o suficiente para a capa do Rec6, esse seu pensamento não se tornará uma verdade absoluta. Talvez por isso a notÃcia supracitada tenha recebido mais de 100 votos. Essa notÃcia provavelmente irá melhorar o Rec6. Não graças a maneira com que foi escrita, mas pelo efeito que ela obteve. Não acha isso válido?
Procuro sempre analisar as crÃticas ao meu trabalho de maneira construtiva. Portanto, não pense que não refleti sobre o seu comentário. Refleti tanto que irei (quando sobrar um tempinho maior, claro) implementar botões no meu blog para que os próprios usuários adicionem meus posts. A partir de hoje enviarei apenas artigos que eu realmente achar relevantes.
Só acho que sua visão de sites colaborativos é um tanto distorcida. Mesmo dentro de uma comunidade voltada a um nicho, como é o caso do Rec6, existem pessoas com opiniões diferentes. Tentar in de encontro a este fato e irá apenas te causar dores de cabeça.
Minha opinião. =)
Jackson comentou:
em May 3 2009 @
Concordo plenamente contigo Daniel, não vejo problema em divulgar seu material, o que vale é se as pessoas irão aprová-lo.