Mais novidades sobre Feeds

Quando publiquei o post sobre os feeds, começaram a sair notícias sobre a disponibilização de feeds para pesquisas (web search results feeds) pela mão do Google. Além disso, descobri ferramentas que podem ser úteis, quando o serviço que queremos subscrever não nos permite a personalização dos feeds.
Pelas duas razões apontadas, é com natural teimosia que volto ao tema, até que os feeds são um formato universal que está a ser utilizado em múltiplas situações. Veja-se que começou por sindicar conteúdo de blogs, depois de notícias da actualidade, e por fim, resultados de pesquisa, em formato texto, áudio, etc.

Cenários possíveis

Vimos anteriormente que os feeds são um modo cómodo para a actualização e acompanhamento de um tema nos media e blogs.
Também tínhamos visto que há serviços de feeds mais flexíveis que outros. Uma passagem rápida por orgãos de comunicação electrónicos ou de versão electrónica portugueses revela que há ainda muitos jornais/ revistas que não usam esta tecnologia. Contudo, de entre aqueles que oferecem esse serviço, encontramos dois cenários:

  1. RSS sem qualquer filtro (exemplos dos jornais Expresso e Diário de Notícias). Todas as notícias publicadas são enviadas para o leitor de feeds.
  2. RSS por categoria (exemplos do El País, do Jornal de Negócios, e mais recentemente do Público, que tem os feeds por categoria em fase de experiência). Neste caso, o canal de feeds 57 do Público envia para a pessoa que subscreve o serviço apenas as notícias publicadas na área Economia.

Mas disto já eu tinha falado. O que desejo propor agora é uma terceira via ou cenário.

3. RSS por palavra/ expressão personalizada

Existem ferramentas que permitem aplicar filtros aos feeds genéricos ou por categoria. É a diferença entre receber todas as notícias publicadas, todas as notícias publicadas na secção Economia ou todas as notícias sobre a taxa Euribor.

Na construção do filtro de feeds, que nos serve de exemplo (ver imagem abaixo), foi utilizado o programa Feed Sifter, como se pode confirmar através da parte inicial do URL. O critério de filtro está na parte final. Em termos muito grosseiros, pode dizer-se que o programa interroga a lista de feeds disponível e selecciona apenas as entradas que cumpram os requisitos da pesquisa.

Segue uma breve apresentação, passo a passo sobre o processo de aplicação de filtro que foi exportado para a página web personalizada do Netvibes.

Programas que aplicam filtros em feeds

No blog ReadWriteWeb encontrei uma lista de programas. Alguns requerem registo e instalação, outros funcionam online. Experimentei dois deles por ser mais simples a utilização e o teste – o já referido Feed Sifter e o FilterMy RSS. Além destes, existem o Feed Rinse, o Blastfeed, o ZapTXT e o Pipes. Este último, propriedade do Yahoo, parece bastante potente e com funcionalidades bem interessantes.

O Feed Sifter é muito básico:

  • Só recupera a partir dos títulos. Tudo o que se encontre no corpo da notícia, não selecciona.
  • Apresenta só as entradas de feeds que comecem pela palavra pedida. Aplicando o filtro Santana, o título “Manuela, pressionada, retirou Santana da agenda” não é recuperado, mas “Santana e crise levam à ruptura Manuela/Marcelo” já é.
  • Não recupera palavras com acentos. Trata-se de uma ferramenta optimizada para a língua inglesa e com muitas limitações na construção do filtro.
  • Permite procurar vários temas, devendo cada um ocupar uma linha. Caso se trate de um tema com mais que uma palavra, devem ser escritas as palavras separadas por vírgulas: teixeira,dos,santos

Já o FilterMy RSS oferece mais opções:

  • Procura no título, na descrição/ resumo e na categoria, podendo escolher-se mais que um critério.
  • Permite excluir conteúdos.
  • Dá a possibilidade de ver em formato XML o rss original e o rss alterado.

Filtros personalizados em motores de pesquisa: histórico e características

Os próprios motores de pesquisa – Yahoo, Live Search, Google, dão a possibilidade de filtrar os resultados de pesquisa por RSS condizentes com as indicações dos utilizadores. O tema foi reavivado pela notícia do lançamento para breve deste serviço no Google. Sendo o motor mais popular e mais utilizado, não se compreende essa falha. O título “Finally! Google to Offer RSS Feeds for Web Search Results” é disso prova.
Na prática, isto significa que posso ter uma expressão de pesquisa personalizada e receber os seus resultados sempre que se verificam as condições, sem ter que repetidamente lançar essa pesquisa. Trata-se de uma monitorização permanente e com muito valor para quem vigia a sua influência na Rede, seja empresa ou investigador, ou para quem necessita de acompanhar de perto um tema, uma personalidade.

Histórico dos feeds na pesquisa

Foi a Microsoft que tomou a dianteira nesta matéria, quando em Janeiro de 2005, avançou com uma versão beta. Seguiu-se o Yahoo em Maio do mesmo ano. Este mês, Google informou que vai passar a oferecer este serviço, numa reacção tardia aos seus mais directos competidores.

Aplicação
O processo de construção de um endereço de feeds em resultados de pesquisa obriga a que se faça a primeira vez a pesquisa. Nos dias e semanas seguintes, o mecanismo de RSS encarregar-se-á de nos enviar tudo o que surgir nas notícias ou WWW sobre o tema acerca do qual lançámos a pesquisa.

No Live Search, são necessários três passos muito simples. Vou exemplificar com uma pesquisa a Lobo Antunes.
Passo 1 – Pesquisar na web em geral (http://search.live.com) ou na área das news (http://search.live.com/news), colocando na caixa de pesquisa a expressão que desejamos.
Passo 2 – Quando se lança a pesquisa, além de se obter a lista de resultados, pode-se ver o URL dessa pesquisa na caixa do navegador. Devemos acrescentar a essa direcção o seguinte texto: &format=rss
Exemplo para web: http://search.live.com/results.aspx?q=lobo+antunes&go=&format=rss
Exemplo para news: http://search.live.com/news/results.aspx?q=lobo+antunes&go=&format=rss
Passo 3 – Depois, basta copiar esse endereço de feeds, completo e já alterado, para o nosso leitor de feeds

Com o Yahoo é parecido. Deixo o exemplo para a área das notícias: http://news.search.yahoo.com/news/rss?p=lobo+antunes

Características do serviço de feeds de resultados de pesquisa
Duas questões que se colocam a respeito dos feeds aplicados a resultados de pesquisa são o canal de difusão e o uso ou não do formato aberto.
Faz todo o sentido enviar as actualizações de uma pesquisa personalizada via leitor/ agregador de feeds e não via email. Aliás, já há reacções quentes nos utilizadores Google que, depois de terem de esperar tanto tempo pelo serviço, o vêem agora associado ao Google Alerts, que trabalha com base na notificação por email. Neste ponto, os concorrentes do Google distanciam-se e permitem a dupla via.
Quanto ao uso de formatos abertos, nem a Microsoft nem o Yahoo estão a cumprir as normas OpenSearch. Trata-se de uma norma de 2005 da empresa A9, subsidiária da Amazon, que procura que os resultados de pesquisa de um motor possam ser reutilizados (agregados, partilhados) por múltiplas aplicações e serviços através da sindicação dos conteúdos.

RSS de páginas no Youtube

Filtros de RSS para o Youtube

Quem conhece bem o sítio do Youtube, já se deu conta de que existe sindicação de conteúdos apenas para as páginas do vídeos mais comentados, mais vistos, os destaques,etc. Porém, Artem Russakovskii, engenheiro de software que trabalha no motor Blinkx, desenvolveu uns feeds que podemos usar com muito proveito, filtrando o que nos interessa do que vai entrando no Youtube.

Deixa no seu site três sugestões de personalização de filtros para o Youtube. O sublinhado nos URL é meu e serve para indicar o que varia na expressão. Para experimentar, basta copiar cada um dos endereços e substituir a palavra ilustrativa pela que desejarmos. Funciona muito bem. Experimentem!

  1. Filtrar por tag. Ex. http://www.youtube.com/rss/tag/elearning.rss
  2. Filtrar por criador (user). Ex. http://www.youtube.com/rss/user/youtube/videos.rss
  3. Filtrar por palavra que se encontre em qualquer parte do registo. Ex. http://www.youtube.com/rss/search/wall%20street.rss (2 palavras) ou, por exemplo, http://www.youtube.com/rss/search/iphone.rss (1 palavra)

A imagem apresenta os resultados da pesquisa por RSS que poderemos copiar no nosso serviço de feeds, recebendo de futuro os vídeos que contenham o termo “iphone” na sua descrição de feeds.

Anúncios

Feeds, um mecanismo indispensável

Dada a imensidão de fontes de informação na Internet e a rapidez da renovação dessa informação, surgiu um mecanismo extremamente útil e versátil, que uma vez experimentado, não se dispensa mais. Falo dos Feeds, palavra em inglês para designar um conjunto de dados transferidos de máquina para máquina de forma automática, sem que seja necessária a intervenção humana.

O ícone genérico para esta funcionalidade é o do RSS .

Vantagens no uso dos feeds

Simplificar a actualização da informação que nos interessa é já um argumento de peso para usar feeds. Mas as vantagens não ficam por aí. Veja-se a lista de benefícios:

  • selecção pessoal das fontes de informação
  • recepção das novidades logo após publicação
  • proliferação de programas de leitura de feeds, havendo-os para todos os gostos
  • gestão simples das fontes: acrescentar, remover, organizar
  • protecção contra spam, vírus, etc., ao contrário do que acontece com as subscrições por email
  • gestão mais saudável do email, que não é inundado por “novidades”

Funcionamento dos feeds

Este mecanismo assenta na arquitectura servidor/ cliente. Isto é, o fornecedor de conteúdos —em geral um jornal, um autor de blog— disponibiliza um endereço que o utilizador final pode subscrever sem custos. Utilizando um programa de feeds, a pessoa copia essa direcção do jornal ou blog para a lista pessoal de feeds. Nesse mesmo instante, as últimas notícias são carregadas no seu programa e daí em diante isso far-se-á automaticamente, sem que o interessado tenha que digitar o endereço no navegador e incomodar-se a verificar se há novidades.

A tecnologia por detrás é conhecida por Pull Technology, já que o programa escolhido de feeds é que puxa as novidades do servidor onde estão alojados os conteúdos para difusão.

Neste vídeo divertido da Common Craft são apresentadas as vantagens e o princípio de funcionamento.

Soluções para ler feeds

Os feeds tornaram-se tão essenciais na Rede que o seu uso estende-se a todas as aplicações e ferramentas da web. Enumero as principais, embora haja variantes.

1. Páginas web personalizadas. Os feeds podem ser introduzidos naquilo que ficou conhecido por página de entrada na Web. É o caso do iGoogle, do PageFlakes, do Netvibes, do My Yahoo ou My MSN. Qualquer destas aplicações dispõe da opção de acrescentar conteúdo novo. Na imagem, pode-se ver essa opção no Netvibes. É uma forma muito prática, porque assim que nos conectamos, temos oportunidade de consultar as novidades dos serviços que subscrevemos. É muito fácil acrescentar novos feeds, mas também remover, quando concluímos que afinal não nos interessam.

2. Leitores de feeds na web. Serviço em que a pessoa se regista e acede quando quer ler os seus feeds. Caso do Bloglines, Google Reader. Permitem ler, importar e exportar feeds em ficheiro XML, partilhar feeds com amigos, organizá-los por categorias em estrutura de árvore, associar etiquetas, etc. Na imagem podemos ver o Google Reader que não difere muito de outras ferramentas.

3. Feeds nos navegadores. Qualquer navegador – Firefox. Internet Explorer, Safari…, dá a possibilidade de incluir feeds. Em geral, essa funcionalidade está disponível nos Favoritos. O procedimento no Firefox requer que visitemos a janela dos Marcadores. Uma das opções é “Subscrever a esta página”, precisamente a que surge na caixa do navegador e está indicada com o ícone de Feeds.

4. Programas de email. Outra opção de gerir os feeds é através do Outlook, Thunderbird, Kontact, etc. São em geral suites formadas por aplicações PIM (Personal Information Management), tais como gestor de correio, gestor de contactos, calendário, gestor de feeds. Apresento na imagem o Kontact, usado com o Linux. À semelhança de outros, oferece um serviço de gestão de feeds, neste caso, o AKgregator.

Formato dos feeds

O formato mais comum é o RSS (Really Simple Syndication), mas também existe  o Atom (Atom Syndication Format). A base de ambos é o XML e/ou o RDF/XML.

Em termos cronológicos, o RSS antecedeu o Atom, por isso é frequente designar a sindicação de conteúdos em geral por RSS. No entanto, o aparecimento do formato Atom veio na sequência da falta de interoperabilidade e falhas no RSS. O Atom é mais robusto e versátil, porque usa a estrutura de metadados RDF. Assim, quando existe a opção de subscrever nos dois formatos, é preferível eleger o Atom.

Há serviços e serviços…

Serve este capítulo para referir que os serviços de actualização são criados pelos fornecedores desses conteúdos, que estão obviamente interessados em que as pessoas os leiam, os refiram e os difundam em blogs, websites, etc.

Há-os especificamente para textos, mas também para podcast. Começa agora a aparecer o RSS-narrator, um tipo de feed com o mesmo objectivo geral, mas com a particularidade de converter o texto em voz. O utilizador não lê, mas ouve as novidades, algo bastante prático quando se conduz para o trabalho. Veja-se o caso do Talking News que além de usar os podcasts disponíveis nos media seleccionados, converte igualmente texto em audio.

Acontece que há serviços de Feeds que permitem uma selecção mais refinada da informação pretendida. Nos dois jornais de referência escolhidos, o Expresso e o El País, pode ver-se a diferença e o impacto na qualidade do serviço para o utilizador final.

Graças aos filtros disponibilizados pelo jornal El País, foi possível introduzir na “Agulha no palheiro” as 10 últimas notícias na área da tecnologia, sendo a área que sigo atentamente e que está relacionada com a temática tratada neste blog. Desta lista de apontadores, os leitores podem consultar alguma notícia que lhes desperte curiosidade.