quinta-feira, 29 de maio de 2008



O Dicionário da Língua Portuguesa define o termo semântico como sendo “o componente do sentido das palavras e da interpretação das sentenças e dos enunciados”. Tim , o homem que inventou sozinho a World Wide Web em 1989, pediu emprestado este termo para baptizar a internet do futuro. Trata-se da Web Semântica, um conjunto revolucionário de tecnologias que ele está a desenvolver, como director do World Wide Web Consortium, órgão ligado ao Instituto de Tecnologia de Massachusetts (MIT).

O que é a Web Semântica?
O modo mais simples de explicar é: no seu computador tem os seus arquivos, os documentos que lê, e existem arquivos de dados como agendas, programas de planeamento financeiro, folhas de cálculo. Estes programas contêm dados que são usados em documentos fora da web. Eles não podem ser colocados na web. Um exemplo: Está a procur uma página na web para encontrar uma palestra que quer assistir ou um evento que quer participar. O evento tem um local e um horário e pessoas associadas a ele. Mas precisa ler a página da web ao mesmo tempo em que abre a agenda para inserir as informações. Se pretender localizar novamente aquela página, terá que digitar o seu endereço para ela voltar até ela. Se quiser os detalhes corporativos das pessoas, terá que cortar e colar as informações de uma página na web para dentro da sua agenda, porque o arquivo da sua agenda e os arquivos de dados originais não estão integrados com os dados na web. Assim, a Web Semântica trata da integração desses dados.

Quando usa um aplicativo, deveria poder inserir seus dados de modo a poder configurá-los, informando o computador: “Eu vou estar nesta reunião”. Quando dissesse isso, a máquina iria entender os dados. A Web Semântica é sobre a colocação de arquivos de dados na web. Não é apenas uma web de documentos, mas também de dados. A tecnologia de dados da Web Semântica terá muitas aplicações, todas interconectadas. Pela primeira vez haverá um formato comum de dados para todos os aplicativos, permitindo que os bancos de dados e as páginas da web troquem arquivos.

Mas, afinal, qual é a diferença entre uma web de documentos e outra de dados?
Existem muitas diferenças. Tome, como exemplo, os seus dados financeiros. Existem duas formas de observá-los. Se olhar numa página normal na web, eles assenelham-se a uma folha de papel. A única coisa que se pode fazer é lê-los. Mas se observá-los num site da Web 3.0, poderá, por exemplo, usar um mecanismo de busca para alterar a ordem dos dados, obtendo desta forma um acesso muito melhor aos mesmos.

Hoje, antes de realizar uma tarefa como pagar impostos, necessita de um programa de gestão financeira. Ao fazê-lo, os dados não são carregados como uma página na web, mas como arquivos de dados. Esta é a diferença entre documentos e dados. Quando procura documentos nos seus dados bancários, só é possível lê-los. Quando procura dados, pode descobrir a dívida aos impostos ou qual é o total das contas a pagar. Não podemos fazer isso na web actual.

Se fosse possível, as informações reunidas nos seus dados bancários seriam convertidas num padrão que só funcionaria com bancos. Mas haverá padrões totalmente diferentes, padrões para uso em agendas, por exemplo. Hoje não se pode perguntar ao computador: “Quando é que eu preenchi este cheque? Qual é o nome da função? Em que data fui aquela reunião?” Não se podem conectar itens em diferentes arquivos de dados, a não ser que se use a Web Semântica. Ela é muito mais poderosa, porque nela é possível conectar dados sobre pessoas que tenham a ver com um determinado local e um determinado momento.

Mas esta integração completa entre dados pessoais, empresariais e governamentais não pode levar a uma invasão de privacidade?
Sim. Eu também tenho este medo! Um aspecto importante da Web Semântica responde pelo nome de provenance. Esta palavra é um código que define de onde vêm os dados e o que pode ser feito com eles. Os padrões da Web Semântica permitem que se defina como deseja manipular os dados aos quais tem direitos de acesso. Estamos a desenvolver no MIT sistemas para mostrar, sem sombra de dúvidas, quais são os usos permitidos para as informações, de modo a que se possa checar de onde elas vêm e o que significam, tendo-se a certeza de que não serão usadas em nenhuma forma não autorizada.

Mas não é preciso ter um mínimo de conhecimento técnico para definir estas preferências, o que não é o caso da maioria da população mundial?
Em primeiro lugar, quando se usa a Web Semântica para dados pessoais, eles não são colocados na internet aberta. Existe dentro do seu computador uma web pessoal para os dados da sua vida, para serem navegados localmente. No caso de softwares de planeamento financeiro, os sistemas dos bancos navegam através da rede no interior de um canal seguro e são executados localmente, no PC. Não se usa tecnologia de web. Os seus dados pessoais não estão na internet. O que estamos a falar é permitir ao utilizador combinar as informações pessoais e empresariais a que tem direitos de acesso com informações públicas de modo a criar um conteúdo muito mais rico.
Sobre o facto das pessoas precisarem de algum conhecimento técnico, isso às vezes é verdade. Mas no caso de uma agenda estamos a manipular dados, certo? Quando usa uma agenda de endereços, está a criar dados. Estes programas possuem interfaces amigáveis que permitem uma utilização sem grandes problemas, a menos que se usem programas incompatíveis. Estes interfaces foram desenhadas para facilitar o uso pelo utilizador comum.
Estamos a trabalhar para tornar esta tecnologia disponível àqueles que quiserem manipular documentos nas empresas. É verdade que não existe ainda tecnologia de Web Semântica que seja facilmente utilizável por pessoas idosas ou crianças. Mas no MIT temos um grupo de investigadores a trabalhar exatamente nisso, produzindo programas que permitam ao cidadão comum ler, escrever e processar os seus próprios dados.

Foi você quem formulou o termo Web Semântica? É a mesma coisa que a Web 3.0? Qual é a diferença entre a Web 2.0 e a 3.0?
Sim, fui eu. Foi em 1999, no meu livro "Weaving the Web". A Web 2.0 é um nome para descrever como operam os arquivos usados na web. Com relação ao conteúdo gerado pelos utilizadores, isso ocorre quando as pessoas acedem a web sites e classificam (tagging) informações, fazem upload de uma fotografia ou constroem sites comunitários. A Web 2.0, portanto, é baseada em sites comunitários. Mas não fui eu quem inventou este termo. Foi Tim O’Reilly, em 2005.
Sobre a Web 3.0, algumas pessoas usam este termo para definir uma nova arquitetura de dados. Já outras usam como uma forma de regulamentação da tecnologia da web. Mas considere o futuro da tecnologia da web. Um problema típico bem conhecido dos arquivos 2.0 é que os seus dados não se encontram num site, mas num banco de dados. Eles não estão na web, não podem ser manipulados. Tome como exemplo um site profissional com informações sobre os seus colegas de trabalho, um outro site com informações sobre os seus amigos, além de sites de diferentes comunidades. Na Web 2.0 não consegue ver o quadro completo; ninguém consegue ver o quadro completo. É por isso que algumas pessoas dizem que a Web 3.0 será uma realidade quando os sites exibirem dados que possam ser manipulados.
Vejamos um outro exemplo: se um determinado site encontra informações úteis sobre os meus amigos no meu blog, então eu posso definir um ícone para informar ao meu computador: “extraia estes dados, analise-os e os adicione aos dados que tenho de outros sites, para então exibi-los todos juntos”.

Quando a Web Semântica atingir todo o seu potencial, ela desencadeará um segundo boom da internet?
Bem, sob certo ponto de vista isso já está a acontecer. Mas eu não acho que a web já atingiu todo o seu potencial, e ela já existe há quase 16 anos. A Web Semântica irá surgir quando as pessoas começarem a colocar links públicos de dados na web, adicionando dados e arquivos pessoais. Mas acredito que ainda vai levar muitos anos, porque muita coisa terá que ser feita para torná-la uma realidade.

O que é a Neutralidade na Net? Qual é a sua posição em relação a isto?
Trata-se do seguinte: quando você e eu pagamos para nos conectar na internet, podemos comunicar não importa quem quer que nós sejamos. O que mais chama atenção hoje na rede são os vídeos. Eles estão tomando conta da net. Uma empresa como o YouTube atrai muita atenção porque transmite vídeo pela web, aproveitando-se do facto de que, em muitas regiões do mundo, a largura de banda está se tornando cada vez maior.
Agora suponha que eu esteja em Massachusetts, seja um fã de cinema independente e queira encontrar um filme brasileiro. Eu entro na internet para procurar no Brasil os meus realizadores e filmes independentes preferidos. Mas de repente o provider de acesso em Massachusetts bloqueia a transmissão dizendo: “Não vamos permitir que faça isso, porque nós vendemos filmes. Sim, nós fornecemos-lhe o acesso à internet, mas impedimos que veja filmes. Queremos controlar quais são os filmes que compra.”
Eu já vi empresas de televisão por cabo tentarem impedir o uso de ligações telefónicas na internet. Isso preocupa-me. Eu não quero que isso aconteça. Acredito ser muito importante manter a internet aberta para quem quer que seja. É isso que chamamos de Neutralidade na Net. É imprescindível preservá-la para o futuro.

Em 2003, o governo brasileiro, ao lado de outras nações, propôs uma administração internacional para a internet, espelhada nos exemplos da União Europeia e das Nações Unidas. Será que algum dia Washington irá permiti-lo?
Acredito que a internet vai-se burocratizar aos poucos. Isso é inevitável. É importante permitir que as pessoas de diversos países, dos países emergentes, desenvolvam o seu uso da internet o mais rápido possível. Mas a administração de algo tão grande nunca poderá ser controlada por uma burocracia única. Não sei que forma essa burocracia assumirá, já que existe muita política envolvida. Mas penso que seria importante manter a rede livre da acção dos governos e sem censurar as pessoas que a utilizam.

Certa vez afirmou que criou a web para resolver uma frustração que tinha no CERN – o Conselho Europeu para a Pesquisa Nuclear, em Genebra. Como foi isso?
O CERN possui uma maravilhosa diversidade de culturas, porque gente de todo o mundo vai lá para fazer investigação em física. Em 1989, antes de existir a web, eu escrevi um memorando explicando como ela seria. Eu mencionava o sistema de hipertextos e a World Wide Web como um método para agregar e editar dados. Eu queria que todas as informações na rede do CERN pudessem ser facilmente acessíveis. Queria desenvolver ferramentas para permitir às pessoas produzir e usar informações de forma colaborativa. A primeira ferramenta foi um editor de web que permitia aos investigadores do CERN usar um documento, editá-lo e alterá-lo para então enviá-lo, inserindo links entre as páginas da web e documentos científicos. A minha frustração era que eu queria trabalhar com pessoas de países diferentes, usando máquinas diferentes, operando bancos de dados diferentes e distribuindo dados em formatos diferentes. A web forneceu um padrão para tudo isso.

Muitos investigadores ganharam milhões com a web, mas você preferiu continuar a desenvolver padrões. Não acha que perdeu a chance de uma vida por não criar uma web proprietária?
Não, não acho, porque se ela fosse proprietária as pessoas não teriam usado nem contribuído para o seu crescimento. Ela não teria arrancado e nós não estaríamos a conversar agora.

Empreendedores como Nova Spivak e o co-fundador da Microsoft, Paul Allen, trabalham com uma linha do tempo que prevê o advento da Web 3.0 em 2010 e até mesmo uma futura Web 4.0 em 2020. Consegue imaginar como seria esta Web 4.0?
(Risos) Não, eu não consigo. Eu estudo tecnologia real. Eu não inventei a palavra Web 3.0 (ela surgiu pela primeira vez num blog em janeiro de 2006). A web está em constante evolução. Na Web 2.0 existem tecnologias, como o JavaScript, que surgiram e tornaram-se padrões por auxiliar as pessoas nas suas tarefas. A maioria dos padrões que estão a surgir agora dará um grande impulso a iniciativas como a web móvel, que é o uso da web nos mais diversos dispositivos.
No futuro teremos a Web Semântica que permitirá muitas outras coisas. Uma das características mais poderosas das tecnologias de rede como a internet, a web ou a Web Semântica é que as coisas que conseguimos fazer vão muito além da imaginação de seus criadores. Pegue, por exemplo, os inventores do TCP/IP (Transmission Control Protocol-Internet Protocol), os protocolos originais para a comunicação entre computadores na internet, criados por Vinton Cerf e Robert Kahn em 1974. Como eles imaginariam que aqueles protocolos iriam se tornar a maior de todas as redes?
Quando inventei a web, pensava nela como uma infra-estrutura, como uma fundação para muitas outras coisas. A Web 2.0 permitiu o surgimento das redes sociais e muitos outros serviços. Quando a Web Semântica surgir daqui alguns anos, os utilizadores irão utilizá-la de formas que ainda não podemos prever. Por isso é um disparate tentar imaginar como será uma Web 4.0 quando nem sabemos o que será feito na 3.0.

As pessoas que a estudam a Web 3.0 terão que desenvolver ideias para fazer esta nova tecnologia ter sucesso. Eles vão projectar coisas fantásticas, assim como os investigadores da Web 2.0 estão a desenhar coisas fantásticas neste instante. Quem trabalhar com a Web Semântica irá fazer coisas muito mais poderosas. Não podemos imaginar como elas serão. Mas temos que construir a web para ser uma infra-estrutura. Ela nunca deverá ser usada para propósitos particulares. Somente como uma fundação para futuros desenvolvimentos.

(fonte: CIO – Entrevista por Peter Moon)

Posted by ... boost alpha às 14:07
Categories: Labels:

Sem comentários: