Arquivos

Posts Etiquetados ‘taxonomia’

GED, taxonomia e ontologia nas empresas

14 de agosto de 2009 Deixe um comentário

O gerenciamento eletrônico de documentos, que hoje controla o fluxo de trabalho em grandes empresas, organiza e classifica a informação com os mesmos conceitos usados por bibliotecas milenares.

O gerenciamento eletrônico de documentos é um conjunto de métodos que permitem gerar, controlar, armazenar, compartilhar e recuperar informações existentes em documentos através de um sistema digital.

Com o GED nós podemos tramitar documentos e informações e atribuir permissões e perfis de competências. Por exemplo: uma empresa de engenharia que lida com plantas em grandes formatos (A0, por exemplo) pode digitalizá-las, criar um controle de versões e compartilhá-las. Deste modo poderá, de acordo a necessidade, gerar cópias controladas desse documento.

Imagine como uma empresa petroquímica, com centenas de dutos e encanamentos por onde passam toneladas de produtos, precisa de plantas detalhadas e atualizadas desta estrutura. O GED reduz custos e favorece o compartilhamento de informações. Pode, por exemplo, gerar cópias. Mas como funcionam essas cópias?

Para controlar a integridade da informação, apenas usuários com perfis específicos podem alterar e imprimir tais documentos e para isso existem etapas:

  • 1. É feita uma proposta de alteração ou criação do documento, norma etc.;
  • 2. A proposta é analisada e são feitas críticas;
  • 3. A pessoa designada para tal começa a elaborar o documento;
  • 4. O documento passa pelos avaliados e comissão técnica;
  • 5. Se aprovado ele passa pela direção ou presidência que irá homologar
  • 6. Após a homologação o documento é liberado no sistema e a versão anterior é substituída.

Workflow é registrado

Em se tratando de documentos legais, as imagens precisam ser rasterizadas. Ou seja, é criado um bitmap que não permite a manipulação por vetores (vetorização). Deste modo temos uma imagem teoricamente impassível de ser fraudada.

Todo o trâmite do documento é registrado no sistema: data e hora da atribuição, envio, saída para homologação etc. Por isso os sistema de GED trabalham com workflows e controlam o fluxo de trabalho, mediante permissões e competências.

E para que os documentos eletrônicos sejam recuperáveis é preciso criar esquemas de indexação, com levantamento de termos e taxonomias e, em caso mais complexo, o uso de ontologias.

Taxonomia

De forma mais genérica, podemos dizer que taxonomia é uma classificação. Porém a taxonomia trata de uma estrutura de organização baseada na hierarquia – vai do geral para o específico, do maior para o menor, do menos complexo para o mais complexo. Leia mais…

Tesauros, folksonomia e uma ajudinha da usabilidade

14 de agosto de 2009 Deixe um comentário

Cada uma das soluções (uso de tags ou vocabulário controlado) tem pontos fortes e fracos. Melhora muito quando é acrescentada a indexação com usabilidade, com proposta de sugestões e boa arquitetura de informação.

Focando os dois lados da organização da informação na web, temos a cruz e a espada: se de um lado temos as tags (folksonomia), que permitem uma democratização e a ampliação nas possibilidades de busca e recuperação da informação, temos os problemas que ela causa, como polissemia, erros de grafia, flexões de gênero e número e duplicidade de termos, entre outros.

Defendo a ideia de que a folksonomia tanto pode levar a informação até o usuário quanto fazer com que este nunca encontre o que está procurando.

Por outro lado temos os tesauros (vocabulários controlados), que são cuidadosamente elaborados por profissionais para que o site e as informações que este contém mantenham uma unidade de termos e seja simples a “encontrabilidade” de informações. Porém os tesauros exigem que os profissionais sejam capacitados e dominem a linguagem do usuário.

Para isso é preciso que o profissional “traduza” o que o usuário quer dizer e monte uma árvore hierárquica de termos próximos, análogos e/ou relacionados, para que a busca seja eficiente. O grande problema dos tesauros é que este exige o usuário também conheça e domine os termos indexados (o que limita as possibilidades de busca do ponto de vista do usuário).

Geralmente o que o usuário está pesquisando não é algo que ele conheça bem; muito pelo contrário, ao entrar num site o usuário está buscando justamente aquilo que não domina ou não conhece bem. Como podemos exigir então que ele saiba os termos que descrevam o conteúdo daquilo que está buscando?

Cada uma das soluções (uso de tags ou vocabulário controlado) tem pontos fortes e fracos. Um exemplo que eu sempre recomendo aos meus colegas é o do Google, Você pode pesquisar Jornal na Intnet (com erro de grafia mesmo) e ele retorna os resultados: Você quis dizer Jornal na Internet? E no final da página têm-se:

“Pesquise também: Jornal On-line, Jornal na Web, além de publicidade: Adquira jornais com o menor preço”.

Analisando a estrutura acima temos uma referência cruzada que remete de um termo não usado para o termo utilizado pelo sistema (como nas bibliotecas), e simultaneamente temos o feedback de outros termos que se relacionam com o termo pesquisado.

Resumindo: indexação com usabilidade e boa arquitetura de informação é isso! Não forçar o usuário a decorar termos, retornar os resultados e trazer variações desses termos, além de propor sugestões. Não devemos ser inimigos da usabilidade tampouco dos nossos usuários, afinal o arquiteto de informação, o bibliotecário e os profissionais de TI estão a serviço da clareza e da organização da informação.

E quanto menos o usuário perceber os passos realizados pelo mecanismo de busca do site, e quanto menos for evidente a arquitetura de informação e os processos internos de classificação, catalogação e indexação, mais eficiente e eficaz será o site.

Afinal do que adianta dizer ao usuário que “a pesquisa não encontrou nenhum documento correspondente”?