top of page

Vocabulário controlado


Este post comenta a necessidade de um vocabulário controlado no sentido de melhorar a qualidade da identificação e indexação e, em consequência, da recuperação (encontrabilidade) da informação. A representação documentária da informação feita por palavras-chaves em língua natural, sem controle terminológico, evidencia os problemas de comunicação que ocorrem entre o indexador e a base de dados, causados, entre outros, pela falta de uma estrutura conceitual no momento da condução da busca.

É indiscutível a necessidade da modelagem de documentos, analisando todos os tipos documentais passíveis de serem armazenados em um sistema de GED/ECM e adaptando-os a uma nova realidade projetando seus formatos e formatando seus conteúdos.

É também indiscutível a importância da indexação de conteúdos com a construção de metadados que propiciem um estado de melhor encontrabilidade (é a qualidade de interação entre um usuário e uma interface (assim como a usabilidade), que se refere a algo poder ser encontrado pelo usuário. Um exemplo seria a capacidade que uma informação tem de ser encontrada em um acervo de milhões de documentos através de mecanismos de busca). (http://findability.org/)

Ocorre que toda essa arquitetura de BPM/ECM, desenvolvida no “estado da arte”, de nada adiantará se os metadados dos documentos e processos não forem corretamente povoados com informações consistentes que permitam atingir os objetivos da melhor encontrabilidade.

A indexação requer um trabalho intelectual de análise, síntese e representação, e para determinar os assuntos dos documentos deve-se estar apoiado por uma terminologia que atenda os diversos perfis socioculturais e socioprofissionais dos usuários. Além disso, é necessário estabelecer um padrão que contemple a diversidade, assegurando-se, simultaneamente, a consistência do sistema (Kobashi, 2001).

Principalmente em aplicações corporativas com ambientes informacionais compartilhados em que muitas pessoas possam ser responsáveis por introduzir documentos no sistema é necessário a criação de mecanismos que tornem a aplicação resistente à entropia, que vem a ser o estado de desordem natural de qualquer sistema, na ausência de uma força organizadora.

Com esse objetivo, faz-se necessário o estabelecimento de padrões capazes de homogeneizar o significado de palavras, expressões e símbolos utilizados em todo o ciclo de produção das informações. Um vocabulário controlado contribui muito para minimizar as barreiras de entendimento, proporcionando um meio eficiente e confiável para a troca de informações.

Um vocabulário controlado garante a comunicação efetiva entre um sistema de informação e seus usuários.

A principal premissa para criação de um vocabulário controlado é de ser centrado no ser humano: como a informação só pode existir em “comunidades de sentido” deve-se considerar primeiramente as pessoas, buscando assegurar-lhes conforto e, somente depois, a tecnologia. Uma segunda importante premissa é a de manter a “visão do todo”, em um modelo arquitetural das informações corporativas voltadas ao atendimento das necessidades dos clientes, fornecedores, acionistas, sociedade, etc., considerando o movimento do mercado e em conformidade com órgãos reguladores.

A sugestão de criação, em primeira versão, de um vocabulário controlado não tem a pretensão de se chegar a um tesauro ou mesmo uma obra completa e acabada, que por si só baste para indexar todos os documentos a serem incluídos nas bases de dados existentes ou que venham a ser criadas. O importante é ser criada uma primeira edição e, após esta, outras serem lançadas à medida que novos termos forem sendo acrescentados, conforme é da própria dinâmica das ciências.

A elaboração de um vocabulário controlado fundamenta-se no princípio de que é um instrumento dinâmico, capaz de ser atualizado de forma criteriosa, requer uma estrutura de relações lógico-semânticas explícitas entre a macroestrutura e microestrutura, em seus diferentes níveis e a apresentação de regras de utilização igualmente explícitas e compartilhadas.

ANSI/NISO Z39.19 - Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies. “Apresenta diretrizes e convenções para o conteúdo, exibição, construção, testes, manutenção e gestão de vocabulários controlados monolíngues. Ele se concentra em vocabulários controlados que são utilizados para a representação de objetos de conteúdo em sistemas de organização do conhecimento, incluindo listas, anéis de sinônimos, taxonomias e tesauros.”

O que é e como usar

Vocabulário controlado é uma linguagem artificial constituída para tratar e recuperar a informação com termos organizados em estrutura relacional.

É também um sistema de referência compartilhado que padroniza a classificação da informação, permite a busca da informação por termos padronizados ampliando a confiabilidade e evitando sua dispersão. Deve refletir a política da instituição (missão, objetivos, etc.), a terminologia de áreas de conhecimento e a “linguagem do público-alvo”.

Uma das funções do vocabulário é representar a informação e o conhecimento por meio de um conjunto controlado e finito de termos – os descritores.

O controle de vocabulário intervém na organização dos arquivos ao nomear, de forma consistente, o acesso aos documentos e à informação neles contida. O objetivo a ser alcançado é sempre o da recuperação da informação: somente esse objetivo justifica os cuidados com o controle de vocabulário.

Os documentos, ou conjuntos de documentos, devem ser identificados por algumas características que os individualizam, distinguindo-os dos demais: essa é a condição para que possam ser recuperados com precisão. Logo, a identificação das características dos documentos pressupõe:

  • que a descrição das características dos documentos seja eficiente, ocupando o menor tempo possível, tanto do arquivista quanto do usuário do sistema;

  • que a descrição das características dos documentos seja eficaz, permitindo que o objetivo do arquivo seja atingido, isto é, a correta recuperação dos documentos e informações.

Trata-se, portanto, de identificar, nos documentos ou seus conjuntos, as categorias informacionais que serão utilizadas na busca de informação, ou seja, os “pontos de acesso”. As normas ISAD(G) - General International Standard Archival Description (http://www.conarq.arquivonacional.gov.br/Media/publicacoes/isad_g_2001.pdf) e ISAAR (CPF) - International Standard Archival Authority Record for Corporate Bodies, Persons, and Families, (http://www.conarq.arquivonacional.gov.br/Media/publicacoes/isaar_cpf.pdf), por exemplo, dispõem categorias informacionais para a descrição de conjuntos documentais ou documentos isolados, respeitando os princípios arquivísticos.

Para tornar úteis os “pontos de acesso”, duas condições devem ser observadas:

  1. que sejam bem selecionados, isto é, que tenham poder discriminante para diferenciar conjuntos documentais em conformidade com os preceitos arquivísticos; essa é a função das normas ISAD(G) e ISAAR(CPF);

  2. que sejam expressos de forma consistente.

É importante enfatizar que esses vocabulários são instrumentos que concorrem para, na organização do arquivo, evitar a dispersão de informações e, por consequência, gerar confiança na resposta.

Deve ser desenvolvidos por equipe multidisciplinar com integrantes da área de tecnologia da informação, especialistas em vocabulário controlado, e principalmente pelos usuários do sistema de informação para sua validação.

Vide exemplo do Vocabulário controlado SIBi/USP em: http://143.107.154.62/Vocab/Sibix652.dll/Index3.

O Vocabulário Controlado USP, é uma lista de assuntos utilizada para a indexação de recursos de informação no Banco de Dados Bibliográficos da USP – DEDALUS.


Posts Em Destaque
Posts Recentes
Arquivo
Procurar por tags
Nenhum tag.
Siga
  • Facebook Basic Square
  • Twitter Basic Square
  • Google+ Basic Square
bottom of page