E aquela responsabilidade que a pessoa UX Writer tem em garantir a linguagem natural do usuário? Como fazer com que os sistemas tenham conteúdo relevante e que espelhem o que o usuário procura sobre aquele conteúdo?
Um vocabulário controlado tem função importante na mediação entre as palavras utilizadas no discurso e aquelas que funcionam efetivamente para a recuperação da informação. Ter um vocabulário para uso corporativo busca a finalidade de desambiguizar e restringir as palavras disponíveis, além de limitar o número de conceitos e termos utilizáveis para a indexação, estas são as características do processo de vocabulário controlado.
A Norma ISO 25964-2 (INTERNATIONAL ORGANIZATION FOR STANDARDIZATION, 2011), trata de Controle de Vocabulários (política corporativa) e tesauros (ferramenta) para a recuperação da informação. A norma considera o controle de vocabulário essencial por causa do discurso comum, onde um termo pode ter mais de um significado. A escolha de um termo preferido para representar um conceito específico é o próprio controle de vocabulário. Para isso se usa instrumentos de vocabulário controlado.
Por que controlar o vocabulário?
O controle é realizado para distinguir entre homógrafos (mesma palavra com diversos sentidos), de modo que cada um tenha apenas um significado no contexto “daquela voz” (daquela instituição que controla sua redação e estilo). O processo se dá a partir da escolha de um conjunto de sinônimos e quase-sinônimos, um deles sendo preferido para uso na indexação. Os vocabulários controlados são organizados em lista hierárquicas que evidenciam as relações entre as palavras, das relações mais simples (homonímia) até as mais complexas (ontologias).
O propósito dessas restrições (usar palavras só da lista de termos autorizados) é de aumentar a probabilidade de conteudistas indexadores escolherem o mesmo termo para etiquetar um conceito presente no texto. E qualquer mecanismo de inteligência artificial agradece.
Quais instrumentos de vocabulário controlado posso usar?
Sistemas de Organização do Conhecimento (SOC) como Taxonomias, Tesauros, Ontologias são importantes porque realizam o controle de vocabulário em sistemas que necessitam prover a recuperação da informação armazenada. Logo, melhoram a experiência e aumentam a relevância de conteúdo para o usuário.
Estes recursos atuam diretamente na organização e representação do conhecimento. Mas e quando não tem uma taxonomia criada? Quando isso não ocorre, a recuperação da informação é realizada com a linguagem natural presente nos conteúdos informacionais. Porém é necessário que se indexe todo conteúdo e isso pode ser custoso e demorado para determinados sistemas.
Segundo a Norma ANSI/NISO Z39.19-2005 que trata das “Guidelines for the construction, format, and management of monolingual controlled vocabularies” (AMERICAN NATIONAL STANDARDS INSTITUTE, 2010) classifica quatro diferentes tipos de vocabulários controlados: Lista, anel de sinônimos, taxonomia e tesauro. Um resumo de cada instrumento:
- Lista de termos – conjunto limitado de termos organizados como uma lista alfabética simples ou de algum outro modo logicamente evidente.
- Glossários – listas alfabéticas de termos com definições com indicação de uso;
- Dicionários – listas alfabéticas de termos com indicações ortográficas, sintáticas e de significados.
- Anéis de sinônimos – conjunto de termos considerados equivalentes para fins de recuperação. Anéis de sinônimo são geralmente usados na interface com conteúdo representado em linguagem natural e não controlada.
- Taxonomias – são divisões de itens ordenados em grupos ou categorias baseando-se em suas características específicas e pode ser representa por listas, árvores, hierarquias, sistemas de mapa.
- Tesauros – são vocabulários controlados formados por termos descritores semanticamente relacionados, atuando como instrumentos de controle terminológico.
Como fazer o Controle de vocabulário na UX Writing?
Os ux writers devem utilizar estes instrumentos para preencher a Tabela de Voz e abastecer os microtextos e webwritings necessários. Ela define, também, como a empresa/instituição chama as coisas, pois um termo sempre é um substantivo. Assim, como o Manual de Redação e Estilo espelha o discurso e as narrativas possíveis para aquela marca, ao se criar estes tipos de conteúdo deve-se consumir desses instrumentos, geralmente elaborado por um profissional da informação. Ad hoc, a pessoa writer pode criar suas listas para deixar claro quais palavras podem ser utilizadas naquele sistema/interface/produto.
A aplicação do microtexto, de outra forma, deve partir da utilização de palavras priorizadas na Tabela de Voz. Porém as palavras ali são declarações, são exemplos da essência representada pela tabela, o melhor lugar para pegar palavras para usar nos conteúdos e textos é em algum instrumento de vocabulário controlado.
INTERNATIONAL ORGANIZATION FOR STANDARDIZATION. Information and documentation – Thesauri and interoperability with other vocabularies – Part 2: Interoperability with other vocabularies. ISO 25964-1:2011. Geneva: International Organization for Standardization, 2013.