LENGUAJE DOCUMENTAL
Los lenguajes documentales surgen de la necesidad de
conseguir que el emisor y el receptor de la información lleguen a el
entendimiento en un contexto en el cual cada vez hay más material y, por lo
tanto, más ruido que dificultan la comunicación. De ahí la necesidad de crear
códigos como elementos secundarios, nuevos productos a partir de la obra
original. Esa respuesta anticipada a un riesgo potencial de falta de
comunicación constituye de hecho la esencia de todo el esfuerzo del análisis
documental.
Se podría representar de la siguiente manera: el autor crea
la obra con un código determinado, el analista (o agentes software de
información) lo traduce a su código (adaptado para la búsqueda y recuperación
de la información) y el receptor utiliza ese nuevo código para encontrar la
obra original. Los lenguajes documentales son, pues, los que establecen la
comunicación entre el documento original y el usuario, haciendo de puente o
intermediario entre las informaciones contenidas en los documentos y las
informaciones solicitadas por los usuarios.
DEFINICIÓN
Sistema artificial de signos utilizados en las operaciones
de indización que permite la representación de contenido documental para su
posterior recuperación, sirviendo como medio para la interrogación,
recuperación y difusión de información pertinente para el usuario.
El lenguaje documental es considerado objeto de estudio
de la lingüística documental, cuyas bases teóricas proceden de disciplinas como
la lingüística, la semántica, la
sintaxis, la onomasiología, la lexicología y la lingüística textual, entre
otras, y está relacionada con otras áreas de conocimiento como la inteligencia
artificial, la lógica e incluso con la teoría de la comunicación y de la
información.
El lenguaje documental no es un “lenguaje natural”,
aunque se sirva de signos del lenguaje natural (palabras) que representan
nuestro conocimiento de la realidad. Los lenguajes naturales presentan
problemas de difícil solución, como la polisemia o la sinonímia, que los hacen
poco adecuados para la indización, lo cual no quiere decir que el lenguaje
natural no se utilice en algunos tipos de indización.
Los lenguajes documentales surgen precisamente para
reducir los problemas que produce la indización con lenguajes naturales. De
esta forma, los términos “lenguaje de indización” y “lenguaje documental” no
son sinónimos: todos los lenguajes documentales son lenguajes de indización,
pero no todos los lenguajes de indización son lenguajes de documentales.
Ø También llamado “Lenguaje artifical”
En el lenguaje documental, las palabras adquieren valor
semántico por medio de su normalización y de las reglas morfosintácticas que lo
articulan. Son precisamente esas reglas las que le dan categoría de “lenguaje
artificial”. Además, en ocasiones el lenguaje documental reemplaza esos signos
del lenguaje natural por símbolos cargados de significado preciso.
TIPOS DE LENGUAJES DOCUMENTALES
Existen diversos criterios de clasificación de los
lenguajes documentales, aunque los más generalizados son aquellos que utilizan los
siguientes criterios:
1.
Dependiendo del grado de control terminológico,
se pueden distinguir:
• Lenguajes
libres. Lenguajes fundados en el principio de postcoordinación, se componen de
términos no predefinidos que se va generando a partir de la realización de
procesos de indización. Los lenguajes libres no son propiamente lenguajes
documentales puesto que para que reciban este nombre el vocabulario ha de estar
controlado.
• Lenguajes controlados. Son los lenguajes
documentales propiamente dichos: tesauros, listas de encabezamientos de materia
y clasificaciones. Presentan un vocabulario previamente elaborado, y admiten un
limitado número de modificaciones en el momento de su utilización. El
vocabulario controlado proporciona al usuario un punto de búsqueda, en vez de
dos o más, y reduce la posibilidad de que la búsqueda sea incompleta. Sin
embargo, puede perderse alguna información debido a la falta de especificidad y
errores en el análisis.
2.
Dependiendo de la coordinación de los términos,
en función del momento en que se combinan los elementos que los componen,
podemos distinguir:
• Lenguajes precoordinados. Combinan los
términos en el momento de la descripción. Son lenguajes precoordinados las
clasificaciones y las listas de encabezamientos de materia. En estos sistemas
las distintas nociones o conceptos que se unen para expresar una materia o un
tema ocupan un lugar determinado, es decir se introducen en el momento de la indización
en un orden previamente establecido y la recuperación habrá de hacerse
secuencialmente, siguiendo ese orden. Suelen ser muy precisos, pero también muy
rígidos.
• Lenguajes postcoordinados. Combinan los
términos en el momento de la recuperación. Son lenguajes postcordinados los
tesauros (lenguaje utilizado para la indización por descriptores), y si
incluyéramos los lenguajes libres podemos mencionar también las listas de
descriptores libres y las listas de 4 palabras clave. En estos sistemas las nociones
o conceptos que se extraen en la indización para expresar el tema o los temas
del documento tienen todas la misma categoría y no se expresarán en ningún
orden determinado. Serán los intereses de los usuarios en la fase de
recuperación los que obliguen a la combinación de conceptos.
Al combinar las
características de control y coordinación es posible establecer cuatro grupos:
Ø Lenguajes
libres y precoordinados: el sistema Precis.
Ø Lenguajes
controlados y precoordinados: las clasificaciones y las listas de
encabezamientos de materia.
Ø Lenguajes
libres y postcoordinados: las listas de descriptores libres y las listas de
palabras clave.
Ø Lenguajes
controlados y postcoordinados: los tesauros.
3.
Dependiendo de su estructura, los lenguajes
documentales pueden ser:
• Lenguajes de estructura jerárquica. A la
estructura jerárquica, también denominada arbórea o sistemática, responden
determinadas clasificaciones (las clasificaciones jerárquicas): por ejemplo, la
Dewey y la CDU. En ellas los conceptos se distribuyen en clases o categorías,
donde dependen unos de otros. Estos lenguajes van de lo general a lo
particular. Útiles en fondos enciclopédicos, resultan poco operativos para
recuperar información, son sistemas muy rígidos y difíciles de actualizar,
pueden servir para organizar colecciones.
• Lenguajes de estructura asociativa o
combinatoria. Son aquellos que permiten la libre combinación de términos entre
sí, eliminando la rigidez de los lenguajes de estructura jerárquica. A la
estructura combinatoria o asociativa responden, por ejemplo, las listas de
encabezamientos de materia y los tesauros, si bien es cierto que en la
estructura de estos últimos participa también la estructura jerárquica. Estos
lenguajes tienen una presentación alfabética y los conceptos se asocian o
combinan libremente entre sí para expresar el tema o los temas.
• Lenguajes de estructura sintáctica.
Surgen por la cantidad de ruido que producen los lenguajes combinatorios, que
pueden poseer una red de relaciones semánticas pero no tienen gramática. La
estructura sintáctica permite concretar y ordenar los conceptos. Este tipo de
lenguaje requiere un cierto grado de automatización en los procesos tanto de
indización como de recuperación, por lo que su aparición está asociada al
desarrollo tecnológico.
Según su complejidad, se pueden
diferenciar dos tipos:
Ø lenguajes
sintácticos de gramática simple y,
Ø lenguajes
sintácticos de gramática elaborada. Principales tipos de clasificación
El objetivo de la clasificación en el análisis documental
consiste en identificar a qué clase o subclase se atribuye idealmente un
documento y concretar este aspecto teórico en la elaboración de un catálogo
sistemático de materia y/o en la ordenación física por materias de los
documentos en las estanterías.
Se suelen distinguir distintos tipos de sistemas de
clasificación dependiendo del criterio que se adopte, siendo los más frecuentes: el contenido y la
estructura.
Según su contenido o alcance pueden ser:
• Clasificaciones
enciclopédicas: abarcan todas las ramas del saber. El más difundido y utilizado
en España es la Clasificación Decimal Universal (CDU).
•
Clasificaciones especializadas: profundizan en campos específicos del
conocimiento, por lo que los términos utilizados corresponden a un área
temática en particular. Algunas de las más conocidas clasificaciones de este
tipo son la de la National Library of Medicine (EEUU), la Clasificación Decimal
Astronáutica y la Clasificación de la OCDE.
Según su estructura pueden ser:
• Clasificaciones
monojerárquicas o jerárquicas: también denominadas analítico-enumerativas. Sus
clases, y subclases se organizan en forma arborescente, dando lugar una serie
de divisiones y subdivisones dependientes unas de otras.
• Clasificaciones facetadas:
lenguajes documentales precoordinados, que a través de su organización permite
construir áreas de conocimiento, creando un puente entre los sistemas
jerárquicos y los asociativos, convirtiéndolo en un sistema analítico-sintético
Ejemplos serían la Colon
Classification de Ranganathan o la de Vickery.
• Clasificaciones híbridas:
también denominadas mixtas. Toman la estructura del conocimiento en grandes
bloques de la estructura jerárquica pero incorporando las facetas, lo que da
más precisión a la caracterización de los documentos. El ejemplo clásico es la
CDU.
FUENTES DE INFORMACIÓN
MANUAL INFORMATIVO- CAPITULO 3
IMÁGENES WEBS
http://eprints.rclis.org/14817/1/lendoc.pdf
No hay comentarios:
Publicar un comentario