Los conceptos que elegimos en la fase de análisis los tenemos que expresar en un lenguaje documental. Los documentos están escritos en lenguaje natural pero como código daría lugar a problemas de sinonimia, de hominimia, de polisemia, de ruido y de silencio documental. Para solucionar todos estos problemas tenemos que utilizar el lenguaje documental, que es un sistema artificial de signos normalizados que facilitan la representación formalizada del contenido de los documentos para permitir la recuperación manual o automática de la información solicitada por los usuarios. Es un lenguaje controlado.
TIPOS DE LENGUAJE DOCUMENTAL
Listas de palabras claves, tienen una estructura alfabética y la ventaja de su valor intrínseco. Pero es muy ambiguo, puede producir mucho ruido y silencio. Otra ventaja es que es un sistema que elabora el ordenador.
Descriptores libres, el sistema automático está más estructurado porque prevé algunos casos de sinonimia y lo reduce todo a formas verbales. Tiene la desventaja de que no tiene mucha estructura.
Encabezamiento por materias, son lenguajes realizados por el ser humano. Es un vocabulario que tiene una estructura asociativa o combinatoria para formar conceptos. Se utilizan para la indexación por materias.
Clasificaciones CDU, presentan una estructura sistemática de los conceptos en diversas categorías o clases. Es un lenguaje codificado. La ventaja que tiene es que es un lenguaje internacional, pero tiene las desventajas de que es muy rígido.
Tesauros, están constituidos por listas estructuradas de conceptos a los que llamamos descriptores que posibilitan la descripción analítica de los documentos. Son lenguajes muy controlados, evitan la ambigüedad y las alteraciones de sentido. Mantienen la univocidad (1 termino = 1 concepto)
CRITERIOS DE TIPIFICACIÓN DE LOS LENGUAJES DOCUMENTALES
Control de los términos los lenguajes suelen ser: libres (que se componen de un vocabulario no definido y que va generado a partir de los procesos de indexacion. Ej. Palabras clave) o controlados
Coordinación de los términos los lenguajes suelen ser: precoordinados (la coordinación se realiza en el momento de la descripción. Ej. Listas de encabezamiento) o postcoordinados (la coordinación se realiza en el momento de la recuperación)
Estructura los lenguajes pueden ser: jerárquicos (los términos siguen un orden lineal. Ej. tesauros) ; combinatorios (proporciona un acceso más rápido a la información pero puede dispersar los términos más afines) o sintácticos (fase para recuperar la información, la estructura sintáctica completa)
LISTAS DE ENCABEZAMIENTO
Sirven para recoger los conceptos y representan de una manera unívoca el contenido de los documentos. Se trata de un lenguaje ordenado alfabéticamente y es un lenguaje precoordinado porque los términos se coordinan cuando se elabora el lenguaje. Sirven para que el usuario acceda a la documentación a través de una materia. También para poder agrupar los documentos que tratan de una misma materia. Es un vocabulario universal. Son listas abiertas. No están estructuradas conceptualmente.
LAS CLASIFICACIONES
Es otro sistema de lenguaje documental para la indexación de documentos. Se trata de signos normalizados que sirven para representar de manera sintética el contenido de los documentos. También sirven para ordenar y localizar los documentos porque permiten agrupar en estanterías por grandes materias. También sirven para generar una base de datos como por ejemplo las listas bibliográficas. Son también lenguajes precoordinados y están representados por códigos numéricos.
EL TESAURO
Es un diccionario en donde aparecen los términos ordenados alfabéticamente y sistemáticamente. Se empiezan a aplicar en los años 50/60 porque se necesitaban instrumentos que dieran mayor flexibilidad en el tratamiento de los documentos tanto en la indexación como en la búsqueda. Es un lenguaje documental de estructura combinatoria que se basa en expresiones conceptuales llamadas descriptores y está provisto de unas relaciones semánticas. Es un lenguaje controlado y estructurado y se llega a él mediante la selección de términos del lenguaje natural. Los tesauros están sujetos a la norma ISO 2788/86 denominada Directrices para el establecimiento y desarrollo de tesauros monolingües. Los elementos que tiene un tesuaro son en cuanto a: Composición léxica, descriptores, no descriptor, palabras herramienta. Composición semantica, relaciones de equivalencia, relaciones jerárquicas y asociativas. Notas de alcance, son anotaciones que se incluyen para aclarar o delimitar el significado de un descriptor. Las siglas son NA
Hola, Eva:
Gracias por tu página, me gusta por lo clara y breve que es. Parece mentira, pero no entiendo (por mucho que leo sobre el tema, no me entra en la mollera) qué es un lenguaje pre o post coordinado: no sé si se refiere a la manera de combinar los descriptores o a qué. Digamos que no sé cuál es el objeto directo de esta proposición. Tiento a la suerte y te lo pregunto por si me iluminas con un aspecto que no he captado y abusando de tu amabilidad.
Un saludo y mil gracias.
Marisa V.
Estimada Marisa, agradecerle sus palabras. Le paso un articulo que quizá le pueda ayudar a resolver su duda. Un cordial saludo, Eva
http://www.uam.es/personal_pdi/ciencias/ecurras/tesaurosmanualdeconstruccionyuso.pdf
Eva, te lo agradezco mucho.
Un saludo.
Marisa.
Hola! hace nada creé una página web sobre Lenguajes Documentales para una asignatura de la Facultad: http://lenguajesdocumentales.000webhostapp.com/
Si es posible no me borres el comentario para darla visibilidad.
Muchas gracias.
Pingback: Tesoro U.P. Tesauro y forma de uso documental - Alquiblaweb