Publicaciones y búsqueda bibliográfica

El uso de la terminología médica. Thesaurus. Medical Subject Headings (I)

W. Martín Roncero Bibliotecaria.
Hospital Universitario 12 de Octubre. Madrid.


Introducción
Desde el siglo xviii se utiliza el artículo como vehículo principal para la diseminación del conocimiento científico. A finales del siglo xix y comienzos del xx la presencia de revistas profesionales y de artículos científicos era ya tan grande que se hizo necesaria la elaboración de obras de referencia (Index Medicus y Excerpta Medica, entre otras) para facilitar la gestión de la información. A lo largo del siglo xx el crecimiento de la información científica ha sido tal que puede hablarse de una auténtica explosión de la información. Hace 30 años, en paralelo con el desarrollo tecnológico, se construyeron versiones computarizadas de estos índices, bases de datos como MEDLINE, EMBASE y otras, para posibilitar un acceso rápido a la información. La gran paradoja es que la inmensa cantidad de información almacenada, cada año se publican 20.000-30.000 revistas médicas, hace difícil el acceso al conocimiento de calidad y adecuado a las necesidades concretas del usuario, que tiene que enfrentarse a un problema no muy distinto al de buscar una aguja en un pajar.

Afortunadamente, el usuario actual de la información médica cuenta con 3 instrumentos que le van a facilitar extraordinariamente la tarea. El primero surgió como iniciativa de los profesionales americanos, médicos y documentalistas, de crear grandes obras de referencia (INDEX MEDICUS) que más adelante se convertirían en grandes bases de datos, y el invento y aplicación de un lenguaje controlado o «thesaurus». El más conocido y utilizado de esos «thesaurus» es el elaborado por la National Library of Medicine de Estados Unidos, conocido como Medical Subject Headings o MeSH. El segundo elemento importante consiste en la difusión del uso de ordenadores personales, cada vez más potentes, rápidos y baratos, que permiten identificar, combinar y utilizar las palabras clave de manera extremadamente eficaz y eficiente. El último instrumento, propuesto recientemente, consiste en una técnica de gestión del conocimiento científico que viene en llamarse «medicina basada en la evidencia (MBE)».

A nuestro juicio, en orden a optimizar su rendimiento, la utilización de las bases de datos bibliográficas debe hacerse con la técnica MBE, que consiste en la aplicación metódica y sucesiva de 5 componentes: identificación de un déficit de conocimiento en relación con cualquier decisión clínica; su conversión en una pregunta adecuada, que sea concreta y susceptible de tener respuesta; transformación de esa pregunta en una estrategia de búsqueda que permita extraer material de valor de los yacimientos de información existentes en las bases de datos bibliográficas; selección, mediante la aplicación de criterios sencillos sobre validez científica y relevancia práctica, de los potenciales mejores documentos recuperados y su evaluación en profundidad en términos calidad científica, de impacto potencial en las decisiones y curso clínico de la enfermedad y de aplicabilidad al problema clínico en cuestión, y aplicación del nuevo conocimiento a la decisión clínica que originó la pregunta. No es raro que el usuario recupere muy poca o demasiada información, o que ésta sea escasamente adecuada a sus necesidades. En general esto es debido a un planteamiento apresurado o impreciso de una pregunta clínica y su correspondiente estrategia de búsqueda, y a un uso deficiente de la técnica de búsqueda propiamente dicha. La experiencia de los profesionales de la documentación es que los médicos y los profesionales de la sanidad no conocen bien las técnicas de uso de las bases de datos bibliográficas, y que la elaboración de una buena estrategia de búsqueda es un ejercicio interactivo que va refinando el perfil de búsqueda a medida que se recupera información, y que la búsqueda debe comenzar con la utilización del thesaurus.

El objetivo de este artículo es enseñar al médico el uso del MeSH, la diferencia entre lenguaje libre y lenguaje controlado y su uso apropiado con los operadores correspondientes.

Inicio de página


 

¿Qué es MEDLINE?
Se trata de una de las bases de datos bibliográfica que componen MEDLARS (Medical Literature Analysis Retrieval System), elaborada por la Biblioteca Nacional de Medicina (National Library of Medicine) de Estados Unidos y disponible on-line desde 1966. Desde 1975 MEDLINE dispone de resúmenes (abstracts) de un 75% de los más de 9 millones de artículos que componen la base de datos. Son casi 4.000 las revistas científicas indizadas, publicadas en más de 70 países y que cubren los temas de medicina, enfermería, medicina dental, administración y gestión, economía y salud pública. MEDLINE se actualiza con más de 350.000 referencias al año, y es comercializada por varias empresas (Ovid, SilverPlatter, Dialog, Ebsco) que la ofrecen en CD-ROM y a través de INTERNET. Una de las características más especiales es que está indizada siguiendo un thesaurus expresamente elaborado para su mejor utilización, el MeSH del que hablaremos a continuación. Otras bases de datos que también utilizan el MeSH son Aidsline, Aidstrial, Toxline, Bioethics, Cancerline-PDQ, Chemline, Histline, Popline y Health Administration.

En una base de datos cada documento (artículo, informe técnico, capítulo de un libro, etc.) está representado por un registro o una unidad de información, que en el caso de MEDLINE se llama Record. Cada registro está dividido en campos, que configuran diferentes categorías de información, cuyo número varía de unas bases otras. Evidentemente, cuantos más campos tenga una base de datos mayores serán las posibilidades de recuperación del registro y mayor la pertinencia de los resultados obtenidos con una determinada estrategia de búsqueda.

En la mayoría de las bases de datos bibliográficas se pueden hacer consultas con lenguaje libre y con lenguaje controlado. El lenguaje libre permite localizar un determinado término en cualquiera de los campos en que conste dicho término. Una búsqueda con lenguaje libre será tanto más efectiva cuantos más sinónimos del término consigamos reunir. Sin duda la búsqueda de registros relacionados con arteriografía será más completa si incorporamos la palabra angiografía, que, por cierto, es la palabra elegida por los expertos como término del thesaurus. El lenguaje controlado permite localizar en el campo del descriptor las palabras clave incluidas en el thesaurus. Es preciso conocer que ambos tipos de consultas obtienen resultados distintos en términos de precisión y exhaustividad de la búsqueda, y que una estrategia adecuada es usar una combinación de ambos lenguajes.

Inicio de página


 

¿Qué es un thesaurus?
Un thesaurus es una forma de clasificación y de indización de una base de datos. Su base conceptual es el uso de «palabras clave», que forman un vocabulario especializado de palabras semánticamente relacionadas entre sí con una relación jerárquica. El thesaurus ha sido definido como un instrumento de control de la terminología utilizada para transponer a un lenguaje más estricto (lenguaje documental, lenguaje de información) el idioma natural empleado en los documentos como un vocabulario, controlado y dinámico, de términos que tienen entre ellos relaciones semánticas y genéricas y que se aplica a un dominio particular del conocimiento o como una lista estructurada de conceptos, destinados a representar de manera unívoca el contenido de los documentos y de las consultas dentro de un sistema documental determinado, y a ayudar al usuario en la indización de los documentos y de las consultas; los conceptos son extraídos de una lista finita, establecida a priori y sólo los términos que figuran en esta lista pueden ser utilizados para indizar los documentos y las consultas; la ayuda al usuario la proporciona la estructura semántica del thesaurus, fundamentalmente las relaciones de equivalencia, jerarquía y asociación.
Estas definiciones informan de la función de un thesaurus y de sus ventajas en la recuperación de la información. Que cada concepto esté representado por un único término, llamado descriptor, y que cada término represente un único concepto resuelve la práctica totalidad de los problemas de sinonimias (palabras con el mismo sentido pero materialmente diferentes como terapia y tratamiento) y de polisemia o ambigüedad del lenguaje natural, como sería el caso de AIDS, que significa síndrome de inmunodeficiencia adquirida, pero también «ayuda». Un thesaurus debe ser conciso, unívoco, bien estructurado, inteligible y sobre todo capaz de evolucionar con los conceptos que pretende representar. El thesaurus no debe confundirse con un diccionario de sinónimos ni con un índice. Su finalidad es ofrecer descriptores que permitan expresar con la mayor exactitud posible una determinada noción, idea o concepto. En la práctica un thesaurus se representa como un conjunto de términos (palabras clave, descriptores) que cubren un grupo de conceptos determinados. En un thesaurus existen diferentes tipos de términos: términos superiores (genéricos), términos subordinados (específicos) y términos relacionados. Los términos estarán asociados entre ellos mediante una red de relaciones que permite resaltar todo el contenido semántico. Las relaciones entre los términos son de diferentes tipos:

1. Relaciones de sinonimias, que se dan cuando 2 términos pueden ser tomados indistintamente el uno por el otro (enfermo-paciente), o cuando existe simetría (A es sinónimo de B y B sinónimo de A), o cuando existe transitividad (A es sinónimo de B, B es sinónimo de C, y A es sinónimo de C).

2. Relaciones jerárquicas, que introducen una relación de orden (en sentido matemático) entre las palabras claves: término genérico diabetes mellitus, términos específicos insulin-dependent.

3. Relaciones de vecindad, que permiten establecer vínculos entre términos que se pueden asociar mentalmente para dar cuenta de un descriptor: diabetes mellitus insulin-dependent e insulin.

Inicio de página


 

El Medical Subject Headings
El MeSH es el vocabulario controlado o thesaurus de la base de datos MEDLINE. La calidad de la recuperación de la información viene dada por la asignación del término apropiado del thesaurus, al objeto de que la información sea encontrada con precisión y rapidez. El MeSH es reconocido como uno de los thesaurus mejor elaborados y constituye una herramienta fundamental para el uso de las bases de datos de la National Library of Medicine (NLM). Un grupo de expertos, especializados por área, está continuamente revisando y poniendo al día el MeSH bajo la supervisión de indizadores y, con frecuencia, con el consejo de los propios autores del artículo. De esta manera se incorporan continuamente nuevos términos y se eliminan los que van quedando obsoletos. Profesionales de diferentes áreas de la medicina de los más prestigiosos centros son también consultados para mantener al día esta magnífica herramienta. El MeSH se utiliza también en libros, revistas y todo tipo de material audiovisual que componen los fondos de la NLM.
El MeSH se presenta en orden alfabético y en una estructura arbórea o jerárquica. Los conceptos están distribuidos desde los más genéricos («anatomía», «neoplasms») a los más específicos («ankle», «calcitonine»). Existen alrededor de 19.000 términos o encabezamientos mayores o principales, majors (diabetes mellitus) y 800 cualificadores o encabezamientos menores, minors (human, animal, female, male, etc.). Existen además cientos de términos relacionados que ayudan a encontrar los términos más apropiados a nuestra búsqueda: «vitamin C see ascorbic acid».

Inicio de página


 

Descriptores MeSH
Los descriptores MeSH se agrupan en categorías (tabla 1). La categoría A agrupa términos de anatomía referidos tanto a seres humanos como animales. A13 abarca sólo anatomía animal. La categoría B se refiere a organismos vivos. B2 contiene términos para animales, experimentos y estudios en veterinaria. La categoría C agrupa enfermedades tanto experimentales como clínicas. Los términos relativos a una enfermedad se configuran en el siguiente orden: términos precoordinados como órgano/enfermedad («brain diseases», «skin diseases») o como organismo/enfermedad («salmonella infections», «trypanosomiasis»), órgano+término precoordinado u órgano+enfermedad («illeum, intestinal diseases», «conjunctiva, eye diseases»), síndrome+descriptivo («crying cat syndrome»), síndrome+epónimo («Korsakoff syndrome»), infecciones+términos generales precoordinados («Bordetella infections», «HIV-infections»), cáncer: tumor, cáncer y carcinoma son sinónimos; no se especifican diferencias entre tumores benignos y malignos; los tumores se indexan con términos que indican el tipo histológico («carcinoma, basal cell») y con términos que indican el órgano afectado skin neoplasms»). La categoría D agrupa sustancias químicas, endógenas y exógenas. La guía Supplementary Chemical Records (publicada por la NLM) contiene aproximadamente 23.000 términos químicos con sinónimos, efectos farmacológicos, etc. Esta guía es usada por los documentalistas para encontrar términos más específicos para sustancias químicas que aquellos que están disponibles en el MeSH. La categoría E agrupa métodos para diagnóstico, terapéutica y equipamiento técnico, entre otros. Técnicas y métodos se indexan solamente si son la materia principal de un artículo o si son tratados en detalle. Por ejemplo, un artículo que verse sobre el EEG en la epilepsia será indizado como «epilepsy» y «electroencephalography».

Inicio de página


 

Utilización del MeSH
Se puede acceder al thesaurus (MeSH) desde la propia base de datos bibliográfica y puede ser consultado on-line y en CD-ROM en sus diferentes versiones (Ebsco, Ovid, SilverPlatter), y además se puede adquirir en papel en varios formatos: MeSH-Suplemento del Index Medicus (impreso), MeSH-Annotated Alfabetic List, MeSH-Tree Structure y MeSH-Permuted List.
Términos específicos del MeSH Ya hemos referido que el MeSH contiene unos 800 términos menores que son cualificadores de la información y se les denomina términos especiales:   ­ Publication type (pt), que son términos que fueron introducidos en 1991 para definir características de los artículos tales como monografías, revisiones, artículos originales, ensayos clínicos aleatorizados o ensayos a doble ciego (tabla 2).  

­ Check-tags, que son términos que se usan para caracterizar el artículo desde determinadas perspectivas: humans, animals, in vitro, female, male, pregnancy, adolescent, cats, dogs, aged, infant. Existen además child-adolescent-infant-newborn-adult-middle-aged cats-dogs-cattle-rats-chick embryo-rabbits-mice-hmasters-pig human-male-female in vitro animal pregnancy casereport comparative study, English abstract.  

­ Términos geográficos, que incluyen nombres de continentes, países, Estados e incluso ciudades.  

­ Subcabeceras o subheadings. Estos términos específicos se usan para caracterizar el término genérico en sus aspectos más específicamente biomédicos (tabla 3).  

Bibliografía general
Medical Subject Heading. Bethesda: National Library of Medicine, 1994; I.7-I.13.
Pulido M. Index medicus: cobertura y manejo. Med Clin (Barc) 1987; 88: 500-504. Sackett DL, Richardson WS, Rosenberg W, Haynes R.B et al. Evidence-based medicine. How to teach and practice EBM. Londres: Churchill Livingstone, 1997. Spirs user's manual. Versión 2.1. Silverplatter International, Chiswick: 1997. WERTRK. CD-ROM. A new advance in medical information retrieval. JAMA 1986; 256: 3.376-3.378.

Inicio de página


 

TABLA 1. Categorías de descriptores del MeSH


A

Anatomy

B

Animals, organisms, plants

C

Diseases

D

Chemicals, endogenous and exogenous substances

E

Diagnostics, therapeutic and other methods, technical equipment

F

Psychiatry and psychology

G

Biology, biochemistry, genetics, physiology

H

Physics

I

Sociology, education

J

Technology, industry

K

Humanities

L

Information and documentation

M

Occupational groups, ethnic groups, age groups

N

Health care

Z

Geographical terms

 

TABLA 2. Lista de términos que contiene publication type


Academic, Addresses, Analysis, ArticleBibliography

Biography, BriefCases, Classical, Classical-Article

Clinica, Clinical-Conference, Clinical-Trial

Clinical Trial Fhasses I, II, II, Comment

Conference Consensus

Consensus Development Conference

Consensus Development Conference NIH

Controlled, Controlled Clinical Trial

Corrected, Corrected Republished-Article

Development, Directory

Duplicate, Duplicate Publication

Editorial, Erratum, Fests Chrift, Guideline

Historical, Historical Article, Index

Interview, Journal, Journal Article

Lectures, Legal, Legal Brief

Letter, Literature, Meeting, Meeting Report

Meta, Meta-Analysis

Multicase, Multicenter, Multicenter Study

News, NIH, Overall, Periodical. Periodical Index

Phase, Practice, Practice-Guideline

Publication, Published, Published Erratum

Randomized, Randomized Control Trial

Report, Reported, Republished

Retraction

Review, Review Academic, Review Literature

Review Multicase, Review of Reported

Review Tutorial

Study, Technical, Technical Report

Trial, Tutorial

Twin, Twin Study.

 

TABLA 3. Lista de subcabeceras disponibles con el año en que fueron incorporadas al MeSH


AA

Analogs & Derivates

1975

AB

Abnormalities

1966

AD

Administration & Dosage

1966

AE

Adverse effects

1966

AG

Agonists

1995

AH

Anatomy & Histology

1966

AI

Antagonists & Inhibitors

1968

AN

Analysis

1967

BI

Biosynthesis

1966

BL

Blood

1967

BS

Blood supply

1966

CF

Cerebrospinal fluid

1967

CH

Chemistry

1991

CI

Chemical induced

1967

CL

Classification

1966

CN

Congenital

1966

CO

Complications

1966

CS

Chemical synthesis

1968

CT

Contraindications

1991

CY

Cytology

1991

DE

Drug effects

1966

DF

Deficiency

1975

DH

Diet therapy

1975

DI

Diagnosis

1966

DT

Drug therapy

1966

DU

Diagnostic use

1967

EC

Economics

1978

ED

Education

1967

EH

Ethnology

1975

EM

Embriology

1966

EN

Enzymology

1989

ET

Etiology

1966

GD

Growth & Development

1966

GE

Genetics

1978

IM

Immunology

1966

IN

Injuries

1966

IP

Isolation & Purification

1966

IR

Innervation

1966

IS

Instrumentation

1966

LG

Legislation & Jurisprudence

1978

MA

Manpower

1968

ME

Metabolism

1966

MI

Microbiology

1967

MO

Mortality

1967

MT

Methods

1975

PA

Pathology

1966

PC

Prevention & Control

1966

PD

Pharmacology

1988

PH

Physiology

1966

PK

Pharmacokinetics

1988

PO

Poisoning

1966

PP

Physiopathology

1966

PS

Parasitology

1975

PX

Psychology

1978

PY

Pathogenicity

1966

RA

Radiography

1967

RE

Radiation effects

1966

RH

Rehabilitation

1967

RI

Radionuclear imaging

1978

RT

Radiotherapy

1966

SC

Secondary

1980

SD

Supply & Distribution

1968

SE

Secretion

1968

SN

Statistics & Numerical Data

1989

ST

Standards

1968

SU

Surgery

1966

TD

Trends

1978

TH

Therapy

1966

TM

Transmission

1975

TO

Toxicity

1966

TR

Transmission

1975

TU

Therapeutic use

1966

UL

Ultrastructure

1975

UR

Urine

1967

US

Ultrasonography

1991

UT

Utilization

1968

VE

Veterinary

1966

VI

Virology

1995