Exploración de la representación de materia y género en los metadatos bibliográficos de obras de ficción para niños y jóvenes adultos
Exploration of subject and genre representation in bibliographic metadata representing works of fiction for children and young adults
Vyacheslav Zavalin
Cataloging & classification quarterly, ISSN 1544-4554, Vol. 61, n. 1, 2023, p. 47-66
Este estudio examina la representación de materia y género en los metadatos que describen los recursos de información creados para obras dirigidas a niños y jóvenes adultos. Se aplicaron métodos cuantitativos y cualitativos para el análisis de 688 registros de WorldCat recolectados en 2021, en los que contribuyó el Children’s and Young Adults’ Cataloging Program (CYAC) de la Library of Congress y que habían sido creados en años anteriores por varias instituciones miembros de la OCLC. Para el análisis de los datos se usó una combinación de herramientas computacionales y minería de datos, y se incluyó el examen de diversos niveles de aplicación que incluyeron: elementos de datos para la representación de género (el campo MARC 655 y sus subcampos); elementos de datos para la representación de materias (campos no-655 y subcampos, y algunos campos y subcampos 01X-09X); sistemas de organización del conocimiento tales como esquemas de clasificación; vocabularios controlados de materia; y vocabularios controlados para representación de género. El análisis de los datos fue semiautomático, con la ayuda de herramientas como MarcEdit, PowerGREP, PyMARC, y Python Pandas. Los resultados mostraron que siempre se usa uno o más sistemas de clasificación para acceder a los registros. La mayoría incluyen signaturas basadas en el sistema de clasificación Dewey (DDC). Las signaturas basadas en la Library of Congress Classification (LCC) también estaban presentes en todos los registros menos en uno. Casi todos los campos MARC 6XX de materia y género se observaron en el conjunto de datos. Esto incluye el campo 655 de género/forma, pero también el 600 de Nombre Personal, 610 de Nombre Corporativo, etc., con una media de 6,3 campos utilizados. También se detectó la utilización de 20 vocabularios controlados para términos de género en los campos 655. El vocabulario más ampliamente utilizado fue Faceted Application of Subject Terminology (FAST), que se suele asignar de manera automática. FAST fue seguido del Library of Congress Genre/Form Terms for Library and Archival Materials (LCGFT). En los campos no-655, como era de esperar, el vocabulario controlado más usado fue Children’s Subject Headings (CSH) de la Library of Congress. También estuvieron muy presentes Sears y BISAC. Los resultados muestran que los metadatos desarrollados por CYAC, llevados a la práctica por los miembros de OCLC en la base de datos WorldCat, proporcionan una amplia representación de género y materias a través de la inclusión de 19 campos de metadatos que facilitan el acceso.