editie 17 / september 2005

Auteursnamen in Gris; geschriften repartitie informatie systeem

Zes jaar geleden, toen ik in dienst trad van Cedar, maakte ik kennis met GRIS. In het geheel niet gehinderd door enig kennis van informatietechnologie, laat staan door enige kennis van welke database dan ook, brak me al spoedig het koude zweet uit bij het lezen van het Handboek voor Mutaties, de handleiding voor het bedienen van het programma. Deze database pretendeerde alle werken van schrijvers en vertalers uit binnen- en buitenland die in Nederlandse openbare bibliotheken worden uitgeleend, vanaf 1997 bij te houden, inclusief de 16 à 17.000 titels die er elk jaar bijkomen, en die te koppelen aan een betalingssysteem. Onbegonnen of op zijn minst monnikenwerk, zo leek het.

Ik werd aangenomen om mijn kennis van het boekenvak met de specifieke opdracht om namen van auteurs te matchen met boektitels, waarna in dit megabestand namen en adressen werden gekoppeld aan een betalingssysteem. Het was dus zaak om de juiste gegevens in het systeem in te brengen, een systeem dat op dat moment ernstig tekort schoot in volledigheid en accuraatheid. 

Brinkman

GRIS was aanvankelijk opgebouwd uit een aantal bestanden: één afkomstig van het toenmalige Ministerie van OC&W dat oeuvrelijsten van een aantal voornamelijk literaire auteurs en vertalers had geleverd, aangevuld met de bibliografische gegevens en uitleencijfers van titels die de openbare bibliotheken zelf leverden, en daarbij nog de kolossale stapel fotokopieën van colofons die elke schrijver toen moest opsturen. Met die fotokopieën werd de juistheid van de gegevens geverifieerd. Die moesten wel allemaal handmatig in het systeem worden ingevoerd. 

Er was anno 1999 geen andere onafhankelijk bron om te controleren hoe het zat met die gegevens. Het werd me gauw duidelijk dat Gods wegen al even ondoorgrondelijk leken te zijn als die van het GRIS. In overleg met mijn toenmalig cluster coördinator Maureen Arnhem had ik besloten een pro-actieve houding aan te nemen bij het opschonen van het GRIS-bestand. Zodoende vroegen mijn ook uit het boekenvak afkomstige collega Bart Schomaker en ik ons in de zomer van 1999 af of er niet een exemplaar van Brinkman’s Cumulatieve Index voorhanden was. Ik als voormalig redacteur/uitgever en hij als boekhandelaar hadden dit naslagwerk regelmatig gebruikt bij het opsporen van bepaalde titels - meestal om na te gaan welke nog leverbaar waren. Op dat moment had niemand op de werkvloer er nog van gehoord. Er werd uitgezocht hoe dat zat en al snel bleek dat wat vroeger een groot in zwart leer gebonden boekwerk met goudopdruk was, nu op cd-rom beschikbaar was en wel in een MS-DOS-format. Aanvankelijk schafte LIRA de eerste cd-rom-schijven aan met titels vanaf 1980 tot 1999. Dat bestand werd aanvankelijk op een stand-alone computer geïnstalleerd en diende - zo men wil - als een soort schaduwbestand voor GRIS. Het bevatte een goudmijn aan gegevens die geraadpleegd konden worden om verbeteringen in onze eigen database aan te brengen. Het werd dan ook tijdens de repartitieperiode bij het nakijken en corrigeren van de teruggestuurde controle-specificaties door alle bureaumedewerkers driftig gebruikt. In de loop van 2001 werd Brinkman als Windows-systeem geleverd en kon het bestand rechtstreeks op ons netwerk worden aangesloten. 

Werden in 1998 nog zo’n 3.000 controlespecificaties ter correctie teruggestuurd, al gauw daalde dat aantal jaarlijks gestaag tot onder de 2.000. Ook de hoeveelheid correcties die per teruggestuurde controle-specificaties moesten worden aangebracht, werd steeds minder. Thans worden jaarlijks zo’n 15.000 uitbetalingsspecificaties aan Nederlandstalige schrijvers en vertalers toegestuurd. 

Controleren en opschonen

De eerste CAT- of zo men wil MRI-scans - die het GRIS-brein van binnenuit moesten verkennen,  werden uitgevoerd met behulp van een “business report” programma en later met wat thans “crystal reports”  heet. Het betrof de top-100 van de uitgeleende titels in het bestand, later de top-100 van de uitgeleende auteurs, toen de top-200 en uiteindelijk kwam er een lijst van alle in het GRIS-bestand opgenomen auteurs die elk meer dan 10.000 uitleningen op hun naam hadden staan. Al deze lijsten werden handmatig nagekeken om te zien of de percentages van hun aandeel klopten, en in het geval van een buitenlandse auteur: of de vertaler en diens aandeel ook juist waren. Alles bij elkaar leverde dit een lijst op met zo’n 2.800 namen. 

Veel van de meest uitgeleende schrijvers waren buitenlanders en daar kwamen dus veel vertalers aan te pas. Een auteur kon meerdere vertalers hebben, en als de vertaler gevonden werd, kon de vertaler ook verscheidene titels op zijn of haar naam hebben staan. Zodoende was er een soort olievlek ontstaan. Dat wil zeggen, bij het handmatig behandelen en corrigeren van de gegevens werden er vaak veel meer namen ontdekt die niet goed in GRIS vermeld stonden. De vertaler werd er soms bij vermeld, soms niet; soms klopten de percentages of de aandelen niet. Met het gebruik van Brinkman kon worden geverifieerd wie wat had gedaan. Die 2.800 namen leverden ongeveer 18.000 tot 20.000 verbeteringen op in het bestand. Het doornemen en verwerken van deze lijst heeft anderhalf jaar in beslag genomen. 

De achterliggende gedachte was om te beginnen met datgene op te schonen in GRIS waar de meeste uitleningen mee waren gemoeid. Deze actie had tot resultaat dat veel fouten in ouder werk en in klassieke titels werden gecorrigeerd. Ook leverde dat een lijst op van voornamelijk vertalers die in het adressenbestand onbekend waren en werk hadden geleverd tussen 1975-1990. Hoe recenter de titel, des te meer kans dat de vertaler had zich al bij Lira had aangemeld. Hieruit kon een zogenaamde opsporingslijst gedestilleerd worden die onder de hoede kwam van Odile van der Tweel. Doel was: de NAW-gegeven in GRIS uitbreiden en opschonen. 

Buitenlandse Auteurs in GRIS  

Een logische volgende stap was het in kaart brengen van de buitenlandse auteurs in GRIS die  verantwoordelijk waren voor een niet onzienlijk deel van de uitleningen. Met het oog op toekomstige en huidige wederkerigheidscontracten met buitenlandse zusterorganisaties is het interessant om te weten welke buitenlandse auteurs in GRIS opgenomen zijn en dus uitgeleend worden door de Nederlandse openbare bibliotheken. Hierbij bleek Brinkman opnieuw een goede bron om lijsten te genereren die vergeleken konden worden met wat al in GRIS vermeld stond.

Brinkman kent een rubriek in zijn index die Taal van origineel heet. Deze rubriek bevat per taal de namen van auteurs en titels die vertaald zijn in het Nederlands en die aanwezig zijn in de Koninklijke Bibliotheek. We hebben een lijst in Excel gegenereerd met de namen van die auteurs en die vergeleken met namen die al in GRIS stonden. In het geval van Frans, Duits en Engels (de meeste gelezen buitenlandse talen in het origineel zowel als in vertaling) troffen we ook schrijvers in GRIS aan die inderdaad uitgeleend waren in de oorspronkelijke taal. 

Inmiddels zijn er iets meer dan 35.000 buitenlandse auteurs geïdentificeerd in het GRIS-bestand, verdeeld over 33 talen. Het zal niemand verbazen dat het grootste aantal afkomstig is uit het Engels (25. 859), gevolgd door het Duits (4.435) en het Frans (2.519).

Scott Rollins, medewerker van Lira
tekst geredigeerd door Bart Schomaker

Lijst van buitenlandse talen met daarin werkzame auteurs zoals deze voorkomen in het GRIS-bestand, in volgorde van aantal:

01  Engels – 25859
02. Duits – 4435
03. Frans - 2519
04. Italiaans – 485
05. Spaans – 331
06. Zweeds -  327
07. Deens – 207
08. Russisch – 181
09. Noors – 115
10. Tsjechisch – 93
11. Chinees – 91
12. Japans – 89
13. Portugees – 79
14. Arabische – 62
15. Hebreeuws – 56
16. Turks – 51
17. Afrikaans – 42
18  Hongaars – 41
19  Grieks – 36
20. Servo-Kroatisch – 26
21. Catalaans – 25
22. Fins – 23
23. Indonesisch – 18
24. Hindi – 17
25. Perzische – 17
26. Jiddisch – 14
27. Tibetaans – 12
28. Roemeens – 10
29. Vietnamees – 6
30. Koreaans - 4
31. Sloveens - 4
32. Slovaaks - 3
33. Albanees - 3