Fra bog til skærm
Ordbog over det danske Sprog er i sin trykte form et pladskrævende (1,5 hyldemeter) og alene pga. oplysningernes mængde og karakter ikke ganske lettilgængeligt værk. Til gengæld er ODS helt uomgængelig for den der er interesseret i det danske sprog i den periode ordbogen dækker.
Det er altså oplagt at gøre værket tilgængeligt for alle der interesserer sig for det danske sprog – tilmed i en lettilgængelig form der ikke fylder noget. Derfor har Det Danske Sprog- og Litteraturselskab (DSL) besluttet at digitalisere værket og lægge det ud på nettet som første del af projektet ordnet.dk. Netudgaven af ODS vil være gratis tilgængelig så længe projektet er i gang, dvs. i hvert fald til og med 2009.
Digitalisering
Den digitale version af ODS er blevet til i samarbejde med Kompetenzzentrum für elektronische Erschließungs- und Publikationsverfahren in den Geisteswissenschaften, en afdeling ved universitetet i Trier. Denne afdeling stod også for digitaliseringen af Grimms ordbog, idet den store tyske nationalordbog blev tastet ind i Nanjing i Kina af firmaet TQY Doublekey.
Efter at have besøgt universitetet i Trier i maj 2004 besluttede ordnet.dk's redaktion at digitaliseringen af ODS skulle virkeliggøres efter de samme overordnede principper der havde været gældende for digitaliseringen af Grimms ordbog. Ideen om at skanne ODS ind blev hurtigt forkastet fordi de mange diakritiske tegn, symboler, forskellige skriftsnit i værket – antikva, kursiv, fed skrift, spatieret skrift osv. – ville føre til så mange fejl at det ville blive nødvendigt med en resursekrævende korrekturlæsning af hele den skannede ordbog. Svenska Akademiens Ordboks erfaringer med skanning af et lignende værk fristede ikke til en gentagelse.
Forløbet
Digitaliseringen forløb på følgende måde:1. fase:
De 28 ODS-bind blev sendt til Kina først på sommeren 2004. Det kinesiske firma indtastede to uafhængige versioner vha. et almindeligt tekstbehandlingsprogram (Word). Dette arbejde blev afsluttet i foråret 2005 og tog altså under et år.
2. fase:
Tekstbehandingsfilerne blev sendt til Trier, hvor Kompetenzzentrum lavede en sammenkøring og tilretning af de to versioner. De tekstlinjer der indeholdt tvivlstilfælde, blev isoleret og sendt til kontrol hos DSL, der rettede dem manuelt. Resultatet fra Trier er typografisk opmærkede tekstfiler.
3. fase:
De typografiske filer skal konverteres til et strukturopmærket xml-format hvor de forskellige betydningselementer i en ordbogsartikel er genkendt. Dette arbejde er påbegyndt, men stadig langt fra færdigt. Som et første skridt har vi konverteret ordbogen til en simpel html-version som nu er tilgængelig på nettet. Slå op i ODS.
Læs mere om de fremtidige planer for ODS på nettet.