Dit artikel achter de schermen is in samenwerking met de National Science Foundation aan WordsSideKick.com geleverd.
Ik moet van de Cubbies houden. Dankzij hen is een database met audio-opnames van het Amerikaanse Hooggerechtshof nu gratis beschikbaar voor het publiek. Te veel rek? Niet echt, want de tool is ontstaan uit de liefde van één man voor de Chicago Cubs, technologie en de studie van rechten.
Op een zonnige middag op Wrigley Field, 20 jaar geleden, zat Jerry Goldman, destijds hoogleraar politicologie aan de Northwestern University, in de tribune te genieten van een spel met een paar studenten. Ze overwogen hoe honkbal een metafoor is voor het Amerikaanse Hooggerechtshof: negen spelers, negen rechters. Eén game draait op geweldige velden en geweldige vangsten; de andere over mondelinge argumenten en doordachte uitspraken.
Als honkbalkaarten essentiële details over de carrière van een speler uitlegden, dacht Goldman, waarom zou je dan geen kaarten maken voor de rechters en video en audio toevoegen? Het project leek haalbaar, gezien de komst van HyperCard, een applicatie en programmeertool voor vroege Apple-computers. 'Mijn collega's dachten dat ik gek was', zegt Goldman, nu professor aan het Illinois Institute of Technology (IIT) Chicago-Kent College of Law. 'Maar ik dacht dat informatietechnologie de manier waarop de wereld werkte zou veranderen.'
De zoektocht van Goldman om 'het Hooggerechtshof echt te vermenselijken' leidde tot de ontwikkeling van het door NSF gefinancierde Oyez Project, een multimedia-archief met een doorzoekbare schat aan mondelinge argumenten die de rechtbank sinds 1955 heeft gehoord. Een app voor mobiele apparaten, ISCOTUSnu is ook beschikbaar.
'Het belangrijkste doel was om de rechtbank van de hoge status te halen en openbaar te maken', zegt Goldman. "We wilden ook de enorme hoeveelheid gegevens die bij de rechtbank horen, beschikbaar stellen."
Doorzoekbare audio en video maken
Om het Hooggerechtshof tot leven te wekken, overtuigde Goldman eerst het Nationaal Archief, dat de audiobestanden van de rechtbank opslaat, om hem in staat te stellen de banden te kopiëren voor transcriptie en digitalisering. Om de nieuw gedigitaliseerde geluidsbanden doorzoekbaar te maken, werkte Goldman samen met Mark Liberman, een professor computationele taalkunde aan de Universiteit van Pennsylvania. Liberman heeft een algoritme aangepast dat geluiden op geluidsbanden kan matchen met geschreven transcripties. Dit werk leidde uiteindelijk tot de ontwikkeling van de Penn Forced Aligner, een tool die nu algemeen wordt gebruikt om gesproken geluiden af te stemmen op geschreven tekst.
'We hebben in wezen een Google-achtige zoekmachine gemaakt voor audio- en video-opnamen', zegt Liberman, die zich aangetrokken voelde tot de taak vanwege de waarde van de archieven voor wetenschappers en het publiek. Hij was ook verheugd over de mogelijkheid om een zoektechniek te creëren die van toepassing is op de groeiende collecties audio- en video-opnamen die beschikbaar zijn uit een groot aantal bronnen.
“We waren in staat om een model op te zetten voor het benaderen van zoekopdrachten op een kosteneffectieve manier. Dit lijkt misschien een groot project, maar het is klein in vergelijking met wat nu online beschikbaar is en wat in de toekomst zal zijn, ”zegt Liberman.
(Onlangs gebruikten Libermans collega's van Oxford University en de British Library de uitlijningstools om opnames van het British National Corpus te ontcijferen, een archief met een gesproken gedeelte van 100 miljoen woorden verzameld van deelnemers die hun toespraak op Sony Walkmans hadden opgenomen.)
Analyse van de gegevens
Vervolgens analyseerde Goldman bijna 14.000 uur audio van mondelinge argumenten van het Hooggerechtshof. 'Je kunt talloze vragen stellen over de dataset', zegt hij. "Dit is echter een ongebruikelijke dataset, omdat deze meerdere sprekers heeft en spontaan is." Een van de eerste taken was het identificeren van elke spreker in elk mondeling argument - een uitdaging, aangezien ongeveer 11 sprekers bij een argument betrokken konden zijn. Bovendien hebben de transcripties jarenlang geen vragen met de namen van justitie getagd.
Terwijl hij deze uitdagingen aanging, verzamelden Goldman en zijn medewerkers - waaronder collega's van Carnegie Mellon University en de University of Minnesota - een aantal interessante feiten over de werking van de rechtbank sinds 1955:
- 32 rechters over 58 jaar
- 8.600 advocaten, van wie 70 procent slechts eenmaal voor de rechtbank is verschenen
- 66 miljoen woorden gesproken
- Meer dan 6.100 zaken en meer dan 2.300 opiniemeldingen
- Langste argument - 1300 minuten
- Kortste argument - 14 minuten
Justitie Antonin Scalia, die 27 jaar op het veld heeft gezeten, houdt het record voor de meest spraakzame, met 7.200 minuten, terwijl Felix Frankfurter, die 23,5 jaar diende, op een goede tweede komt met 7.000 minuten. De meest ingetogen rechters zijn Sherman Minton en Clarence Thomas. Hoewel Minton zeven jaar op het veld heeft gediend, staat alleen zijn laatste jaar op het programma. Tijdens zijn laatste termijn wordt hij slechts 17 minuten gehoord. Thomas, op de baan sinds 1991, klokt binnen op 23 minuten.
Terwijl het Oyez-project juridische wetenschappers een schat aan materiaal biedt om te mijnen, analyseren taalwetenschappers ook de opnames voor verschillende studies.
De rechtbank naar de mensen brengen
Om ervoor te zorgen dat het publiek en academici de gegevens gemakkelijk kunnen onderzoeken, blijft het team van Goldman verfijningen aanbrengen en de interface ontwikkelen. In het najaar van 2013 zullen zoekmogelijkheden aan het datasysteem worden toegevoegd om gebruikers te helpen dieper in het materiaal te duiken. Met deze nieuwe zoekfunctie kunnen gebruikers bijvoorbeeld 'zoeken op de term' strikte controle ', deze in het transcript bekijken, ernaar luisteren en vervolgens doen wat luisteraars ermee willen doen', legt Goldman uit.
Chicagoans zeggen graag: "Maak geen kleine plannen." Goldman is trouw aan deze verklaring. Hij wil de in het Supreme Court-project ontwikkelde instrumenten toepassen op alle Amerikaanse beroepsinstanties. Het plan is om websites en applicaties voor mobiele apparaten te ontwikkelen. Onlangs heeft de Knight Foundation het Oyez-project $ 600.000 toegekend om dit werk uit te voeren voor de hooggerechtshoven van de staat in Californië, Florida, Illinois, New York en Texas.
'De apps zijn het coolste', zegt Goldman. Ze volgen het ontwerp van ISCOTUSnu, een samenwerking tussen Goldman en Caroline Shapiro, ook een professor aan het IIT Chicago-Kent College of Law. ISCOTUSnu biedt toegang tot alles op de huidige rol van het Hooggerechtshof, inclusief audio en transcripties. Met een simpele beweging kan een gebruiker door een transcript bladeren, het doorzoeken en een sectie delen met collega's. "Het beste gedeelte?" zegt Goldman. 'Al deze informatie is gratis.'
De omvang van het Oyez-project was er een die Goldman zich nooit had voorgesteld. 'Zonder NSF-steun zouden we nog steeds worstelen', zegt hij. 'De steun van de NSF gaf me de moed om geen kleine gedachten te bedenken.'
Opmerking van de uitgever: De onderzoekers afgebeeld in Behind the Scenes-artikelen zijn ondersteund door de Nationale Wetenschaps Instituut, de federale instantie belast met de financiering van fundamenteel onderzoek en onderwijs op alle gebieden van wetenschap en techniek. Alle meningen, bevindingen en conclusies of aanbevelingen in dit materiaal zijn die van de auteur en weerspiegelen niet noodzakelijk de opvattingen van de National Science Foundation. Zie de Archief achter de schermen.