Introductie

Welkom op de homepagina van Learning Lion #

Wat is Learning Lion? #

LearningLion is een onderzoeksproject van het innovatieteam van SSC-ICT, waarbij het experiment en het leerproces centraal staan. Er wordt onderzoek gedaan naar de verantwoorde inzet van generatieve AI binnen de overheid. Veel medewerkers binnen de overheid maken gebruik van generatieve AI-toepassingen zoals ChatGPT voor routine taken als het samenvatten van documenten en het opstellen van e-mails. Dit brengt risico’s met zich mee op het gebied van dataprivacy, maar toont ook een groeiende behoefte aan AI-tools binnen overheidsinstellingen, en roept vragen op rondom het verantwoord inzetten van AI. Als onderdeel van ons experiment werken we aan een Minimun Viable Product (MVP) en verschillende use cases.

LearningLion werkt volgens het belangrijke principe: working in the open. Dit betekent dat ons werkproces en onze experimenten volledig inzichtelijk en openbaar zijn. Dit doen we enerzijds door updates te plaatsen op deze website en anderzijds door open-source te werken middels onze github. Dit versterkt niet alleen de transparantie van ons onderzoek, maar biedt ook de mogelijkheid voor externen om mee te denken of zich bij ons aan te sluiten. Door zo openlijk mogelijk over ons onderzoek te rapporteren, hopen we niet alleen een kennisplatform te zijn over (generatieve) AI, maar ook geïnteresseerden (binnen of buiten de Rijksoverheid) aan te trekken die wellicht kunnen meedenken. Een belangrijke voorwaarde hiervoor is dat we niet alleen delen wat er allemaal goed gaat en welke stappen we al hebben genomen, maar juist ook te delen waar de moeilijkheden en pijnpunten in zitten.

Daarnaast zijn er nog twee belangrijke uitgangspunten waar LearningLion zich op baseert: lokaal en open source. Het systeem dat wij als onderdeel van het experiment opzetten moet uiteindelijk volledig lokaal draaien. Dit betekent dat alle gegevens binnen de beveiligde netwerken van de overheid blijven en voldoen aan de vereiste regelgeving op het gebied van gegevensbescherming. Daarnaast maken wij enkel gebruik van open-source modellen.

Het MVP maakt gebruik van Retrieval-Augmented Generation (RAG). Middels RAG kunnen grote hoeveelheden documenten worden doorzocht en geïnterpreteerd. Middels een query van de gebruiker wordt er in een database gezocht naar semantisch relevante documenten. Deze worden als context meegegeven aan een LLM die een antwoord op de query genereert. Gebruikers krijgen hierbij altijd te zien op basis van welke documenten het antwoord is gebaseerd. Dit verhoogt de betrouwbaarheid en daarmee de bruikbaarheid voor ambtenaren. Hallucinatie is hiermee makkelijker op te sporen.

Find us on Github