AI: avgörande för språk?

Artificiell intelligens (AI) kan ha en enorm inverkan på mindre språk – både positiv och negativ. Endast några hundra språk i världen är meningsfullt representerade online och färre än 100 har ett gott stöd i AI-system.

Lingvister och forskare inom digitala rättigheter är alltmer oroade över att många språk kan bli ytterligare hotade om de inte representeras av artificiell intelligens. Den 21 februari är den internationella modersmålsdagen.

Varannan vecka försvinner ett språk och tar med sig ett helt kulturellt och intellektuellt arv. UNESCO uppskattar att det finns 8 324 språk, talade eller tecknade. Av dessa används fortfarande cirka 7 000 språk. Nästan hälften anses vara hotade. AI är inte en orsak till språkens försvinnande, men den kan accelerera befintliga påtryckningar. Det kan finnas en röd linje som avgör om artificiell intelligens kommer att ha en positiv eller negativ inverkan.

En stor bokhylla med böcker
Språk som talas av tiotals miljoner människor är underrepresenterade digitalt. Foto: Anita Miruškina / norden.lv

Isländska: En fallstudie

Isländska talas endast av 350 000 människor. För ett decennium sedan startade entreprenören Vilhjálmur Thorsteinsson startupföretaget Miðeind för att säkerställa att isländska står på lika villkor som större språk inom teknologi och artificiell intelligens. Thorsteinsson säger att Island kan vara för litet rent marknadsmässigt, men att det har vissa fördelar.

– Jag tror att det finns någon sorts röd gräns och om språk på något sätt tar sig över denna röda gräns, då kan vissa verktyg skapas och då kan vi äntra en positiv spiral, säger Thorsteinsson. Om språken däremot på något sätt inte tar sig över denna röda gräns, finns det en risk att den kommer att minska. Det som spelar roll är hur mycket digital data det finns på språket i fråga, så kallad träningsdata. De är den största komponenten i detta, bara den stora mängden av dem. För isländska lyckas vi liksom krypa över den röda gränsen, eftersom det finns tillräckligt med data för att utarbeta dessa verktyg.

AI-toppmötet

Faktum är att utmaningarna med små språk och språklig inkludering i AI stod på agendan vid India AI Impact Summit 2026 i New Delhi (16–20 februari). I sitt tal i samband med mötet betonade FN:s generalsekreterare António Guterres vikten av inkludering.

– AI:s framtid inte kan avgöras av en handfull länder, sa Guterres. AI måste vara tillgänglig för alla.

Flerspråkiga och kontextuella AI-utvärderingar ingår i ett av de globala ramverk som tillkännagavs vid toppmötet. Detta tar upp det faktum att många, om inte de flesta, av världens 7 000 språk är underförsörjda eftersom det mesta av AI för närvarande mestadels är utarbetat och optimerat för engelska och ett fåtal andra språk.

Isländska tidningar
Isländska tidningar. Stark medienärvaro online är viktig för att språk ska kunna inkluderas i artificiell intelligens. Foto: Eivind Sætre/norden.org

Digital närvaro är viktig

Internets fotavtryck är en viktig faktor när det gäller att språk ska kunna inkluderas i AI, vilket återigen kan vara avgörande för deras överlevnad. Om de inte integreras i AI-ekosystem kan talare i allt högre grad förlita sig på engelska, franska, arabiska etc. för sitt digitala liv. Detta gäller inte bara för små språk utan även för språk som talas av miljontals människor.

Språk som är digitalt underrepresenterade och därför sårbara inkluderar afrikanska språk som oromo (35–40 miljoner talare), igbo (30 miljoner) och hausa (över 50 miljoner). I Asien är siffrorna ännu större: javanesiska (över 80 miljoner), bhojpuri (över 50 miljoner), sundanesiska (40 miljoner) och pashto (40–50 miljoner).

Fördelar med starka onlinemedier

När det gäller isländska kommer informationen från olika källor, inklusive en betydande närvaro av nyhetsmedier online och ett starkt isländskt Wikipedia, samt statligt sponsrade språkteknikprogram. Vilhjálmsson tror att modern teknik kommer att gynna de språk som ligger på rätt sida av den röda linjen, men kan vara skadlig för andra.

– Faran är att samiska eller grönländska eller andra liknande mindre språk inte når denna gräns, eftersom de inte har tillräckligt med data, påpekar Thorsteinsson.

Ett par i färgglad miljö
Bröllopsceremoni på Java. Javanesiska används lite digitalt. Foto:
Oyonraiman/Creative Commons Attribution-Share Alike 4.0

Företag kan glida mot större språk

När språk saknas i AI-verktyg (översättningssystem, röstassistenter, sökmotorer, utbildningsappar etc.) kan talare växla mot mer ”digitalt kraftfulla” språk av ekonomiska och sociala skäl. Med tiden kan detta påskynda språkets nedgång. Vilhjálmur Thorsteinsson var väl medveten om denna fara när han startade sitt företag för ett decennium sedan.

– Det fanns verkligen en risk att folk helt enkelt skulle frestas att byta till engelska för att kunna använda dessa verktyg. Företag började se fördelarna med att ha sina affärsprocesser på engelska för att kunna använda denna teknik. Vi såg en definitiv möjlighet och behöver försöka göra något åt ​​detta och stärka isländskans position i detta avseende. Lyckligtvis hade mycket förberedande arbete gjorts med att samla in digital data. När tekniken är tillräckligt bra och börjar fungera för isländska kan detta stärka språket.

Sårbara grupper kan gynnas

Språkteknologin och AI gynnar företag men även vissa sociala grupper, inklusive vissa som är sårbara. Thorsteinsson pekar ut råd för dyslektiker och personer som har isländska som andraspråk. ”Detta motverkar fördomar”, säger han.

Internationella modersmålsdagen firas varje år för att främja språklig och kulturell mångfald och flerspråkighet. Dessutom har FN:s generalförsamling, A/RES/61/266, uppmanat medlemsstaterna att ”främja bevarandet och skyddet av alla språk som används av världens folk”.

Senaste artiklar