Grazie a un algoritmo, Wikipedia in tutte le lingue

Un algoritmo progettato per scansiona Wikipedia in cerca di articoli importanti che non sono ancora stati tradotti in altre lingue. In questo modo, l’enciclopedia online potrà espandersi e dare una maggiore copertura anche alle minoranze linguistiche. Messo a punto nel Politecnico di Losann da Robert West, ricercatore del Data Science Lab.

Per i redattori di Wikipedia è difficile capire da dove cominciare il lavoro di traduzione ed è qui che entra in gioco l’algoritmo, capace di identificare e mette in ordine d’importanza gli articoli per ogni lingua: un compito non semplice, considerando che, con 40 milioni di articoli in 293 lingue, Wikipedia è l’enciclopedia più grande mai realizzata. La lingua inglese è senza dubbio la più avvantaggiata, con 5.4 milioni di pagine che coprono una quantità di argomenti 60 volte superiore a quella trattata nell’Enciclopedia Britannica.

Ma non tutti gli idiomi possono disporre di una copertura cosi’ ampia: “per esempio, il riscaldamento globale è di interesse cruciale in Madagascar, eppure non c’è neanche un articolo su quest’argomento in malgascio”, afferma West. Per aiutare le macchine a capire quanto sia importante un articolo per una determinata lingua è stato necessario calcolare quante visualizzazioni teoriche potrebbe avere.

I ricercatori hanno fatto la stima prendendo in considerazione tutte le lingue e lasciando poi alla macchina il compito di dare ad ognuna il giusto peso. Ad esempio, il giapponese è più importante dell’inglese se si tratta di predire l’impatto di una pagina in cinese. Alla fine, la lista di argomenti mancanti appare su una nuova piattaforma, chiamata Wikipedia GapFinder, da dove i redattori completano il lavoro facendo la traduzione. (ANSA)

You may also like...