In quest’articolo –https://memorabilmente.com/corpora-paralleli-imparare-una-lingua-a-ritroso/– ho esposto le motivazioni per cui vale la pena investire un po’ di tempo nello studio dei sottotitoli. 

Che si tratti di un film o di una serie TV, l’uso dei sottotitoli a posteriori è un’esperienza didattica potentissima per imparare una lingua in modo non convenzionale sfruttando le potenzialità di ciò che viene definito corpus parallelo. 

Di che cosa si tratta?

È semplicemente una raccolta di materiale linguistico in formato digitale che consente di vedere le parole nel loro contesto d’uso. 

Parallelo significa che al testo originale è affiancata la traduzione corrispondente in un’altra lingua.

Ora vediamo come come costruire un corpus parallelo usando i sottotitoli di un film che ho rivisto di recente e che adoro: The Imitation Game. 

Prima di procedere ci servono due programmi al momento disponibili solo in ambiente Windows- Subtitle Edit e Alignment Editor- che potete scaricare gratuitamente ai seguenti indirizzi web:

https://subtitle-edit.it.uptodown.com/windows
https://sourceforge.net/projects/aligner/

Passaggio 1

Nel sito https://www.opensubtitles.org cerco il film o l’episodio della serie di cui voglio scaricare i sottotitoli.

Nel mio caso cerco i sottotitoli in italiano (Lingua di arrivo) e tedesco (Lingua di partenza). Saranno queste due lingue a costituire il mio corpus parallelo.

Passaggio 2

Apro il file contenente i sottotitoli in formato SRT della lingua di partenza- nel mio caso il tedesco- usando il programma Subtitle Edit.

Passaggio 3

Esporto il testo in formato plain text

A questo punto si apre la seguente maschera dove si definiscono le caratteristiche di formattazione (seleziono unbreak lines) e la tipologia di codifica del testo (UTF-8 with BOM).

Dopo aver cliccato su Save as, il programma genera un nuovo file di testo contenente i sottotitoli. 

Passaggio 4 

Ripeto i passaggi 2 e 3 con il file SRT contenente i sottotitoli nella lingua di arrivo- nel mio caso l’italiano- 

Passaggio 5

A questo punto mi trovo con due file di testo, uno nella lingua di partenza e l’altro nella lingua di arrivo, che dovranno essere allineati. 

Quindi avvio Alignment Editor e seleziono come di file di input la prima opzione.

Passaggio 6 

Seleziono le due lingue di lavoro come richiesto dal passaggio successivo:

A questo punto seleziono i due file di testo precedentemente esportati. 

Se la procedura va a buon fine, si apre la seguente finestra. 

Dopo aver cliccato su next, il programma chiede di scegliere il file di output desiderato. 

Seleziono la seconda opzione “Generate an xls and open it for reviewing”.

Il programma genera un file XLS avente due colonne corrispondenti alle due lingue e tante righe quante sono le battute della sceneggiatura. 

Probabilmente l’allineamento non sarà perfetto e sarà necessario intervenire “manualmente” per fare in modo che le battute corrispondano nella lingua di partenza e di arrivo.