Help

Difference between revisions of "List translation"

List translation is the process, when no relevant wordlist exist an a target language (L2), to take a relevant existing list in a larger language spoken by that community (L1), and to efficiently translate that list into your target language (L2). This process is both highly efficient, yet biased and technical. This page guides a willing lexicographer to properly translate a list for LinguaLibre. This page takes for case study a Portugese list translated into Amazona's .

(Created page with "Bonjour à tous, Cet email fait le point sur l'aspect technique de la traduction de la liste de vocabulaire Portugais vers le Surui. ;Liste à traduire Voici là liste de vo...")
 
m
Line 1: Line 1:
Bonjour à tous,
+
{{#SUBTITLE:'''List translation''' is the process, when no relevant wordlist exist an a target language (L2), to take a relevant existing list in a larger language spoken by that community (L1), and to efficiently translate that list into your target language (L2). This process is both highly efficient, yet biased and technical. This page guides a willing lexicographer to properly translate a list for LinguaLibre. This page takes for case study a Portugese list translated into Amazona's [[:en:Surui language|Surui language]].}}
 +
{{draft|}}
  
Cet email fait le point sur l'aspect technique de la traduction de la liste de vocabulaire Portugais vers le Surui.
 
  
;Liste à traduire
+
== Community ==
Voici là liste de vocabulaire des mots portuguais les plus utilisés, en commençant par les plus fréquents (=les plus utiles) :
+
In this case study, the community we work with here is the [[Surui people]], located in North-Western Amazonia.
 +
<br>It's a small population of 30 Amazonia forest's villages and '''1,600 native speakers'''.
 +
<br>The languages they speak is Surui and Portugese, the national language of Brazil, at various levels.
 +
<br>Westernization is radically changing daily practices, culture and language.
  
* [[List:Sru/words-by-frequency-00001-to-02000|List:Sru/words-by-frequency-00001-to-02000]] - les 2000 mots portugais les plus utilisés à traduire en Surui.
+
Almir Surui, their elected chief, has been contacted and is willing to lead such effort.<br>
 +
Recent effort to preserve and revitalize their language are underway : they recently normalized Surui language's writing, elementary school is in Surui language, with associated new books.
  
Votre équipe de traducteurs devra trouver un mode d'édition pour cette :
+
There is no existing wordlist to reuse to record in Lingualibre.
* en ligne via le button "EDIT" ou "EDITER" ou "EDITAR" (il faut créer un compte Wikipedia)
 
* hors ligne.
 
  
;Specificités linguistiques et phases de création
+
== Identify your source ==
Le Surui étant très différent du Portugais, on peut avancer par phases :
+
Given their second language is Portugese…
* 1ère phase : cette traduction du portuguais au Surui est adapté à un premier effort massif, afin de produire 90% du vocabulaire courrant.
+
<br>Given academic researches recommending word list sorted by frequency…
* 2nd phase : il conviendra naturellement de compléter ces liste portugo-centrées par du lexique et des concepts spécifique au Surui et son environement. Ce complément est un travail de nature différente.
+
<br>And given we have such list in Portugese…
 +
<br>We will work with Surui natives to translate such Portuguese list into Surui :
  
Qualitativement, ce tout constitura un lexique bilingue Surui <=> Portugais solide, et avec Lingualibre, un dictionnaire multimédia.
+
* [[List:Por/words-by-frequency-00001-to-02000|List:Por/words-by-frequency-00001-to-02000]] - les 2000 mots portugais les plus utilisés à traduire en Surui.
  
;Règles de traduction de la liste de vocabulaire
+
== Identifying the translators ==
La liste en Surui sera au finale une liste de mots Surui unique prête à enregistrer. Quelques règles sont à prendre en compte pour mener cet effort proprement.
+
Your team of translators will need to choose its editing mode :
 +
* online via the "EDIT" button (you must create a Wikipedia account)
 +
* offline.
  
1) On parle de L1 pour la langue à traduire (ex: L1 Portugais) et de L2 pour les traductions ajoutées (ex: L2 Surui).
+
== Linguistic specifics and creation phases ==
2) Le format de notre liste de vocabulaire est ainsi :
+
The Surui being very different from the Portuguese, we can advance in phases:
 +
* 1st phase: this translation from Portuguese to Surui is adapted to a first massive effort, in order to produce 90% of the current vocabulary.
 +
* 2nd phase: it will naturally be appropriate to complete these Portuguese-centered lists with lexicons and concepts specific to Surui and its environment. This supplement is a work of a different nature.
  
* L1 (Portugais) → L2 (Surui)
+
Qualitatively, this whole will constitute a solid bilingual Surui <=> Portuguese lexicon, and with Lingualibre, a multimedia dictionary.
  
3) Conserver le signe "→", il est très important pour la suite.
+
== Vocabulary list translation rules ==
4) Au mot en L1 Portugais à gauche, nous ajoutons comme traduction L2 à droite son synonyme le plus courant. Exemple pour L1 Portuguais → L2 Anglais :
+
The Surui list will ultimately be a single Surui wordlist ready to save. A few rules must be taken into account to carry out this effort properly.
  
 +
1) We speak of L1 for the language to be translated (ex: L1 Portuguese) and of L2 for the added translations (ex: L2 Surui).
 +
2) The format of our vocabulary list is as follows:
 +
 +
* L1 (Portuguese) → L2 (Surui)
 +
 +
3) Keep the "→" sign, it is very important for what follows.
 +
4) To the Portuguese L1 word on the left, we add as the L2 translation on the right its most common synonym. Example for L1 Portuguese → L2 English:
 +
<pre>
 
* que → that
 
* que → that
 
* a → a
 
* a → a
Line 53: Line 68:
 
* ele → he
 
* ele → he
 
* como → like
 
* como → like
 
+
</pre>
 
5) Si un mot L1 il n'existe pas de traduction L2, passer au mot suivant, car nous souhaitons traduire le plus de mots possible. Exemple, "Arranha-céu" est ignoré:
 
5) Si un mot L1 il n'existe pas de traduction L2, passer au mot suivant, car nous souhaitons traduire le plus de mots possible. Exemple, "Arranha-céu" est ignoré:
 
+
<pre>
 
* uma → one
 
* uma → one
 
* Arranha-céu →
 
* Arranha-céu →
 
* como → like
 
* como → like
 +
</pre>
  
 
6) Si pour un mot L1 plusieurs traductions L2 très communes existent, dupliquer la ligne et traduire:
 
6) Si pour un mot L1 plusieurs traductions L2 très communes existent, dupliquer la ligne et traduire:
 
+
<pre>
 
* como → like
 
* como → like
 
* como → as
 
* como → as
Line 69: Line 85:
 
* Monkeys → Macacas
 
* Monkeys → Macacas
 
* Monkeys → Macacos
 
* Monkeys → Macacos
 +
</pre>
  
 
7) Si pour un mot L1 de trop nombreuses traductions L2 existent, par variations, n'ajouter que la base. Exemple pour les variations verbales pour L1 anglais et L2 portugais :
 
7) Si pour un mot L1 de trop nombreuses traductions L2 existent, par variations, n'ajouter que la base. Exemple pour les variations verbales pour L1 anglais et L2 portugais :
 
+
<pre>
 
* be → ser
 
* be → ser
 
* make → fazer
 
* make → fazer
 
* move → mover
 
* move → mover
 
* build → construir
 
* build → construir
 
+
</pre>
 
Nous traduisons uniquement la base fondamentale, nous ne détaillons les variations infinis :
 
Nous traduisons uniquement la base fondamentale, nous ne détaillons les variations infinis :
 
+
<pre>
 
* build → construir O
 
* build → construir O
 
* build → construo X
 
* build → construo X
Line 86: Line 103:
 
* build → constroem X
 
* build → constroem X
 
* build → constroem X
 
* build → constroem X
* ...
+
*
 
+
</pre>
  
 
8) Si il n'existe pas de mot L1, et qu'il existe un mot L2 spécifique, ajouter une ligne et un mot après la flèche. Exemple, si le portugais n'a pas de mot pour "Penguin", alors:
 
8) Si il n'existe pas de mot L1, et qu'il existe un mot L2 spécifique, ajouter une ligne et un mot après la flèche. Exemple, si le portugais n'a pas de mot pour "Penguin", alors:
 
+
<pre>
 
* Papagaio → Parrot
 
* Papagaio → Parrot
 
* → Penguin
 
* → Penguin
 
* Monkey → Macaco
 
* Monkey → Macaco
 
+
</pre>
 
9) Secret: les "trous" produits en 5) et 8) pourront être complétés plus tard.
 
9) Secret: les "trous" produits en 5) et 8) pourront être complétés plus tard.
  

Revision as of 15:26, 23 May 2022

Draft
Twemoji12 1f3d7.svg
Twemoji12 1f3d7.svg


Community

In this case study, the community we work with here is the Surui people, located in North-Western Amazonia.
It's a small population of 30 Amazonia forest's villages and 1,600 native speakers.
The languages they speak is Surui and Portugese, the national language of Brazil, at various levels.
Westernization is radically changing daily practices, culture and language.

Almir Surui, their elected chief, has been contacted and is willing to lead such effort.
Recent effort to preserve and revitalize their language are underway : they recently normalized Surui language's writing, elementary school is in Surui language, with associated new books.

There is no existing wordlist to reuse to record in Lingualibre.

Identify your source

Given their second language is Portugese…
Given academic researches recommending word list sorted by frequency…
And given we have such list in Portugese…
We will work with Surui natives to translate such Portuguese list into Surui :

Identifying the translators

Your team of translators will need to choose its editing mode :

  • online via the "EDIT" button (you must create a Wikipedia account)
  • offline.

Linguistic specifics and creation phases

The Surui being very different from the Portuguese, we can advance in phases:

  • 1st phase: this translation from Portuguese to Surui is adapted to a first massive effort, in order to produce 90% of the current vocabulary.
  • 2nd phase: it will naturally be appropriate to complete these Portuguese-centered lists with lexicons and concepts specific to Surui and its environment. This supplement is a work of a different nature.

Qualitatively, this whole will constitute a solid bilingual Surui <=> Portuguese lexicon, and with Lingualibre, a multimedia dictionary.

Vocabulary list translation rules

The Surui list will ultimately be a single Surui wordlist ready to save. A few rules must be taken into account to carry out this effort properly.

1) We speak of L1 for the language to be translated (ex: L1 Portuguese) and of L2 for the added translations (ex: L2 Surui). 2) The format of our vocabulary list is as follows:

  • L1 (Portuguese) → L2 (Surui)

3) Keep the "→" sign, it is very important for what follows. 4) To the Portuguese L1 word on the left, we add as the L2 translation on the right its most common synonym. Example for L1 Portuguese → L2 English:

* que → that
* a → a
* o → the
* de → from
* não → no
* é → is
* e → and
* um → one
* para → to
* eu → me
* se → if
* me → me
* no →
* uma → one
* está → is
* por → by
* com → with
* os → the
* do → from
* te → you
* em → in
* ele → he
* como → like

5) Si un mot L1 il n'existe pas de traduction L2, passer au mot suivant, car nous souhaitons traduire le plus de mots possible. Exemple, "Arranha-céu" est ignoré:

* uma → one
* Arranha-céu →
* como → like

6) Si pour un mot L1 plusieurs traductions L2 très communes existent, dupliquer la ligne et traduire:

* como → like
* como → as
* como → similar to
* Monkey → Macaca
* Monkey → Macaco
* Monkeys → Macacas
* Monkeys → Macacos

7) Si pour un mot L1 de trop nombreuses traductions L2 existent, par variations, n'ajouter que la base. Exemple pour les variations verbales pour L1 anglais et L2 portugais :

* be → ser
* make → fazer
* move → mover
* build → construir

Nous traduisons uniquement la base fondamentale, nous ne détaillons les variations infinis :

* build → construir O
* build → construo X
* build → constrói X
* build → construiu X
* build → construímos X
* build → constroem X
* build → constroem X
* …

8) Si il n'existe pas de mot L1, et qu'il existe un mot L2 spécifique, ajouter une ligne et un mot après la flèche. Exemple, si le portugais n'a pas de mot pour "Penguin", alors:

* Papagaio → Parrot
* → Penguin
* Monkey → Macaco

9) Secret: les "trous" produits en 5) et 8) pourront être complétés plus tard.

Pour aller plus loin...

Les listes suivantes sont disponibles à la traduction vers le Surui, afin de constituer rapidement une liste Surui de base de 6 à 8000 mots Surui :


Coordination

Un second email est en cour d'écriture pour les aspects de coordinations relatif au 20 Mai 2022 à Paris.

Bien à vous,


See also