LinguaLibre

Difference between revisions of "Chat room/Archives/2018"

< LinguaLibre:Chat room

 
Line 437: Line 437:
 
:::::Many thanks! I will test it. [[User:KaMan|KaMan]] ([[User talk:KaMan|talk]]) 13:12, 27 December 2018 (UTC)
 
:::::Many thanks! I will test it. [[User:KaMan|KaMan]] ([[User talk:KaMan|talk]]) 13:12, 27 December 2018 (UTC)
 
::::::It works for me as of today ! I stay logged in much longer. I didn't had to log in in past 24hrs. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 18:46, 29 December 2018 (UTC)
 
::::::It works for me as of today ! I stay logged in much longer. I didn't had to log in in past 24hrs. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 18:46, 29 December 2018 (UTC)
 +
 +
== Utiliser le Lingua Libre Bot dans l'incubator:shy ==
 +
 +
Est-ce que c'est possible de faire la même chose pour le wiktionnaire en Chaoui ? je veux dir est-il il possible d'utiliser votre bot sur notre wiktionnaire aussi ? je peux donner l'algorithme du [https://incubator.wikimedia.org/wiki/Wt/shy wiki-test]. Cordialement. -[[User:Reda Kerbouche|Reda Kerbouche]] ([[User talk:Reda Kerbouche|talk]]) 12:32, 8 July 2018 (UTC)
 +
:Oui bien sur ! Avez-vous un bistro / village pump / ... pour en discuter là-bas ? — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 15:24, 8 July 2018 (UTC)
 +
::Oui il y a un bistro vierge du [https://incubator.wikimedia.org/wiki/Talk:Wt/shy/Asebtar_amenzu wiktionnaire Chaoui] que vous pouvez activer. Ou bien celui de [https://incubator.wikimedia.org/wiki/Incubator:Community_Portal l'incubator] où en peut discuter avec des administrateurs à propos de l'autorisation du bot. Cordialement. -[[User:Reda Kerbouche|Reda Kerbouche]] ([[User talk:Reda Kerbouche|talk]]) 18:26, 8 July 2018 (UTC)
 +
:::Je suis en ce moment en chemin pour Wikimania, je vais n'avoir que très peu de temps jusque là, mais je lancerais la discussion à mon retour. Cordialement — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 11:43, 11 July 2018 (UTC)
 +
:::: Bon voyage.--[[User:Reda Kerbouche|Reda Kerbouche]] ([[User talk:Reda Kerbouche|talk]]) 21:48, 11 July 2018 (UTC)
 +
[[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] J'espère que vous m'avez pas oublié =) Car en septembre on lance un concours pour le wiktionnaire en Chaoui, et si on peut enregistrer des mots qui vont passer directement sur incubateur, je fais la promo de Lingualibre en même temps que la promo du concours.--[[User:Reda Kerbouche|Reda Kerbouche]] ([[User talk:Reda Kerbouche|talk]]) 14:01, 16 August 2018 (UTC)
 +
:[[User:Reda Kerbouche|Reda Kerbouche]], [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']],  Is this {done} ? --[[User:Yug|Yug]] ([[User talk:Yug|talk]]) 11:04, 15 December 2018 (UTC)
 +
::Bots-related documentation could be gathered in [[Help:Bots]] [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 11:01, 31 December 2018 (UTC)
 +
 +
== Liste sur le modèle de Petscan ==
 +
Salut, est ce qu'il serait possible de faire une liste à la volée sur le modèle de ce qu'est capable de faire Petscan ? [https://petscan.wmflabs.org/?language=fr&project=wiktionary&categories=Lemmes%20en%20fran%C3%A7ais&negcats=Prononciations%20audio%20en%20fran%C3%A7ais&ns%5B0%5D=1&search_max_results=500&interface_language=fr&&doit= Ici], on a la liste de tous les lemmes du Wiktionnaire qui n'ont pas de catégorie « Prononciations audio en français » ce qui signifie qu'il n'ont pas le modèle « écouter » qui permet d'ajouter les entrées dans cette catégorie. Je trouve que la génération d'une telle liste serait vraiment sympa pour les Wiktionnaires. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 06:07, 12 July 2018 (UTC)
 +
:L'idée est bonne en effet, cependant ça représente un gros boulot à intégrer sur Lingua Libre. Je pense qu'il serait intéressant d'en discuter un peu et d'établir un petit cahier des charges de ce que l'on veut pouvoir faire (tout dans petscan n'est pas utile ici). — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 22:00, 14 July 2018 (UTC)
 +
::[[User:0x010C|0x010C]], est ce que tu penses que l'exemple que j'ai donné ci-dessus (lemmes en français qui n'ont pas de prononciation) peut être implémenté à partir de [[MediaWiki:Gadget-Demo.js]]. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 14:23, 14 October 2018 (UTC)
 +
:::Oui c'est exactement ça, il faut passer par la création d'un nouveau générateur de mots. Dans mon début de réflexion plus haut, je réfléchissais à comment implémenter les fonctionnalités de petscan dans un générateur. Sauf que niveau performance et rapidité, on pourrait jamais faire quelque chose d'utilisateur avec des catégories aussi grosse que "Lemmes en français", je m'explique. Petscan fait son travail de recherche et de recoupement côté serveur, directement sur une copie de la base de donnée des wikis (il peut ainsi en un coup explorer tous les enregistrements). Or ici, nous n'avons pas d'accès à la base de donnée et les calculs doivent être fait côté client, en javascript. On dépend donc de l'API des wikis en question pour récupérer les données, API qui n'est pas du tout faite pour travailler sur des catégories très grosses (ne peut retourner que 500 membres par requête, etc).
 +
::: Bref, c'est pas possible. Cependant, on peut imaginer se reposer sur petscan pour faire le boulot chiant à notre place (ce générateur deviendrait complètement dépendant de cet outil externe, une panne de ce dernier bloquerait le fonctionnement du premier). Je vois trois options :
 +
:::# le générateur reprend un certain nombre de champs de petscan, et va à partir des valeurs fournies générer une requête à petscan (complexe pour l'utilisateur lambda, flexible pour l'utilisateur expérimenté) ;
 +
:::# le générateur propose à l'utilisateur de choisir parmi un certain nombre de requêtes petscan préparé à l'avance par nos soins (par exemple en cliquant sur "mots en français n'ayant pas de prononciation sur le wiktionnaire francophone", ta requête exposé plus haut serait utilisé), ou de coller l'URL / l'identifiant d'une requête qu'il a préparé / trouvé (plus simple à implémenter, nous oblige à créer pleins de requêtes pour supporter différentes langues, assez flexible) ;
 +
:::# on fait un générateur spécialisé "mots dont la prononciation est manquante" où il va automatiquement forger la requête petscan pour faire comme dans ton exemple pour la langue sélectionnée (facile d'utilisation, très spécifique mais potentiellement très utile, nous obligerait à renseigner manuellement les catégories wiktionnaire correspondante car je ne vois aucun moyen de deviner le nom de la catégorie d'une langue à partir de son code ou son id wikidata...)
 +
:::Qu'en penses-tu ?
 +
:::— [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 02:53, 16 October 2018 (UTC)
 +
::::La première proposition me semble trop usine à gaz et bien que puissante, je ne pense pas qu'elle s'adresse au public de Lingua Libre.Entre les propositions 2 et 3, j'ai une préférence pour la 2 car elle est simple d'utilisation au premier abord (on utilise des requêtes pré-forgées) tout en permettant une utilisation avancée (avantage de la solution 1). Et par rapport à la solution 3, ça évite de la maintenance pour déterminer la langue d'une catégorie donc c'est plus maintenable sur le long terme à mon avis. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 06:23, 17 October 2018 (UTC)
 +
:::::@[[User:Pamputt|Pamputt]]: Entre deux avions, je viens de finir une première version du générateur petscan, activable via [[Special:Preferences#mw-prefsection-gadgets|préférences > gadgets]]. Est-ce que tu peux y jetter un œil et me dire ce que tu en penses avant que je continue et que je l'annonce plus largement ?
 +
:::::Merci — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 08:39, 22 October 2018 (UTC)
 +
::::::[[User:0x010C|0x010C]], j'ai activé le gadget et je vois bien PetScan dans la liste. J'ai fait quelques essais et ça fonctionne bien. J'ai essayé avec l'URL du premier message et ça fonctionne nickel. En revanche, j'ai essayé avec [https://petscan.wmflabs.org/?language=fr&project=wiktionary&categories=Adjectifs%20en%20fran%C3%A7ais&negcats=Prononciations%20audio%20en%20fran%C3%A7ais&ns%5B0%5D=1&search_max_results=500&interface_language=en&active_tab= ça] et ça m'indique "Petscan output something weired with this URL, check it and come back afterwards.". En revanche si j'ajoute le « &doit= » à la fin, ça fonctionne correctement (est-il vraiment nécessaire) ?
 +
::::::Autre point, cest-ce qu'il est déjà possible de préparer des requêtes pré-faites (« mots en français n'ayant pas de prononciation sur le wiktionnaire francophone », ...) ou pas encore ? En l'état c'est déjà super cool. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 17:04, 22 October 2018 (UTC)
 +
:::::::J'avais oublié que cetaines URL pouvaient ne pas avoir l'auto-run, c'est fix. Je réfléchis actuellement à la meilleur façon de faire en fait. Ma problématique, c'est qu'une requête comme « mots en français n'ayant pas de prononciation sur le wiktionnaire francophone » n'intéressera que ceux qui font des enregitrements en français, si un germanophone dois scroller 25 requêtes qui le concerne pas (et qu'il ne comprend surement pas) avant d'en trouver une en allemand, c'est pas cool pour lui.
 +
:::::::De là, trois idées qui me viennent en écrivant ces lignes :
 +
:::::::* Une page par langue, dans l'espace de nom list ([[List:fra]] ? [[List:fra-external]] ? [[List:fra-examples]] ? ...) qui regroupe via une liste à puce toutes les urls dispo pour une langue ;
 +
:::::::* Une fois ce travail fait, ce n'est pas très compliqué de supporter d'autres outils externes qui peuvent être appelé via une URL et renvoyer le résultat en JSON ; je pense notamment à querry.wikidata.org ;
 +
:::::::* Et là, plus une réflexion, est-ce que ça serait pertinent une fois que ça sera stable de l'intégrer au générateur "listes" actuel (genre avoir deux onglets dedans, "listes statique", "listes dynamiques/externes/..." ?), ou l'intégrer comme un nouveau générateur à part entière dans le core du RecordWizard ? (et du coup comment le nommer dans ce cas ?)
 +
:::::::Un avis externe me serait bien utile pour trancher tout cela :) — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 19:52, 22 October 2018 (UTC)
 +
 +
== Variations géographiques ==
 +
 +
Bonjour,
 +
 +
Bravo pour ce projet très intéressant.
 +
 +
Je me pose une question à propos des prononciations. Je suis du sud de la France et contrairement à une bonne partie du reste de la France, nous usons beaucoup de l'accent tonique (influence italienne et espagnole, j'imagine). Du coup, la prononciation de certains mots, et surtout des locutions, ont une rythmique différente par chez moi.
 +
 +
Comment gérer ces variations de prononciation ? Ont-elles droit de cité ou comme les québécois doit-on privilégier un "Français international" neutre ?
 +
 +
Pour finir sur le sujet, la prononciation de certains mots sont différentes chez nous : lait, mas, moins (avec un s !), etc. Comment intégrer ça dans Wiktionnaire ou Wikipédia ?
 +
 +
[[User:Jpgibert|Jpgibert]] ([[User talk:Jpgibert|talk]]) 12:02, 13 July 2018 (UTC)
 +
 +
:Bonjour,
 +
:Merci pour ton intérêt !
 +
:Non, il ne faut surtout pas privilégier un français "''neutre''". Chaque variation / accent locale est intéressent. En fait, juste avant de commencer à enregistrer il t'es demandé de remplir ton profil de locuteur, dans lequel tu peux renseigner ton lieu d'habitation / d'apprentissage d'une langue.
 +
:Lorsqu'un enregistrement est ajouté ensuite sur le Wiktionnaire par exemple, cette information y est inclu. Si plusieurs personnes ont enregistré les même mots, on pourra donc écouter les différences de prononciation de « lait » en Alsace, au Québec, en Occitanie, en Île de France, au Mali,... Et ça c'est cool :)
 +
:Cela répond à tes questions ?
 +
:Cordialement — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 21:55, 14 July 2018 (UTC)
 +
 +
::Bonjour [[User:0x010C]]
 +
::Merci pour la réponse. Je m'inquiétais de la chose parce que s'il existe un code linguistique pour les variations du français au Québec (fr-CA) ou de Belgique (fr-BE), en revanche l'accent n'est pas pris en compte.
 +
::Content d'apprendre que malgré mon accent, je serai le bienvenu. Bon pour le moment, faut que j'achète un bon micro avant de faire quoi que ce soit, mais dès que j'aurai ça, je tenterai de partager mon accent méridional.
 +
::[[User:Jpgibert|Jpgibert]] ([[User talk:Jpgibert|talk]]) 12:31, 23 July 2018 (UTC)
 +
 +
== Thésaurus ==
 +
 +
Bonjour,
 +
 +
Durant la vidéo de présentation du projet par [[user:Lyokoï|Lyokoï]] ([https://www.youtube.com/watch?v=8p_z3jyihwU LetsContribute6]), j'ai appris qu'on pouvait générer des listes de mots à partir de catégories. Serait-il possible de faire le même genre de chose à partir d'un thésaurus ? Question subsidiaire, est-ce que ça à un intérêt ?
 +
 +
[[User:Jpgibert|Jpgibert]] ([[User talk:Jpgibert|talk]]) 12:39, 23 July 2018 (UTC)
 +
:Ca pourrait effectivement être intéressant même si c'est plus compliqué à coder (j'imagine). Juste pour donner un exemple pour ceux qui ne voient pas ce dont il est question, on peut aller voir [https://fr.wiktionary.org/wiki/Th%C3%A9saurus:pain/fran%C3%A7ais ici]. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 21:30, 23 July 2018 (UTC)
 +
:: {{ping|Jpgibert}} Le plus simple pour faire ça, c'est de copier-coller le contenu du thésaurus et de séparer les mots avec un #. Ça doit demander quelques minutes pour être mis en forme, mais ce n'est pas non plus le Pérou. [[User:Lyokoï|Lyokoï]] ([[User talk:Lyokoï|talk]]) 14:22, 15 December 2018 (UTC)
 +
 +
 +
== Première utilisation : quelques questionnements ==
 +
 +
Bonjour !
 +
 +
Tout d'abord, merci beaucoup pour ce super outil !
 +
 +
J'ai remarqué quelques difficultés à l'usage. Peut-être que c'est juste parce que je suis nouvelle et pas au courant de toutes les options, mais voilà ma liste :
 +
 +
# Sur une liste de 20 mots, il faut généralement que je reprenne l'enregistrement manuellement trois ou quatre fois parce que l'outil décide soudain de ne plus enregistrer. Quand je sélectionne un mot, même en cliquant sur le gros bouton rouge, il y a à peu près une chance pour deux pour que l'enregistrement se lance.
 +
# Mes mots sont très souvent coupés au début et à la fin (pour les noms propres en deux ou trois mots surtout) : peut-être qu'il serait pertinent d'avoir un petit bouton "next" pour marquer manuellement les fins de mots ? Sur 20 mots enregistrés, entre ceux que l'outil n'a pas envie de me laisser enregistrer (cf #1) et ceux qui sont coupés, m'en reste peu. Sur 3 listes d'une vingtaine de noms, j'en ai eu 2, 5 et 7 exploitables.
 +
# Sur une page d'enregistrement comme [[Q44570]], le lien vers la page Wikipédia met un + au lieu d'un _ entre les mots donc on arrive sur un lien rouge dans Wikipédia.
 +
 +
Si ça peut servir, je suis sur la dernière version en date de Firefox au 10/10/18 & Windows 10.
 +
 +
Pour le reste : c'est vraiment super, bravo pour tout ce travail ! Je vais continuer à faire joujou avec l'outil jusqu'à être bien familière avec.
 +
 +
[[User:Exilexi|Exilexi]] ([[User talk:Exilexi|talk]]) 06:22, 10 October 2018 (UTC)
 +
:Les problèmes 1 et 2 sont en fait quasiment réglés avec un meilleur micro. Lingua Libre demande la permission pour un micro qui n'est pas mon micro par défaut, pour une raison inconnue.
 +
:Nouveau souci avec l'upload : tous les mots sauf 1 sont bien téléversés. Le bouton Commons s'affiche en grisé et rien ne se passe si je clique sur la petite croix à côté d'un mot : apparemment, c'est tout ou rien pour mettre sur Commons, donc je viens de perdre 29 mots parce qu'un seul refusait de s'uploader. [[User:Exilexi|Exilexi]] ([[User talk:Exilexi|talk]]) 06:44, 10 October 2018 (UTC)
 +
:: J'en ajoute un : j'avais enregistré 20 mots "autour de moi". Là, je viens d'en lancer 20 autres... et c'est les mêmes. Il pourrait être intéressant d'ajouter une option pour éviter d'enregistrer plusieurs fois la même chose (mon accent ne change pas d'un jour à l'autre). [[User:Exilexi|Exilexi]] ([[User talk:Exilexi|talk]]) 05:36, 11 October 2018 (UTC)
 +
 +
Salut [[User:Exilexi|Exilexi]], quelques remarques ou éléments de réponse à tes commentaires
 +
# Lorsque tu décris que l'outil stoppe l'enregistrement, je pense que le problème vient de la qualité du micro. C'est ce que tu sembles avoir conclu également.
 +
# Lingua Libre découpe les mots automatiquement dès qu'il détecte un blanc. Pour les noms à rallonge, on pourrait envisager d'ajouter un bouton pour passer manuellement au mot suivant. Cela étant dit, ça perd un peu de l'intérêt de l'outil car ça devient beaucoup plus lent.
 +
# concernant le lien vers Wikipédia (avec un « + »), ça semble en effet un bogue. J'ai ouvert un [https://phabricator.wikimedia.org/T206801 ticket sur Phabricator].
 +
# pour les problèmes d'upload, quand un téléversement échoue, un [https://phabricator.wikimedia.org/T198014 ticket] existe déjà sur ce sujet.
 +
# pour les listes de mots, il est possible d'en créer soi-même. Il en existe déjà plusieurs en français (quelques dizaines) et moins dans les autres langues. Il est expliquer [[Help:Create_your_own_lists/fr|ici]] sur la façon de procéder. Si tu as besoin d'aide, fais-nous signe. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 20:13, 11 October 2018 (UTC)
 +
 +
 +
== Formosan languages workshop ==
 +
Hi there, I had an email exchange with Vicky, the [https://en.wikipedia.org/wiki/National_Chengchi_University NCCU] language researcher involved in Formosan languages protection. Some of her questions are [https://en.wikiquote.org/wiki/Toy_Story#Buzz_Lightyear beyond] my skills :
 +
 +
1. I couldn't find ais(Sakizaya), ami(Amis), trv(Truku) in the language list. Please add, thanks!
 +
2. Can I add the dialect information in the speaker file?
 +
Because there are 42 dialects under 16 aboriginal languages, I had record Squliq dialect not C’uli’ dialect of Atayal language today.
 +
3. I had add the Chinese translation after the aboriginal languages, is that ok for lingua libre?
 +
Or I only can type in aboriginal languages?
 +
 +
I broke the questions in several subsections so a quick discussion may occurs for each. Please take notes that Vicky workshop is coming this week, so it would be cool to forward her practical solutions early.
 +
[[User:Yug|Yug]] ([[User talk:Yug|talk]]) 09:38, 29 November 2018 (UTC)
 +
 +
=== 1) Requesting languages additions ===
 +
* Amis_language (iso: ami; wikidata: [[wikidata:Q35132|Q35132]]).
 +
* Sakizaya has no iso639, from my understanding. Sakizaya_language (iso: none, wikidata: [[wikidata:Q718269|Q718269]]), Nataoran_language (iso: ais, wikidata: [[wikidata:Q42508148|Q42508148]]).
 +
* Truku (no iso no wikidata) : is described in Wikipedia as the main component of Seediq language (iso: trv, wikidata: [[wikidata:Q716686|Q716686]]), already in LinguaLibre. Taiwanese linguist, the most experienced in the matter, are making a distinction.
 +
If I understand well, LL only requires wikidata ID. If so, I would recommend to add [[wikidata:Q35132|Q35132]] (amis), [[wikidata:Q718269|Q718269]] (Sakizaya). [[wikidata:Q42508148|Q42508148]] (Nataorans) and [[wikidata:Q716686|Q716686]] (Seediq) are already in I think. Truku may require a wikidata item creation, then integration in LL.
 +
[[User:Yug|Yug]] ([[User talk:Yug|talk]]) 09:38, 29 November 2018 (UTC)
 +
:The four languages have been imported here: [[Q51311]] Seediq, [[Q51870]] Amis, [[Q51871]] Sakizaya and [[Q51872]] Nataoran and can be used for recording. [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 04:15, 30 November 2018 (UTC)
 +
 +
=== 2) "There are 42 dialects under 16 aboriginal languages". ===
 +
We previously added 15 or 16 of these recognized languages into LinguaLibre (thanks x0 and Pamputt). Again, Taiwanese linguists are the experts on the matter, so what can we (LL) recommend for these 42 variants ? Two ideas came to me.
 +
# Add the information in he speaker name or place of learning. By example for : Paul Martin (Breton north) ; Paul Martin (Breton south).
 +
# Add the Wikidata items following Taiwanese linguists recommendations, while no wikipedia articles nor iso639 exists.
 +
What do you think ? [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 09:38, 29 November 2018 (UTC)
 +
: As far as I uundertand, if no Wikidata item exists for a given language, we have two options: create it on Wikidata (whether it is notable) and import here after or create it by hand directly here. So for dialect, I would say they are enough notable to be created on Wikidata but I have no time to do it by myself before the end of the year (I have no regular Internet connection for now). [[User:Pamputt|Pamputt]] ([[User talk:Pamputt|talk]]) 04:18, 30 November 2018 (UTC)
 +
::In fact, the second option mentionned above by Pamputt won't work. For a language to be recognised by the RecordWizard, it has to have a wikidata ID. The right way to do it imho is (as also suggested by Pamputt) to create the corresponding item on wikidata, and then ask for an import here. — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 14:46, 3 December 2018 (UTC)
 +
 +
=== 3) "Is it ok to use <code>mhway su (谢谢)</code> ?" (target word + translation) ===
 +
* '''Technically''', both aboriginal languages and Chinese, de factor the target word together with its closest macro-language's translation, here, Chinese.
 +
* Keep extremely '''consistent''' in your practice, so to ease later usages (learning apps). If the rule is
 +
<span style="color:green;">{aboriginal}{white_space}{opening_round_braket_(}{Chinese}{closing_round_braket_)}</span>
 +
stick to it, and avoid round brackets in other places of your element. Early consistency makes later usages easier.
 +
[[User:Yug|Yug]] ([[User talk:Yug|talk]]) 09:38, 29 November 2018 (UTC)
 +
:@x0, devs, there again we have the questions of wordlists with translations. I previously suggested that [[Help:Create_your_own_lists|words lists]] support a iso639 syntaxe or wikidata id syntax so to push the translation into a different metadata field. Example of list :
 +
: mhway su [cmn:谢谢,eng:Thank]
 +
:Then "mhway su" is the target recorded word. "谢谢" is the translation in the meta data "cmn" (Chinese). "Thank" is the translation in the meta data "eng" (English). I guess I should open a ticket on Phabricator. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 10:19, 29 November 2018 (UTC)
 +
::Multi-lingual wordlist --wordlist including the translation of target words-- are not supported at the moment. An issue have been opened on LinguaLibre developments and bugs tracking system ([https://phabricator.wikimedia.org/T211086 T211086]). [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 09:29, 4 December 2018 (UTC)
 +
 +
 +
== Feature request: ask to reuse existing identical audio if available ==
 +
:{{Done}}, can be archived. 12:08, 31 December 2018 (UTC)
 +
I waste a lot of time because Lingua Libre Bot has to have new audio for every lexeme forms. For example this audio https://commons.wikimedia.org/wiki/File:LL-Q809_(pol)-KaMan-Bizancjum.wav I had to record 10 times (https://lingualibre.fr/index.php?title=Q55850&action=history). A lot of forms in Polish language is duplicated in different cases. It would be great if in word generator (+ExternalTools) in Record Wizard could be question to ask if duplicate should be recorded (identical speaker, language and lexeme), and Lingua Libre Bot propagate existing audio. It could save time. [[User:KaMan|KaMan]] ([[User talk:KaMan|talk]]) 14:28, 25 December 2018 (UTC)
 +
:KaMan, where does your wordlist(s?) come from ? how is it created ? You use LinguaLibre word generator ? [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 00:12, 27 December 2018 (UTC)
 +
:If I understand well, you eventually have the same issue as raised in [[LinguaLibre:Chat_room#Warn_the_user_when_they_try_to_record_a_file_that_they_already_made|Warn the user when they try to record a file that they already made]]. Namely, you meet again and again words that you already recorded. If this is correct, then we started to look for technical solutions ([https://phabricator.wikimedia.org/T212580 T212580]). As of now, for long series, it is important to stick to large frequency list, so to not re-record similar words multiple times. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 00:17, 27 December 2018 (UTC)
 +
:I took a look online for available frequency lists in polish.
 +
:* Subtlex-pl : [http://crr.ugent.be/papers/subtlex-pl.pdf article], [http://crr.ugent.be/papers/subtlex-pl.pdf http://crr.ugent.be/programs-data/subtitle-frequencies/subtlex-pl data], available but "for research usage".
 +
:* Worldlex : [https://link.springer.com/article/10.3758/s13428-015-0621-0 article], [http://worldlex.lexique.org data], available but unstated license
 +
:* Hermit Dave, 2016 : [https://invokeit.wordpress.com/frequency-word-lists/ page], [https://github.com/hermitdave/FrequencyWords/tree/master/content/2016/pl data], CC-by-sa
 +
:So Hermit Dave's data would do. We have tutorials on [[Help:How_to_create_a_wordlist_%3F#Command|how to clean up frequency lists]],[[Help:How_to_create_a_wordlist_%3F#Splitting_a_very_long_file|how to split such long file]], other [[Help:How_to_create_a_wordlist_%3F#From_corpus_to_frequency_data_.60.7Boccurences.7D_.7Bitem.7D.60|tricks]], and [[Help:Create_your_own_lists#Create_a_new_list|how to create a list on LinguaLibre]] to help.
 +
:Some command will need minor changes if your input differs. If you have some basic shell skills, you can do it and learn the exact commands needed quickly. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 01:30, 27 December 2018 (UTC)
 +
::No Yug. He's talking about word lists generated with a SPARQL query from Lexemes on Wikidata, and from the fact that Lingua Libre Bot only associate audio recordings on the Lexeme when there is a direct link, causing him to re-record many times homograph words that are also homonym.
 +
::But the main issue I pointed out in [https://phabricator.wikimedia.org/T212580 T212580] apply here too, I don't have any idea of easy and effective implementation right now.
 +
::(and no Yug, it is not "''important to stick to large frequency list''", we have other —more simple— solutions yet as Wikimedia categories or external tools imports).
 +
::Best regards — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 11:10, 27 December 2018 (UTC)
 +
::: 0x010C is right. It's not problem of wrong list, list of words is correct. If there is no easy solution to it I can work with it as is but I admit I feel pain ;) before recording of 14 identical forms of https://www.wikidata.org/wiki/Lexeme:L19356 :) [[User:KaMan|KaMan]] ([[User talk:KaMan|talk]]) 13:22, 27 December 2018 (UTC)
 +
::::"Who doesnt try cannot be wrong." It really needs to read between lines to find the Wikidata reference. "Lexeme" is lexicology term before being a Wikidata item type. The current SPARQL query doesnt seems time savy.
 +
::::And yes, generally speaking frequency list of unique words save our speakers energy. First, each form is recorded only once : this is why human speakers are for, and they shouldn't have to record multiple times a same form. Second, in natural language, words frequency follow the [[:wikipedia:Zipf's law|Zipf's law]]. Thus, the 135 most frequent English items represent 50% coverage of written text. On the opposite side, recording Wikipedia categories is not representative of human language and thus not time efficient. One volunteer can audio record 2000 categories it will still barely account for 1% of this human language. This only has internal value, by wikipedians for wikipedians, which is positive but sub-optimal.
 +
::::As of KaMan's case, I would still recommend using frequency list : it would save valuable human time. A later bot could dispatch the audios upon the various wikidata items of this language and form. So I just used Hermit Dave CC-by-sa data to create Polish language frequency lists on LinguaLibre for the first 20k words, they are now availale to in the [[Special:RecordWizard|Record Studio]] > Details step : Local list > "pol". [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 13:51, 27 December 2018 (UTC)
 +
:::::Yug, it's not a problem of frequency list but feature of language. I record all FORMS of words. Every noun in Polish has at least 14 forms, every adjective has 30-80 forms, same for verbs. Every form has entry in Wikidata and needs recording. But many of these forms are identical so in the end I have to record the same audio several times. It is independent from the fact the word is from frequency list. In other words word from frequency list has the same problem in Wikidata. BTW: I already follow frequency list in creating lexemes in Wikidata, but thanks :) [[User:KaMan|KaMan]] ([[User talk:KaMan|talk]]) 16:27, 27 December 2018 (UTC)
 +
::::::I think I get your process now. Learning ongoing ! Still seems weird you are recording 14 times the same form. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 16:58, 28 December 2018 (UTC)
 +
 +
== Homonymy ==
 +
 +
How homonyms are treated? Will they be overwritten with new recordings? [[User:Infovarius|Infovarius]] ([[User talk:Infovarius|talk]]) 17:42, 27 December 2018 (UTC)
 +
:Yes, if a new word has the same transcription, the same language and the same speaker as an old one, it will be override. If you want to record two homonym words that have a different pronunciation, you can add a small qualifier into brakets just after the word when you type it in the 3rd step of the RecordWizard. Everything that is inside brackets will be put aside, like on this record [[:File:LL-Q150 (fra)-0x010C-fils (enfant).wav]]. — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 21:26, 27 December 2018 (UTC)
 +
:: It is good that this is possible in principle. But how can I know that I am recording a homonym of something already recorded? [[User:Infovarius|Infovarius]] ([[User talk:Infovarius|talk]]) 21:51, 27 December 2018 (UTC)
 +
 +
== Categories ==
 +
:{{Done}} -- answer on feature status provided. See  [https://phabricator.wikimedia.org/T201135 T201135] [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 10:52, 31 December 2018 (UTC)
 +
How can I automatically add some categories to new Commons uploads (like "Russian pronunciation" and others)? [[User:Infovarius|Infovarius]] ([[User talk:Infovarius|talk]]) 17:44, 27 December 2018 (UTC)
 +
:Currently this is not possible but it is a planned feature, see [https://phabricator.wikimedia.org/T201135 task T201135 on phabricator]. — [[User:0x010C|'''0'''x'''010<span style="color: #00C41C;">C</span>''']] <sup>[[User_talk:0x010C|~talk~]]</sup> 21:46, 27 December 2018 (UTC)
 +
 +
 +
== How to properly credit lists ==
 +
:{{Done}} : no built in solution as of now, issue opened ([https://phabricator.wikimedia.org/T212671 T212671]), current hack: put source in talk page. [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 10:53, 31 December 2018 (UTC)
 +
([https://phabricator.wikimedia.org/T212671 T212671]) I attempted this [[List:Pol/words-by-frequency-2001-to-4000#Source]], but loading the list in the Record Studio keeps the source section as a word to record. Is there a known trick to hide this source section in the Record Studio ? [[User:Yug|Yug]] ([[User talk:Yug|talk]]) 16:56, 28 December 2018 (UTC)

Latest revision as of 11:02, 1 June 2020

Adding languages

Adding teochew

Check-green.svg Done Yug (talk) 09:11, 29 November 2018 (UTC)

Hi there, I'd like to be able to record for this language : teochew / 潮州话 [1] Assassas77 (talk) 08:33, 23 June 2018 (UTC)

Hi Assassas77,
I've just imported teochew. Thereby you can now select it in the Record Wizard and start recording words from that language :).
Regards — 0x010C ~talk~ 12:33, 23 June 2018 (UTC)

Adding languages : l'arabe tchadien shu

Check-green.svg Done Yug (talk) 09:07, 29 November 2018 (UTC)

Bonjour, serait-il possible d'ajouter l'arabe tchadien? (code shu) Abdallahbigboy (talk) 12:51, 5 September 2018 (UTC)

Bonjour, normalement ça devrait marcher maintenant Q40973. Cordialement GrandCelinien (talk) 22:21, 5 September 2018 (UTC
Merci! Abdallahbigboy (talk) 13:34, 10 September 2018 (UTC)

How to add missing languages ? (Taiwanese natives languages)

Check-green.svg Done, see Help:Add_a_new_language, for administrators. Yug (talk) 17:48, 22 November 2018 (UTC)

I couln't find this language on lingua libre : https://en.wikipedia.org/wiki/Southern_Min

Could you investigate, and explain. There are 16 Taiwanese languages to check. Yug (talk) 09:55, 22 July 2018 (UTC)

I'll import them as soon as I'm back to my laptop, in ~2h30. @Yug, Can you give me a direct link to each languages you want me to import? — 0x010C ~talk~ 12:49, 22 July 2018 (UTC)
Both linked languages are now available on Lingua Libre. :)
Best regards — 0x010C ~talk~ 15:35, 22 July 2018 (UTC)

Hello @User:0x010C, could you add the following languages :

  • living aboriginal languages alive : ami, tay, bnn, xnb, ckv, pwn, pyu, dru, sxr, xsy, trv, ssf, tsu, tao
  • Sino-Taiwanese languages : cmn, nan, hak.

So Taiwanese linguists could work peacefully as needed. Yug (talk) 13:20, 6 August 2018 (UTC)

Hello @User:0x010C, did I miss something in my guidances to you ? I search within the Recorder wizard but the autocompletion fail to return me a result for the iso:
  • Taiwan needed: ami (Q715760), tay (Q715766), bnn (Q56505), xnb (Q172244), ckv (Q716627), pwn (Q715755), pyu (Q716690), dru (Q49232), sxr (Q716599), xsy (Q716695), trv (Q716686), ssf (Q676492), tsu (Q716681), tao (Q715760).
  • Chineses needed: hak Q33375.
  • Chineses which are already in : cmn (Chinese), nan (Southern Min)
I tested the record wizard by typing both iso639 codes and Plain English names. Yug (talk) 15:11, 21 November 2018 (UTC)
Help:Add_a_new_language explains how to request a new language. I have done it for all your requests (see Special:RecentChanges for details). Pamputt (talk) 17:08, 21 November 2018 (UTC)
Thanks Pamputt ! Yug (talk) 17:48, 22 November 2018 (UTC)

Adding languages : Congolese Havu

Check-green.svg Done Yug (talk) 09:05, 29 November 2018 (UTC)

Yo, j'ai l'occasion d'enregistrer un Congolais qui parle le havu (https://www.wikidata.org/wiki/Q5684097), y'a moyen d'ajouter la langue (ou de me mettre admin pour que je m'en occupe ? :3) ? Merci ! :D Lyokoï (talk) 13:01, 14 November 2018 (UTC)

Salut Lyokoï, Q51299 est maintenant disponible. Pour le statut d'admin, ça doit être bon (je te fais confiance :) ). Pamputt (talk) 18:31, 14 November 2018 (UTC)

Ajout de la langue chaoui

Check-green.svg Done Yug (talk) 09:10, 29 November 2018 (UTC)

Bonjour, Pouvez-vous nous aider à ajouter la langue chaoui, code shy et la catégorie dans le Wiktionnaire [2]. Cordialement. Merci!Great11 (talk)

Great11 : Voilà qui est fait (Q4901), la langue chaoui est donc maintenant disponible dans le Record Wizard. Bons enregistrements :D. — 0x010C ~talk~ 14:23, 24 June 2018 (UTC)

Ajout du wallisien (wls)

Check-green.svg Done Yug (talk) 09:09, 29 November 2018 (UTC)

Bonjour, Serait-il possible d'ajouter le wallisien (code wls, catégorie sur le Wiktionnaire : [3]) ? Merci ! Skimel (talk) 21:51, 27 June 2018 (UTC)

Bonjour Skimel, voilà qui est fait (Q5049), tu peux dès à présent faire des enregistrements dans cette langue :). cordialement — 0x010C ~talk~ 10:28, 28 June 2018 (UTC)
Super, merci beaucoup !

Ajouter le Arq (Arabe algérien)

Check-green.svg Done Yug (talk) 09:09, 29 November 2018 (UTC)

Bonjour, pouvez-vous ajouter l'Arabe algérien, pour pouvoir ajouter des sons. Cordialement. -Reda Kerbouche (talk) 12:01, 7 July 2018 (UTC)

C'est fait (Q6714), vous pouvez enregistrer de l'arabe algérien à partir de maintenant ! — 0x010C ~talk~ 07:33, 8 July 2018 (UTC)
Merci -Reda Kerbouche (talk) 12:16, 8 July 2018 (UTC)

Adding languages : new single-click tool for admins

Check-green.svg Done --Yug (talk) 11:45, 15 December 2018 (UTC)

Hi all,

I've just released a new gadget (only available for the sysops at the moment) which add a new option in the tool menu to automatically import a new language from its Wikidata ID.

Have a nice day — 0x010C ~talk~ 14:37, 21 September 2018 (UTC)


Bonjour à tous,

Je viens juste de publier un nouveau gadget (disponible uniquement pour les administrateurs pour le moment) qui ajoute une nouvelle option dans le menu outil afin d'importer en un clic une nouvelle langue à partir de son identifiant Wikidata.

Bonne journée — 0x010C ~talk~ 14:37, 21 September 2018 (UTC)

C'est cool et ça sera sûrement très utile. Pamputt (talk) 20:32, 21 September 2018 (UTC)
0x010C je n'arrive pas à voir où se trouve ce menu « outil » ? Tu aurais un lien ? Merci d'avance. Pamputt (talk) 10:09, 22 September 2018 (UTC)
@ Pamputt : Il faut d'abord activer le gadget dans tes préférences pour pouvoir voir le lien. Le menu outils c'est celui en haut à droite, la petite icône avec des engrenages.
Cordialement — 0x010C ~talk~ 10:47, 22 September 2018 (UTC)
Ok c'est bon, j'ai trouvé. Merci :) Pamputt (talk) 21:54, 23 September 2018 (UTC)

Help:Add a new language

Check-green.svg Done --Yug (talk) 11:43, 15 December 2018 (UTC)

Hi. I created Help:Add a new language. Do not hesitate to modify/improve it :D Pamputt (talk) 20:42, 6 November 2018 (UTC)

I've continued the translation a little bit :) GrandCelinien (talk) 11:54, 10 November 2018 (UTC)

Erreur sur Opera et IE en occitan

Check-green.svg Done -- no recent activity, soon to be archived. 10:40, 23 December 2018 (UTC)

Bonjour, J'ai un problème quand je veux utiliser le Wizzard avec l'interface de Lingua Libre en occitan (sur Linux ou Windows):

  • avec Opera j'ai cette erreur : Impossible de traiter cette demande via lingualibre.fr à l'heure actuelle.
  • avec IE j'ai cette erreur : Le site Web ne peut pas afficher la page HTTP 500

Par contre je n'ai aucun problème si je mets l'interface en français.

Guilhelma

Salut Guilhelma, j'ai déplacé ta question afin qu'elle soit plus visible. C'est à quel moment précisément que ce problème apparait ? Pamputt (talk) 12:22, 4 November 2018 (UTC)
Je suis en train d'investiguer pourquoi le RecordWizard se comporte ainsi concernant l'occitan, alors qu'il fonctionne bien avec toutes les autres langues que j'ai pu tester... je vous tiendrais au courant des avancements. — 0x010C ~talk~ 11:42, 12 November 2018 (UTC)
Désolée, je n'avais pas vu que le message avait été déplacé, cela arrive quand je clique sur Participer/ assistent d'enregistrement, Aure a le même problème aussi. Guilhelma
J'ai créé un ticket sur Phabricator pour ne pas perdre de vue ce problème. Pamputt (talk) 07:00, 27 November 2018 (UTC)
Pamputt, 0x010C, can we archive this discussion since you track this issue on Pharicator ? Yug (talk) 13:55, 19 December 2018 (UTC)

Errors

Check-green.svg Done Yug (talk) 09:10, 29 November 2018 (UTC)

Hi again,

How are errors handled ? I misspronounced with the wrong tone :D (sorrrryyy) Assassas77 (talk) 13:39, 23 June 2018 (UTC)

No problems, If you've by error uploaded a bad pronunciation, you just have to go back to the RecordWizard and record the same word again. This will override the previous bad file on Commons! — 0x010C ~talk~ 13:50, 23 June 2018 (UTC)

Question : Identité des loculeurs et mots composés

Check-green.svg Done -- Discussion between 2 users, now closed I think. Yug (talk) 09:10, 29 November 2018 (UTC)

Salut !

L'interface d'enregistrement est juste géniale, félicitations et bravo pour le boulot.

Juste deux questions :

  • est-ce que le genre du locuteur ou de la locutrice est rendu public ? Si oui, il faudrait le mentionner expressément et de préférence permettre d'y renoncer/de décocher la case.
  • comment faire pour les noms avec une certaine pause au milieu (ex. un arrêt de transport comme Barbès - Rochechouart : l'enregistreur passe directement au mot suivant après Barbès) ? Serait-il envisageable de paramétrer le temps minimum entre deux mots, quitte à baisser le débit ? Ou de le calculer en fonction de la longueur attendue du mot ?

Merci, Kvardek du (talk) 21:13, 27 June 2018 (UTC)

Salut Kvardek du,
Tout d'abord merci !
Pour répondre à tes questions :
  • Oui, le profil locuteur est public en effet, il a pour but d'ajouter des métadonnées utile linguistiquement parlant, mais il n'est pas obligatoire. Bon point cependant, c'est un bug qu'on ne puisse décocher la case, je corrigerais ça ;
  • Il prévu de pouvoir configurer plus finement le studio, dont le temps de pause entre deux mots (mais pas tout de suite, j'ai pleins d'autres trucs avant). Cependant si ça coupe actuellement pour un « Barbès - Rochechouart », je pense que ton micro est réglé trop faible, en augmentant sa sensibilité ça devrait passer tout seul :).
cordialement — 0x010C ~talk~ 08:31, 28 June 2018 (UTC)

Question : Contributions de 2017

Check-green.svg Done -- In think this issue is kind of out of date. Yug (talk) 09:09, 29 November 2018 (UTC)

Bonjour Il me semblait que j'avais contribué à Lingua libre (fin 2017, début 2018 Oc a thon à l'Institut Occitan) mais je ne retrouve plus mes contributions. Elles étaient sous forme de locutions et proverbes en occitan. Je ne retrouve plus non plus mes identifiants de connexion. Pouvez-vous m'éclairer et me dire si c'est normal ? Grand ménage ? Je continuerai bien. Mais le site est extrêmement lent sur mon ordinateur Imac, navigateur Safari. A vous lire merci ~~Ocwiki97~~

Bonjour Ocwiki97,
Pour pouvoir apporter de nouvelles fonctionnalités et assurer son maintien sur le long terme, Lingua Libre a subi une grosse refonte, fruit de 6 mois de travail. Nous avons décidé à ce moment d'abandonner des comptes propres à Lingua Libre pour utiliser le compte unique Wikimedia des utilisateurs. Concernant les anciens enregistrements, ceux-ci vont être progressivement importés sur la nouvelle version, mais cela va prendre du temps (quelques mois), car il y a pas mal de tri à faire dedans...
Je reste disponible si vous avez d'autres questions.
Cordialement — 0x010C ~talk~ 22:08, 15 July 2018 (UTC)
Bonjour Ocwiki97, concernant les lenteurs du site, est ce que tu pourrais décrire précisément ce que tu fait lorsque tu t'aperçois que le site est lent ? Un maximum d'informations permettra peut-être de corriger ce problème de lenteur. Pamputt (talk) 21:50, 17 July 2018 (UTC)

Recordings on Wikidata

Check-green.svg Done Yug (talk) 09:07, 29 November 2018 (UTC)

Is it possible to have an automatic way to add the recordings in the related Wikidata item (P443)? --Yiyi

Lingua Libre Bot does it already. Pamputt (talk) 21:32, 23 July 2018 (UTC)
Thanks, it's fantastic! I started to collect some pronunciations in Italian :-) --Yiyi (talk) 08:56, 24 July 2018 (UTC)
Hi! Looks like the bot does it about once a month. Do you think it would be relevant to make it run more often, let's say once a week? Exilexi (talk) 13:41, 10 October 2018 (UTC)

Technews

Check-green.svg Done -- Yug (talk) 13:51, 19 December 2018 (UTC)

(Version française en dessous / French version below)


Hi!

It's been a while since the last improvements of Lingua Libre. But the past week was a good week:

  • Upload to commons : Lingua Libre Bot will now add in near real time the new audio recordings on the Wiktionary / Wikidata (it only ran one once a week before);
  • Download by language: A dataset of all recordings made with Lingua Libre is now downloadable here: lingualibre.zip; an export is also made for each language, to find there: datasets; these are updated every 2 days;
  • New word list generator: A new word list generator named PetScan is available as a gadget; it allows you to retrieve the results of your queries on the PetScan tool by injecting them into the RecordWizard; to activate it, go to the preferences menu, in the tab Gadgets , then check the box corresponding to PetScan;
  • Minors: And small bug fixes (eg T203345).

Feedbacks are really appreciated, so don't hesitate to leave one :)

0x010C ~talk~ 19:03, 26 October 2018 (UTC)


Bonjour !

Cela fait un moment qu'il n'y avait plus eu de nouveautées, mais la semaine qui s'acchève fut une bonne semaine :

  • Lingua Libre Bot va maintenant ajouter en quasi temp réel les nouveaux enregistrements audio sur le Wiktionnaire / Wikidata (il ne tournait qu'une fois par semaine au auparavant) ;
  • Un dataset de tous les enregistrements effectués avec Lingua Libre est dorénavant téléchargeable ici : lingualibre.zip ; un export est également fait pour chaque langue, à retrouver là : datasets ; ceux-ci sont mis à jour tous les 2 jours ;
  • Un nouveau générateur de liste nommé PetScan est disponible sous forme de gadget ; il permet de récupérer les résultats de vos requêtes sur l'outil PetScan en les injectant dans le RecordWizard ; pour l'activer, rendez-vous dans le menu préférences, dans l'onglet Gadgets, puis cochez la case correspondant à PetScan ;
  • Résolution de petits bugs (par exemple T203345)

N'hésitez pas à laisser des retours sur ces nouvelles fonctionnalités :)

0x010C ~talk~ 19:03, 26 October 2018 (UTC)

Merci beaucoup pour ces nouvelles et l'excellent travail que tu as effectué ces derniers jours. Espérons que ça rende la contribution encore plus simple. Bon courage. Pamputt (talk) 13:06, 28 October 2018 (UTC)


Téléversements sur commons brusquement impossible

Check-green.svg Done Yug (talk) 09:06, 29 November 2018 (UTC)

Bonjour, donc voyant qu'il manquait de l'Anglais je me suis lancée. Brusquement je ne peux plus téléverser sur commons, pour une raison que je ne m'explique pas (je viens d'importer des photos et là no problemo..) Nattes à chat (talk) 15:43, 28 October 2018 (UTC)

Salut Nattes à chat,
Est-ce que tu avais laissé l'onglet ouvert longtemps ? Si oui, c'est peut-être que ta session a expiré sur Lingua Libre. As tu eu besoin de te reconnecter pour venir écrire ce message ?
Cordialement — 0x010C ~talk~ 17:14, 28 October 2018 (UTC)

Aucun versement n'est passé ce soir.

Check-green.svg Done Yug (talk) 09:05, 29 November 2018 (UTC)

L'outil s'est bizarrement comporté il y a quelques minutes, j'ai essayé de recharger la page plusieurs fois, en remettant systématiquement ces même 6 mots que j'essaie de rajouter, mais rien, une fois l'enregistrement passé, le mot passe au rouge et n'est pas envoyé sur le serveur. C'est un peu rageant... :/ Lyokoï (talk) 23:02, 11 November 2018 (UTC)

@Lyokoï: J'ai mis à jour Lingua Libre hier de Mediawiki 1.30 vers Mediawiki 1.31, après deux jours de tests fructueux sur le serveur de dev. Sauf que pour le passage sur le serveur de prod, un sous-module de Wikibase ne s'est pas installé comme il aurait du, entraînant le résultat que tu as vu. C'est fixé maintenant, désolé pour la gène occasionnée. — 0x010C ~talk~ 11:40, 12 November 2018 (UTC)
@0x010C: Merci pour l'info. J'arrive à passer l'étape maintenant, mais après plusieurs essais de rechargement, fermeture de PC, etc, je n'arrive pas à envoyer sur Commons. Y'a moyen de vérifier si ça vient de moi ou pas ? Lyokoï (talk) 12:55, 14 November 2018 (UTC)
@Lyokoï : L'erreur est résolu, cf section plus bas :) 0x010D (talk) 15:45, 22 November 2018 (UTC)

API Error while trying to import on commons

Check-green.svg Done, this section can be archived. -- Yug

Hi everyone, I am having the following error when at the last step, for each file. Can anybody help?

{
    "error": {
        "code": "permissiondenied",
        "info": "You don't have permission to \u29fcaction-remoteupload\u29fd.",
        "*": "See https://lingualibre.fr/api.php for API usage. Subscribe to the mediawiki-api-announce mailing list at <https://lists.wikimedia.org/mailman/listinfo/mediawiki-api-announce> for notice of API deprecations and breaking changes."
    }
}

Thanks, Jagwar (talk) 20:47, 15 November 2018 (UTC)

Hi Jagwar, 0x010C will answer about this error or you can open a Phabricator ticket to keep track on it. Pamputt (talk) 21:28, 15 November 2018 (UTC)
I have created a Phabricator ticket to track this issue. Pamputt (talk) 21:16, 19 November 2018 (UTC)
Hi Jagwar,
Sorry for the inconvenience, this error is fixed now :)
Best regards 0x010D (talk) 15:43, 22 November 2018 (UTC)

How to download all audios of one language ? By speaker ?

Check-green.svg Done --Yug (talk) 11:10, 15 December 2018 (UTC)

Per above title ! Yug (talk) 10:15, 20 June 2018 (UTC)

Hi Yug. AFAIK, It is not yet possible. Pamputt (talk) 05:28, 22 June 2018 (UTC)
See LinguaLibre:Chat_room#Technews and https://lingualibre.fr/datasets/ Yug (talk) 14:09, 21 November 2018 (UTC)

None of the uploads were successful

Check-green.svg Done --Yug (talk) 11:24, 15 December 2018 (UTC)

Hi again Pamputt, I´m recording some audios for the first time but, after record them, it says: None of the uploads were successful, and the message Reintentar carga fallida. What could be the problem?. Rodelar (talk) 14:56, 16 November 2018 (UTC)

I have created a Phabricator ticket to track this issue. Pamputt (talk) 21:16, 19 November 2018 (UTC)
Thank you!. There are some parts to be translated and I don´t know how to do it in translatewiki: the tutorial of the record assistant and the filtres at the sound library section. Rodelar (talk) 20:15, 20 November 2018 (UTC)
Pamputt, it works again, thank you, I recorded my first audios :). About the tutorial of the record assistant and the filtres, where can I translate them?. Rodelar (talk) 21:48, 30 November 2018 (UTC)

Translation

Check-green.svg Done? -- Rodelar, Pamputt, is this section closed ? Yug (talk) 14:11, 15 December 2018 (UTC)

Hi, how can I translate the LinguaLibre page into other language?. Thanks. Rodelar (talk) 11:48, 1 August 2018 (UTC)

Hi! Translations are located in several places, the following help page explains how to edit each parts :) Help:Translate. Best regards — 0x010C ~talk~ 08:49, 3 August 2018 (UTC)
Thank you! The problem is that I don´t find the "Translate this page" message in all pages. Best, Rodelar (talk) 12:57, 2 September 2018 (UTC)
Which pages do you want to translate ? It depends, and for some of them, we need to create a sub page here :) GrandCelinien (talk) 22:22, 5 September 2018 (UTC)
I would like to translate the main page, get involved and sound library, in order to facilitate the dissemination of the project and participation in it. Rodelar (talk) 19:01, 9 September 2018 (UTC)
0x010C, GrandCelinien. Rodelar (talk) 17:24, 19 September 2018 (UTC)
Hello, i've seen your message ; I think you have to get admin rights to translate (at least) the main page ! So i've sent a email to 0x010C last week, waiting for an answer ^^ GrandCelinien (talk) 15:27, 20 September 2018 (UTC)
Rodelar, to translate the main page in your language, you have to create several page like MediaWiki:Mainpage/es (from MediaWiki:Mainpage), MediaWiki:Mainpage-top/es, MediaWiki:Mainpage-principle/es, MediaWiki:Mainpage-help/es, MediaWiki:Mainpage-bottom/es, MediaWiki:Mainpage-credit/es, MediaWiki:Mainpage-recordwizard/es, MediaWiki:Mainpage-quoteblock/es, MediaWiki:Mainpage-welcome/es, MediaWiki:Mainpage-motto/es, MediaWiki:Mainpage-goal/es, MediaWiki:Mainpage-middle2/es, MediaWiki:Mainpage-about/es. Maybe I miss some. To get the name of all pages to translate, you can have a look on the code of the main page. Yet, as said by GrandCelinien, I do not know whether you can create these pages. Pamputt (talk) 16:27, 20 September 2018 (UTC)
Thanks to both of you. I tried but I can´t create those pages, so I guess I should have admin rights on Commons?. Rodelar (talk) 01:07, 1 November 2018 (UTC)
Right, common user cannot edit in the MediaWiki namespace. To do it, you have to get the admin rights here (not on Commons). We are looking for the creation of a translator right for users so that they can edit these pages. User:0x010C may speak more about that. For now, you can put here the Spanish translation for each Mediawiki page and I will copy them in order Lingua Libre be in SPanish for you and others. Pamputt (talk) 12:18, 4 November 2018 (UTC)
Great to know about the translation right. Meanwhile I will do as you suggest, paste here the translation. Thank you! Rodelar (talk) 21:51, 8 November 2018 (UTC)

Pamputt, this is the translation:

Lingua Libre

Lingua Libre es una beta abierta. Ten en cuenta que todavía pueden producirse fallos. Por favor, comparte tus comentarios aquí!

Bienvenido a Lingua Libre!

Lingua Libre es una biblioteca de grabaciones de audio que todo el mundo puede completar con palabras, proverbios, frases, etc. Lingua Libre ha sido diseñada para que cualquier persona pueda transmitir a las generaciones futuras el frágil tesoro de la oralidad. Las palabras, frases, expresiones recogidas gracias a ti mejorarán algunos proyectos de Wikimedia (como Wikipedia, Wikimedia Commons o Wiktionario) y ayudarán a los especialistas en su trabajo.

Descubre el proyecto | Graba voces | Sala de chat

Acerca de

Este ambicioso proyecto tiene como objetivo reunir un corpus de audio único que ayudará a dar visibilidad a las lenguas minoritarias y regionales mediante la mejora de las diferentes versiones lingüísticas de Wikipedia y el suministro de material de audio para ilustrar las entradas de Wikcionario.

'''Involúcrate'''
'''Asistente de grabaciones'''
Tutorial
Comprueba tu micrófono:
Cuando estés listo, presiona el botón de arriba para iniciar una prueba de grabación.
Pronuncia una palabra en voz alta, por ejemplo "sol".
Escucha la grabación para comprobar que es correcta
Adapta la configuración de tu micrófono si es necesario
Si todo es correcto, puedes continuar con el siguiente paso!
Si necesitas ayuda para configurar el micrófono, puedes consultar esta página de ayuda.
Speaker
Perfil a usar:
Tu perfil principal
Otros perfiles
Crea un nuevo perfil
Detalles
Shuffle list = Lista aleatoria
oprime = pulsa
Nearby ítems = Elementos cercanos
'''Biblioteca de audios'''
'''Lista de grabaciones'''
Filtres - Filtros
Speaker - Locutor
Language - Idioma
Language level - Nivel de comprensión: beginner - principiante, average level - nivel medio, good level - nivel alto, native - nativo 
Transcription - Transcripción
Filtrer - Filtrar!
'''Lista de locutores'''
Filtres - Filtros
Item - Elemento
Speaker username - Nombre del locutor
Place of residence - Lugar de residencia
'''Estadísticas'''
Number of records per languages - Número de grabaciones por idioma
Item - Elemento
Language - Idioma
Number of records - Número de grabaciones
The most prolific speakers - Locutores más prolíficos
Filtres - Filtros
Item - Elemento
Speaker - Locutor
Number of records - Número de grabaciones
The most recorded words - Palabras más grabadas
Filtres - Filtros
Transcription - Transcripción
Number of records - Número de grabaciones
Languages - Idiomas

There is an extra "a" in the Speakers list page. If there are problems with the translation, please let me know. Rodelar (talk) 18:34, 9 November 2018 (UTC)

Rodelar, I will import your translations on Sunday. If you have time before, could you tell me, for each translation, which page it is about (for example MediaWiki:Mainpage-motto/es, ...). Pamputt (talk) 23:49, 9 November 2018 (UTC)
Thank you Pamputt; I translated several pages and, on each page, titles and paragraphs; Lingua libre is the main page, Involúcrate is Get involved (inside it, asistente de grabaciones), sound library is Biblioteca de audios (inside it, Lista de grabaciones, Lista de locutores y Estadísticas). I don´t know what MediaWiki page are. If it is not clear, I can add the text in English next to the translation. Rodelar (talk) 02:13, 11 November 2018 (UTC)
Yes adding the English text next to the Spanish translation would help me. I understand a little bit Spanish so I can match Spanish translation with the original English page but any help would be nice ;) Pamputt (talk) 08:58, 11 November 2018 (UTC)
I reviewed the Main page and it is perfect! The Asistente de grabaciones doesn´t work right now. I added the English text to the translations for the sound library part. Rodelar (talk) 12:22, 11 November 2018 (UTC)
The Record Wizard is back. However, to translate the Record Wizard interface, this is done on translatewiki.net. So you can do it by yourself over there. Pamputt (talk) 20:16, 11 November 2018 (UTC)
I translated it on Translatewiki.net, after get the rights, but the record assistant section is still in English. How long does it take to update?. On the other hand, can you change, in the main page, Bienvenido a Lingua Libre --> ¡Bienvenido/a a Lingua Libre! Rodelar (talk) 18:50, 15 November 2018 (UTC)
Hello Rodelar, Go to Special:Preferences#mw-prefsection-personal-i18n, set it to Spanish, and look around if your sentences are on. --Yug (talk) 16:20, 15 December 2018 (UTC)

Clean up ?

Check-green.svg Done -- mainly done. Yug (talk) 14:17, 15 December 2018 (UTC)

Hello guys, the Chatroom may need some clean up.

  1. On my side, I do my best to keep all my "add that language pleeeease" requests in same section above, but it seems we are many to do so. Could be wise to gather these requests together. Ok to let each other move sections when it adds clarity ?
  2. Could we also share our vision of the archiving process. As a baby-wiki, could we be bold and naughty ? Politely archiving each other sections when a section is aging too much... :D Yug (talk) 14:35, 28 November 2018 (UTC)
In just two words: Be bold! Both points are good ideas, it just lack someone to do it, so if you're willing to, please make it :) To archive this page, maybe you can just copy-past old sections in a per-year (eg LinguaLibre:Chat_room/Archives/2018) or per-month (eg LinguaLibre:Chat_room/Archives/2018/11) subpage?
Thanks for your involvement — 0x010C ~talk~ 16:38, 28 November 2018 (UTC)
Thanks 0x ! ;)
FYI, I created a template {{done}} -- can be closed ~~~~, with a simpler code than the one on wiki-en. This allow everyone to "tag" a section as ready to be closed, with a timestamp as you comment and sign. I reviewed most sections, I didn't review the long ones. Few weeks later an editor can archive the sections tagged. You can use the template, a comment and your signature such as :
Check-green.svg Done -- this section is closed. Yug (talk) 08:53, 29 November 2018 (UTC)
Hehe ^^ Yug (talk) 08:53, 29 November 2018 (UTC)

2018.12 : Paris LL Hackathon

Check-green.svg Done --Yug (talk) 17:34, 16 December 2018 (UTC)
VIEW : LinguaLibre:Hackathon 15-16 Décembre
Eh bien je vous souhaite que ce weekend soit riche en amélioration pour Lingua Libre (et en bonne humeur) ! Cordialement GrandCelinien (talk) 11:38, 12 December 2018 (UTC)
Merci ! :) Lyokoï (talk) 12:00, 15 December 2018 (UTC)
On y est !!! on est a fond !!! :D Yug (talk) 14:10, 15 December 2018 (UTC)


Key directions and task forces

Check-green.svg Done Yug (talk) 10:51, 31 December 2018 (UTC)

Following the 2018.12.15-16 Paris hackathon and ongoing github clean up, I bumped into this past structuration :

The Dev team
The administrative-communication team 
The linguistic research team
The recording team

I think the idea is interesting and worth to keep in mind. Yug (talk) 13:35, 19 December 2018 (UTC)

emoji sur la page d'accueil

Check-green.svg Done Unicode character replaced by pure html css. Yug (talk) 09:43, 23 December 2018 (UTC)

Bonsoir, bravo pour le hackathon ! Je signale tout de même que l'emoji qui semble exister à côté du bouton « Enregistrer des voix » sur la page d'accueil ne s'affiche pas sur mon chrome (Win7) :) Bises GrandCelinien (talk) 20:07, 20 December 2018 (UTC)

GrandCelinien, c'est un caractere unicode, un cercle rouge typique des bouttons "enregistrer". Je corrige ca des que je suis sur mon PC. Merci pour le retour de bug ! Yug (talk) 22:25, 20 December 2018 (UTC)
Must be ok now, can you confirm ? Yug (talk) 12:44, 22 December 2018 (UTC)

"Impossible de contacter le serveur."

Check-green.svg Done -- main issue closed. Minor talk on wiktionary thesaurus. Yug (talk) 11:01, 23 December 2018 (UTC)
"Impossible de contacter le serveur. Veuillez vérifier votre connexion internet et réessayer".

Bonjour,
J'ai depuis hier ce message qui m'empêche d'accéder au wizard lui même. Même en réessayant plusieurs fois, connexion, déconnexion rien ni fait. Une idée ?

--Benoît (talk) 08:35, 20 December 2018 (UTC)

Le souci a sensiblement changé : j'obtiens le truc d'attente qui tourne et qui ne s'arrête jamais (plus de message par contre). Benoît 13:27 (UTC)
Salut Benoit,
TL;DR: C'est corrigé, désolé pour le dérangement.
Version longue : Le RecordWizard enregistre ton Qid de locuteur dans un champ caché dans tes préférences utilisateur. Si pour une raison ou une autre les préférences sont réinitialisé (en cliquant sur Restaurer tous les paramètres par défaut par exemple), le RecordWizard ne reconnait alors plus ton locuteur et essayera de t'en créer un nouveau. Sauf que Wikibase rale à ce moment là (à juste titre), car on essaye de créer deux items avec le même label et la même description. J'ai fais un correctif temporaire qui va réassocié le compte utilisateur à l'item de locuteur si une telle erreur est détecté, mais c'est plus un correctif temporaire en attendant de faire mieux.
Pour éviter cela (tu n'es pas le premier à qui cela arrive), je vais d'ici peu déplacer cette configuration vers un autre endroit de MediaWiki où elle ne risque pas d'être réinitialisé par accident. J'hésite à l'heure actuel entre deux solution, soit utiliser les propriétés de page, soit stocker cela dans une sous-page dédiée pour chaque utilisateur.
Cordialement — 0x010C ~talk~ 15:06, 20 December 2018 (UTC)
Coucou. Merci pour la réactivité et les explications. Bien à toi, --Benoît 21:36, 20 December 2018 (UTC)


My recordings never turn green

Check-green.svg Done, user found ut solution. Yug (talk) 10:57, 31 December 2018 (UTC)

I don't know if I'm doing something wrong, but it only remains blue or sometimes turns red, but never green. What am I missing? NMaia (talk) 11:08, 22 December 2018 (UTC)

Hello NMaia, thanks for using LinguaLibre and providing this informations.
My first idea : if your microphone is too sensitive, audio will always be saturated, too loud, and thus fail (red).
After what, could you provide more info : your system, links to screenshots if possible or the bugging page's url and/or content description ?
Did you test with recent Chrome or Firefox, most of our users use these and it work fine. Yug (talk) 10:28, 23 December 2018 (UTC)
Hi Yug, thanks for reaching out. I found out the problem: I was clicking the record button before it turned green. I didn't know I had to wait 😅 NMaia (talk) 17:17, 27 December 2018 (UTC)

Warn the user when they try to record a file that they already made

Kind of Check-green.svg Done : feature request to avoid duplicate recording opened. See T212580. Yug (talk) 10:55, 31 December 2018 (UTC)

Yesterday I accidetenly recorded the Esperanto word "tuj" twice. My second upload overwrote my first upload on Commons: https://commons.wikimedia.org/wiki/File:LL-Q143_(epo)-Robin_van_der_Vliet-tuj.wav

It would be nice if this site would give me a warning if I add a word to the list of words that I want to record. Robin van der Vliet (talk) 17:29, 22 December 2018 (UTC)

There have been oral discussions on this. Ideally, when in the Record wizard, facing a words list and ready to record, the list on screen can be compared with the speakers' previously recorded words. Via a checkbox, words already recorded could be toggled grey and skipped or into display:none. This feature request emerged recently as users are coming back (<3) to record again different words lists. It is not coded so far. @Devs: what is the best way to ask a such feature ? Phabricator issue could be opened, I guess. Yug (talk) 10:24, 23 December 2018 (UTC)
Hi Robin van der Vliet! This feature is planned, but I have first to solve a couple of technical issues before its implementation. I can't give you any date yet, it will be at some point in early 2019 ;).
@Yug: Phabricator is the right place to do so: https://phabricator.wikimedia.org/tag/lingua_libre/
Best regards — 0x010C ~talk~ 12:15, 23 December 2018 (UTC)
Ok, super. I opened T212580 and reorganized a bit the working board. Yug (talk) 18:14, 23 December 2018 (UTC)

CJK recording and Studio CSS

Check-green.svg Done -- fixed on github. Yug (talk) 20:38, 23 December 2018 (UTC)

Where can I edit the CSS of the record wizard ? The focus-underline is confusion for Chinese character and others scripts, I would like to remove it. See first blue word underlined via css here for example. Yug (talk) 18:14, 23 December 2018 (UTC)

Fixed on github. Effective in next deploiment. Yug (talk) 20:38, 23 December 2018 (UTC)
I've reverted your commit, because what you've edited is the css of the demo studio of the LinguaRecorder library, not the studio of the RecordWizard. The right file to edit is this one ;). (and please, don't put a red border, user may think there is an error...) — 0x010C ~talk~ 00:14, 24 December 2018 (UTC)
Thanks 0x010C !! I found the "demo" name a bit suspicious indeed XD Thanks for the correction ! Yug (talk) 10:34, 24 December 2018 (UTC)

Limitation dans le choix de catégories

Check-green.svg Done -- solved. Yug (talk) 10:54, 31 December 2018 (UTC)

Bonjour,

Ce n'est pas possible d'enregistrer une langue donnée quand on sélectionne un lexique de cette langue dans un wikiprojet qui n'est pas dans cette langue.

Par exemple : impossible d'enregistrer en anglais la catégorie "Catégorie:Lexique en anglais du cyclisme" issue de fr.wikt.

Le problème - possiblement - est que la catégorie n'est pas "nativement" associée à l'anglais et qu'il faudrait sans doute vérifier préalablement que "Catégorie:anglais" est parente de la catégorie choisie pour fiabiliser les enregistrements à venir juste après.

Bref. Ce n'est pas vraiment une question mais plutôt une piste de réflexion.

Bonnes fêtes à tous et à toutes. --Benoît (talk) 11:51, 25 December 2018 (UTC)

Salut Benoît :)
Est-tu sûr que tu as bien sélectionné "fr - Wiktionnaire" (quand tu enregistre de l'anglais, c'est Wikipédia en anglais qui est sélectionné par défaut) et que tu n'as pas fait une faute de frappe ? Car j'arrive bien à charger la catégorie anglaise que tu indiques...
Si effectivement cela ne fonctionne pas chez toi, je regarderais plus en profondeur.
Bonnes fêtes à toi aussi ! — 0x010C ~talk~ 00:23, 26 December 2018 (UTC)
Coucou,
Non, c'est moi qui me suis emmêlé les pinceaux (du coup je vais enregistrer "s’emmêler les pinceaux").
Ça marche effectivement très bien.
--Benoît (talk) 08:22, 26 December 2018 (UTC)
Chouette chouette chouette :) — 0x010C ~talk~ 11:11, 27 December 2018 (UTC)

Why Commons logs me out so quickly during recording

Likely Check-green.svg Done. Yug (talk) 10:51, 31 December 2018 (UTC)

I usually take about 100 lexemes from Wikidata to record. I do it that way:

  1. enter record wizard, it asks me to log into commons, I do it
  2. then I quickly setup speaker
  3. then I quickly setup list of words by entering url to query
  4. then I record words
  5. then I listen recorded words to catch any failures
  6. then I upload records to commons

I do every step of above as quick as possible. But in the middle of the upload to commons uploading stops and all failures happen. It took me a day to realise that I'm simply logged out from my OAuth Commons session. I workaround this now by opening second window of record wizard and again pass first step with logging in. Then return to window with upload session and retry. Finally everything is uploaded. Note all this time I'm not logged out from Commons, only OAuth session of Lingua Libre is logged out. Why OAuth session in Commons is so short? KaMan (talk) 12:20, 25 December 2018 (UTC)

Same here. I do some wiki maintenance mainly, but my login time is about 30 mins these past few days. Too short. I may be a real issue for recording sessions. Yug (talk) 18:15, 25 December 2018 (UTC)
Yep, I know... Jitrixis tried during the last Lingua Libre hackathon to fix this, bit it seems that it has not changed.
This issue is near the top of my personal todo-list, so I expect to have a look at it by the end of the week.
Thanks KaMan for the report! — 0x010C ~talk~ 00:28, 26 December 2018 (UTC)
Ok, after a day of research, I've found the issue. I'm currently trying a patch on the testing instance of Lingua Libre. If it works as expected, I'll deploy it here this night (UTC+2 timezone). The session will last 24 hour after that. — 0x010C ~talk~ 19:17, 26 December 2018 (UTC)
I've just pushed the new patch into Lingua Libre, so that you'll have to login only once as long as you keep your browser open from now on. — 0x010C ~talk~ 11:20, 27 December 2018 (UTC)
Many thanks! I will test it. KaMan (talk) 13:12, 27 December 2018 (UTC)
It works for me as of today ! I stay logged in much longer. I didn't had to log in in past 24hrs. Yug (talk) 18:46, 29 December 2018 (UTC)

Utiliser le Lingua Libre Bot dans l'incubator:shy

Est-ce que c'est possible de faire la même chose pour le wiktionnaire en Chaoui ? je veux dir est-il il possible d'utiliser votre bot sur notre wiktionnaire aussi ? je peux donner l'algorithme du wiki-test. Cordialement. -Reda Kerbouche (talk) 12:32, 8 July 2018 (UTC)

Oui bien sur ! Avez-vous un bistro / village pump / ... pour en discuter là-bas ? — 0x010C ~talk~ 15:24, 8 July 2018 (UTC)
Oui il y a un bistro vierge du wiktionnaire Chaoui que vous pouvez activer. Ou bien celui de l'incubator où en peut discuter avec des administrateurs à propos de l'autorisation du bot. Cordialement. -Reda Kerbouche (talk) 18:26, 8 July 2018 (UTC)
Je suis en ce moment en chemin pour Wikimania, je vais n'avoir que très peu de temps jusque là, mais je lancerais la discussion à mon retour. Cordialement — 0x010C ~talk~ 11:43, 11 July 2018 (UTC)
Bon voyage.--Reda Kerbouche (talk) 21:48, 11 July 2018 (UTC)

0x010C J'espère que vous m'avez pas oublié =) Car en septembre on lance un concours pour le wiktionnaire en Chaoui, et si on peut enregistrer des mots qui vont passer directement sur incubateur, je fais la promo de Lingualibre en même temps que la promo du concours.--Reda Kerbouche (talk) 14:01, 16 August 2018 (UTC)

Reda Kerbouche, 0x010C, Is this {done} ? --Yug (talk) 11:04, 15 December 2018 (UTC)
Bots-related documentation could be gathered in Help:Bots Yug (talk) 11:01, 31 December 2018 (UTC)

Liste sur le modèle de Petscan

Salut, est ce qu'il serait possible de faire une liste à la volée sur le modèle de ce qu'est capable de faire Petscan ? Ici, on a la liste de tous les lemmes du Wiktionnaire qui n'ont pas de catégorie « Prononciations audio en français » ce qui signifie qu'il n'ont pas le modèle « écouter » qui permet d'ajouter les entrées dans cette catégorie. Je trouve que la génération d'une telle liste serait vraiment sympa pour les Wiktionnaires. Pamputt (talk) 06:07, 12 July 2018 (UTC)

L'idée est bonne en effet, cependant ça représente un gros boulot à intégrer sur Lingua Libre. Je pense qu'il serait intéressant d'en discuter un peu et d'établir un petit cahier des charges de ce que l'on veut pouvoir faire (tout dans petscan n'est pas utile ici). — 0x010C ~talk~ 22:00, 14 July 2018 (UTC)
0x010C, est ce que tu penses que l'exemple que j'ai donné ci-dessus (lemmes en français qui n'ont pas de prononciation) peut être implémenté à partir de MediaWiki:Gadget-Demo.js. Pamputt (talk) 14:23, 14 October 2018 (UTC)
Oui c'est exactement ça, il faut passer par la création d'un nouveau générateur de mots. Dans mon début de réflexion plus haut, je réfléchissais à comment implémenter les fonctionnalités de petscan dans un générateur. Sauf que niveau performance et rapidité, on pourrait jamais faire quelque chose d'utilisateur avec des catégories aussi grosse que "Lemmes en français", je m'explique. Petscan fait son travail de recherche et de recoupement côté serveur, directement sur une copie de la base de donnée des wikis (il peut ainsi en un coup explorer tous les enregistrements). Or ici, nous n'avons pas d'accès à la base de donnée et les calculs doivent être fait côté client, en javascript. On dépend donc de l'API des wikis en question pour récupérer les données, API qui n'est pas du tout faite pour travailler sur des catégories très grosses (ne peut retourner que 500 membres par requête, etc).
Bref, c'est pas possible. Cependant, on peut imaginer se reposer sur petscan pour faire le boulot chiant à notre place (ce générateur deviendrait complètement dépendant de cet outil externe, une panne de ce dernier bloquerait le fonctionnement du premier). Je vois trois options :
  1. le générateur reprend un certain nombre de champs de petscan, et va à partir des valeurs fournies générer une requête à petscan (complexe pour l'utilisateur lambda, flexible pour l'utilisateur expérimenté) ;
  2. le générateur propose à l'utilisateur de choisir parmi un certain nombre de requêtes petscan préparé à l'avance par nos soins (par exemple en cliquant sur "mots en français n'ayant pas de prononciation sur le wiktionnaire francophone", ta requête exposé plus haut serait utilisé), ou de coller l'URL / l'identifiant d'une requête qu'il a préparé / trouvé (plus simple à implémenter, nous oblige à créer pleins de requêtes pour supporter différentes langues, assez flexible) ;
  3. on fait un générateur spécialisé "mots dont la prononciation est manquante" où il va automatiquement forger la requête petscan pour faire comme dans ton exemple pour la langue sélectionnée (facile d'utilisation, très spécifique mais potentiellement très utile, nous obligerait à renseigner manuellement les catégories wiktionnaire correspondante car je ne vois aucun moyen de deviner le nom de la catégorie d'une langue à partir de son code ou son id wikidata...)
Qu'en penses-tu ?
0x010C ~talk~ 02:53, 16 October 2018 (UTC)
La première proposition me semble trop usine à gaz et bien que puissante, je ne pense pas qu'elle s'adresse au public de Lingua Libre.Entre les propositions 2 et 3, j'ai une préférence pour la 2 car elle est simple d'utilisation au premier abord (on utilise des requêtes pré-forgées) tout en permettant une utilisation avancée (avantage de la solution 1). Et par rapport à la solution 3, ça évite de la maintenance pour déterminer la langue d'une catégorie donc c'est plus maintenable sur le long terme à mon avis. Pamputt (talk) 06:23, 17 October 2018 (UTC)
@Pamputt: Entre deux avions, je viens de finir une première version du générateur petscan, activable via préférences > gadgets. Est-ce que tu peux y jetter un œil et me dire ce que tu en penses avant que je continue et que je l'annonce plus largement ?
Merci — 0x010C ~talk~ 08:39, 22 October 2018 (UTC)
0x010C, j'ai activé le gadget et je vois bien PetScan dans la liste. J'ai fait quelques essais et ça fonctionne bien. J'ai essayé avec l'URL du premier message et ça fonctionne nickel. En revanche, j'ai essayé avec ça et ça m'indique "Petscan output something weired with this URL, check it and come back afterwards.". En revanche si j'ajoute le « &doit= » à la fin, ça fonctionne correctement (est-il vraiment nécessaire) ?
Autre point, cest-ce qu'il est déjà possible de préparer des requêtes pré-faites (« mots en français n'ayant pas de prononciation sur le wiktionnaire francophone », ...) ou pas encore ? En l'état c'est déjà super cool. Pamputt (talk) 17:04, 22 October 2018 (UTC)
J'avais oublié que cetaines URL pouvaient ne pas avoir l'auto-run, c'est fix. Je réfléchis actuellement à la meilleur façon de faire en fait. Ma problématique, c'est qu'une requête comme « mots en français n'ayant pas de prononciation sur le wiktionnaire francophone » n'intéressera que ceux qui font des enregitrements en français, si un germanophone dois scroller 25 requêtes qui le concerne pas (et qu'il ne comprend surement pas) avant d'en trouver une en allemand, c'est pas cool pour lui.
De là, trois idées qui me viennent en écrivant ces lignes :
  • Une page par langue, dans l'espace de nom list (List:fra ? List:fra-external ? List:fra-examples ? ...) qui regroupe via une liste à puce toutes les urls dispo pour une langue ;
  • Une fois ce travail fait, ce n'est pas très compliqué de supporter d'autres outils externes qui peuvent être appelé via une URL et renvoyer le résultat en JSON ; je pense notamment à querry.wikidata.org ;
  • Et là, plus une réflexion, est-ce que ça serait pertinent une fois que ça sera stable de l'intégrer au générateur "listes" actuel (genre avoir deux onglets dedans, "listes statique", "listes dynamiques/externes/..." ?), ou l'intégrer comme un nouveau générateur à part entière dans le core du RecordWizard ? (et du coup comment le nommer dans ce cas ?)
Un avis externe me serait bien utile pour trancher tout cela :) — 0x010C ~talk~ 19:52, 22 October 2018 (UTC)

Variations géographiques

Bonjour,

Bravo pour ce projet très intéressant.

Je me pose une question à propos des prononciations. Je suis du sud de la France et contrairement à une bonne partie du reste de la France, nous usons beaucoup de l'accent tonique (influence italienne et espagnole, j'imagine). Du coup, la prononciation de certains mots, et surtout des locutions, ont une rythmique différente par chez moi.

Comment gérer ces variations de prononciation ? Ont-elles droit de cité ou comme les québécois doit-on privilégier un "Français international" neutre ?

Pour finir sur le sujet, la prononciation de certains mots sont différentes chez nous : lait, mas, moins (avec un s !), etc. Comment intégrer ça dans Wiktionnaire ou Wikipédia ?

Jpgibert (talk) 12:02, 13 July 2018 (UTC)

Bonjour,
Merci pour ton intérêt !
Non, il ne faut surtout pas privilégier un français "neutre". Chaque variation / accent locale est intéressent. En fait, juste avant de commencer à enregistrer il t'es demandé de remplir ton profil de locuteur, dans lequel tu peux renseigner ton lieu d'habitation / d'apprentissage d'une langue.
Lorsqu'un enregistrement est ajouté ensuite sur le Wiktionnaire par exemple, cette information y est inclu. Si plusieurs personnes ont enregistré les même mots, on pourra donc écouter les différences de prononciation de « lait » en Alsace, au Québec, en Occitanie, en Île de France, au Mali,... Et ça c'est cool :)
Cela répond à tes questions ?
Cordialement — 0x010C ~talk~ 21:55, 14 July 2018 (UTC)
Bonjour User:0x010C
Merci pour la réponse. Je m'inquiétais de la chose parce que s'il existe un code linguistique pour les variations du français au Québec (fr-CA) ou de Belgique (fr-BE), en revanche l'accent n'est pas pris en compte.
Content d'apprendre que malgré mon accent, je serai le bienvenu. Bon pour le moment, faut que j'achète un bon micro avant de faire quoi que ce soit, mais dès que j'aurai ça, je tenterai de partager mon accent méridional.
Jpgibert (talk) 12:31, 23 July 2018 (UTC)

Thésaurus

Bonjour,

Durant la vidéo de présentation du projet par Lyokoï (LetsContribute6), j'ai appris qu'on pouvait générer des listes de mots à partir de catégories. Serait-il possible de faire le même genre de chose à partir d'un thésaurus ? Question subsidiaire, est-ce que ça à un intérêt ?

Jpgibert (talk) 12:39, 23 July 2018 (UTC)

Ca pourrait effectivement être intéressant même si c'est plus compliqué à coder (j'imagine). Juste pour donner un exemple pour ceux qui ne voient pas ce dont il est question, on peut aller voir ici. Pamputt (talk) 21:30, 23 July 2018 (UTC)
@Jpgibert Le plus simple pour faire ça, c'est de copier-coller le contenu du thésaurus et de séparer les mots avec un #. Ça doit demander quelques minutes pour être mis en forme, mais ce n'est pas non plus le Pérou. Lyokoï (talk) 14:22, 15 December 2018 (UTC)


Première utilisation : quelques questionnements

Bonjour !

Tout d'abord, merci beaucoup pour ce super outil !

J'ai remarqué quelques difficultés à l'usage. Peut-être que c'est juste parce que je suis nouvelle et pas au courant de toutes les options, mais voilà ma liste :

  1. Sur une liste de 20 mots, il faut généralement que je reprenne l'enregistrement manuellement trois ou quatre fois parce que l'outil décide soudain de ne plus enregistrer. Quand je sélectionne un mot, même en cliquant sur le gros bouton rouge, il y a à peu près une chance pour deux pour que l'enregistrement se lance.
  2. Mes mots sont très souvent coupés au début et à la fin (pour les noms propres en deux ou trois mots surtout) : peut-être qu'il serait pertinent d'avoir un petit bouton "next" pour marquer manuellement les fins de mots ? Sur 20 mots enregistrés, entre ceux que l'outil n'a pas envie de me laisser enregistrer (cf #1) et ceux qui sont coupés, m'en reste peu. Sur 3 listes d'une vingtaine de noms, j'en ai eu 2, 5 et 7 exploitables.
  3. Sur une page d'enregistrement comme Q44570, le lien vers la page Wikipédia met un + au lieu d'un _ entre les mots donc on arrive sur un lien rouge dans Wikipédia.

Si ça peut servir, je suis sur la dernière version en date de Firefox au 10/10/18 & Windows 10.

Pour le reste : c'est vraiment super, bravo pour tout ce travail ! Je vais continuer à faire joujou avec l'outil jusqu'à être bien familière avec.

Exilexi (talk) 06:22, 10 October 2018 (UTC)

Les problèmes 1 et 2 sont en fait quasiment réglés avec un meilleur micro. Lingua Libre demande la permission pour un micro qui n'est pas mon micro par défaut, pour une raison inconnue.
Nouveau souci avec l'upload : tous les mots sauf 1 sont bien téléversés. Le bouton Commons s'affiche en grisé et rien ne se passe si je clique sur la petite croix à côté d'un mot : apparemment, c'est tout ou rien pour mettre sur Commons, donc je viens de perdre 29 mots parce qu'un seul refusait de s'uploader. Exilexi (talk) 06:44, 10 October 2018 (UTC)
J'en ajoute un : j'avais enregistré 20 mots "autour de moi". Là, je viens d'en lancer 20 autres... et c'est les mêmes. Il pourrait être intéressant d'ajouter une option pour éviter d'enregistrer plusieurs fois la même chose (mon accent ne change pas d'un jour à l'autre). Exilexi (talk) 05:36, 11 October 2018 (UTC)

Salut Exilexi, quelques remarques ou éléments de réponse à tes commentaires

  1. Lorsque tu décris que l'outil stoppe l'enregistrement, je pense que le problème vient de la qualité du micro. C'est ce que tu sembles avoir conclu également.
  2. Lingua Libre découpe les mots automatiquement dès qu'il détecte un blanc. Pour les noms à rallonge, on pourrait envisager d'ajouter un bouton pour passer manuellement au mot suivant. Cela étant dit, ça perd un peu de l'intérêt de l'outil car ça devient beaucoup plus lent.
  3. concernant le lien vers Wikipédia (avec un « + »), ça semble en effet un bogue. J'ai ouvert un ticket sur Phabricator.
  4. pour les problèmes d'upload, quand un téléversement échoue, un ticket existe déjà sur ce sujet.
  5. pour les listes de mots, il est possible d'en créer soi-même. Il en existe déjà plusieurs en français (quelques dizaines) et moins dans les autres langues. Il est expliquer ici sur la façon de procéder. Si tu as besoin d'aide, fais-nous signe. Pamputt (talk) 20:13, 11 October 2018 (UTC)


Formosan languages workshop

Hi there, I had an email exchange with Vicky, the NCCU language researcher involved in Formosan languages protection. Some of her questions are beyond my skills :

1. I couldn't find ais(Sakizaya), ami(Amis), trv(Truku) in the language list. Please add, thanks!
2. Can I add the dialect information in the speaker file? 
Because there are 42 dialects under 16 aboriginal languages, I had record Squliq dialect not C’uli’ dialect of Atayal language today.
3. I had add the Chinese translation after the aboriginal languages, is that ok for lingua libre? 
Or I only can type in aboriginal languages?

I broke the questions in several subsections so a quick discussion may occurs for each. Please take notes that Vicky workshop is coming this week, so it would be cool to forward her practical solutions early. Yug (talk) 09:38, 29 November 2018 (UTC)

1) Requesting languages additions

  • Amis_language (iso: ami; wikidata: Q35132).
  • Sakizaya has no iso639, from my understanding. Sakizaya_language (iso: none, wikidata: Q718269), Nataoran_language (iso: ais, wikidata: Q42508148).
  • Truku (no iso no wikidata) : is described in Wikipedia as the main component of Seediq language (iso: trv, wikidata: Q716686), already in LinguaLibre. Taiwanese linguist, the most experienced in the matter, are making a distinction.

If I understand well, LL only requires wikidata ID. If so, I would recommend to add Q35132 (amis), Q718269 (Sakizaya). Q42508148 (Nataorans) and Q716686 (Seediq) are already in I think. Truku may require a wikidata item creation, then integration in LL. Yug (talk) 09:38, 29 November 2018 (UTC)

The four languages have been imported here: Q51311 Seediq, Q51870 Amis, Q51871 Sakizaya and Q51872 Nataoran and can be used for recording. Pamputt (talk) 04:15, 30 November 2018 (UTC)

2) "There are 42 dialects under 16 aboriginal languages".

We previously added 15 or 16 of these recognized languages into LinguaLibre (thanks x0 and Pamputt). Again, Taiwanese linguists are the experts on the matter, so what can we (LL) recommend for these 42 variants ? Two ideas came to me.

  1. Add the information in he speaker name or place of learning. By example for : Paul Martin (Breton north) ; Paul Martin (Breton south).
  2. Add the Wikidata items following Taiwanese linguists recommendations, while no wikipedia articles nor iso639 exists.

What do you think ? Yug (talk) 09:38, 29 November 2018 (UTC)

As far as I uundertand, if no Wikidata item exists for a given language, we have two options: create it on Wikidata (whether it is notable) and import here after or create it by hand directly here. So for dialect, I would say they are enough notable to be created on Wikidata but I have no time to do it by myself before the end of the year (I have no regular Internet connection for now). Pamputt (talk) 04:18, 30 November 2018 (UTC)
In fact, the second option mentionned above by Pamputt won't work. For a language to be recognised by the RecordWizard, it has to have a wikidata ID. The right way to do it imho is (as also suggested by Pamputt) to create the corresponding item on wikidata, and then ask for an import here. — 0x010C ~talk~ 14:46, 3 December 2018 (UTC)

3) "Is it ok to use mhway su (谢谢) ?" (target word + translation)

  • Technically, both aboriginal languages and Chinese, de factor the target word together with its closest macro-language's translation, here, Chinese.
  • Keep extremely consistent in your practice, so to ease later usages (learning apps). If the rule is
{aboriginal}{white_space}{opening_round_braket_(}{Chinese}{closing_round_braket_)}

stick to it, and avoid round brackets in other places of your element. Early consistency makes later usages easier. Yug (talk) 09:38, 29 November 2018 (UTC)

@x0, devs, there again we have the questions of wordlists with translations. I previously suggested that words lists support a iso639 syntaxe or wikidata id syntax so to push the translation into a different metadata field. Example of list :
mhway su [cmn:谢谢,eng:Thank]
Then "mhway su" is the target recorded word. "谢谢" is the translation in the meta data "cmn" (Chinese). "Thank" is the translation in the meta data "eng" (English). I guess I should open a ticket on Phabricator. Yug (talk) 10:19, 29 November 2018 (UTC)
Multi-lingual wordlist --wordlist including the translation of target words-- are not supported at the moment. An issue have been opened on LinguaLibre developments and bugs tracking system (T211086). Yug (talk) 09:29, 4 December 2018 (UTC)


Feature request: ask to reuse existing identical audio if available

Check-green.svg Done, can be archived. 12:08, 31 December 2018 (UTC)

I waste a lot of time because Lingua Libre Bot has to have new audio for every lexeme forms. For example this audio https://commons.wikimedia.org/wiki/File:LL-Q809_(pol)-KaMan-Bizancjum.wav I had to record 10 times (https://lingualibre.fr/index.php?title=Q55850&action=history). A lot of forms in Polish language is duplicated in different cases. It would be great if in word generator (+ExternalTools) in Record Wizard could be question to ask if duplicate should be recorded (identical speaker, language and lexeme), and Lingua Libre Bot propagate existing audio. It could save time. KaMan (talk) 14:28, 25 December 2018 (UTC)

KaMan, where does your wordlist(s?) come from ? how is it created ? You use LinguaLibre word generator ? Yug (talk) 00:12, 27 December 2018 (UTC)
If I understand well, you eventually have the same issue as raised in Warn the user when they try to record a file that they already made. Namely, you meet again and again words that you already recorded. If this is correct, then we started to look for technical solutions (T212580). As of now, for long series, it is important to stick to large frequency list, so to not re-record similar words multiple times. Yug (talk) 00:17, 27 December 2018 (UTC)
I took a look online for available frequency lists in polish.
So Hermit Dave's data would do. We have tutorials on how to clean up frequency lists,how to split such long file, other tricks, and how to create a list on LinguaLibre to help.
Some command will need minor changes if your input differs. If you have some basic shell skills, you can do it and learn the exact commands needed quickly. Yug (talk) 01:30, 27 December 2018 (UTC)
No Yug. He's talking about word lists generated with a SPARQL query from Lexemes on Wikidata, and from the fact that Lingua Libre Bot only associate audio recordings on the Lexeme when there is a direct link, causing him to re-record many times homograph words that are also homonym.
But the main issue I pointed out in T212580 apply here too, I don't have any idea of easy and effective implementation right now.
(and no Yug, it is not "important to stick to large frequency list", we have other —more simple— solutions yet as Wikimedia categories or external tools imports).
Best regards — 0x010C ~talk~ 11:10, 27 December 2018 (UTC)
0x010C is right. It's not problem of wrong list, list of words is correct. If there is no easy solution to it I can work with it as is but I admit I feel pain ;) before recording of 14 identical forms of https://www.wikidata.org/wiki/Lexeme:L19356 :) KaMan (talk) 13:22, 27 December 2018 (UTC)
"Who doesnt try cannot be wrong." It really needs to read between lines to find the Wikidata reference. "Lexeme" is lexicology term before being a Wikidata item type. The current SPARQL query doesnt seems time savy.
And yes, generally speaking frequency list of unique words save our speakers energy. First, each form is recorded only once : this is why human speakers are for, and they shouldn't have to record multiple times a same form. Second, in natural language, words frequency follow the Zipf's law. Thus, the 135 most frequent English items represent 50% coverage of written text. On the opposite side, recording Wikipedia categories is not representative of human language and thus not time efficient. One volunteer can audio record 2000 categories it will still barely account for 1% of this human language. This only has internal value, by wikipedians for wikipedians, which is positive but sub-optimal.
As of KaMan's case, I would still recommend using frequency list : it would save valuable human time. A later bot could dispatch the audios upon the various wikidata items of this language and form. So I just used Hermit Dave CC-by-sa data to create Polish language frequency lists on LinguaLibre for the first 20k words, they are now availale to in the Record Studio > Details step : Local list > "pol". Yug (talk) 13:51, 27 December 2018 (UTC)
Yug, it's not a problem of frequency list but feature of language. I record all FORMS of words. Every noun in Polish has at least 14 forms, every adjective has 30-80 forms, same for verbs. Every form has entry in Wikidata and needs recording. But many of these forms are identical so in the end I have to record the same audio several times. It is independent from the fact the word is from frequency list. In other words word from frequency list has the same problem in Wikidata. BTW: I already follow frequency list in creating lexemes in Wikidata, but thanks :) KaMan (talk) 16:27, 27 December 2018 (UTC)
I think I get your process now. Learning ongoing ! Still seems weird you are recording 14 times the same form. Yug (talk) 16:58, 28 December 2018 (UTC)

Homonymy

How homonyms are treated? Will they be overwritten with new recordings? Infovarius (talk) 17:42, 27 December 2018 (UTC)

Yes, if a new word has the same transcription, the same language and the same speaker as an old one, it will be override. If you want to record two homonym words that have a different pronunciation, you can add a small qualifier into brakets just after the word when you type it in the 3rd step of the RecordWizard. Everything that is inside brackets will be put aside, like on this record File:LL-Q150 (fra)-0x010C-fils (enfant).wav. — 0x010C ~talk~ 21:26, 27 December 2018 (UTC)
It is good that this is possible in principle. But how can I know that I am recording a homonym of something already recorded? Infovarius (talk) 21:51, 27 December 2018 (UTC)

Categories

Check-green.svg Done -- answer on feature status provided. See T201135 Yug (talk) 10:52, 31 December 2018 (UTC)

How can I automatically add some categories to new Commons uploads (like "Russian pronunciation" and others)? Infovarius (talk) 17:44, 27 December 2018 (UTC)

Currently this is not possible but it is a planned feature, see task T201135 on phabricator. — 0x010C ~talk~ 21:46, 27 December 2018 (UTC)


How to properly credit lists

Check-green.svg Done : no built in solution as of now, issue opened (T212671), current hack: put source in talk page. Yug (talk) 10:53, 31 December 2018 (UTC)

(T212671) I attempted this List:Pol/words-by-frequency-2001-to-4000#Source, but loading the list in the Record Studio keeps the source section as a word to record. Is there a known trick to hide this source section in the Record Studio ? Yug (talk) 16:56, 28 December 2018 (UTC)