LinguaLibre

Difference between revisions of "LinguaLibre:Technical board/Reports/2021/Wikidata Lexemes & Lingua Libre coordination assessment"

< LinguaLibre:Technical board

 
(One intermediate revision by one other user not shown)
Line 1: Line 1:
=== Présents
+
March 2021
 +
 
 +
=== Présents ===
 
* Léa Lacroix (Wikimedia Deutschland)
 
* Léa Lacroix (Wikimedia Deutschland)
 
* VIGNERON
 
* VIGNERON
Line 5: Line 7:
 
* Poslovitch
 
* Poslovitch
  
=== Agenda :
+
=== Agenda ===
- news de Lingua Libre : qu'est-ce qui se passe en ce moment ?  
+
* news de Lingua Libre : qu'est-ce qui se passe en ce moment ?  
- améliorations de la doc autour des Lexèmes
+
* améliorations de la doc autour des Lexèmes
- impliquer la communauté Wikidata dans la contribution sur Lingua Libre
+
* impliquer la communauté Wikidata dans la contribution sur Lingua Libre
- Lingua Libre bot : prochaines étapes, demandes des contributeurs
+
* Lingua Libre bot : prochaines étapes, demandes des contributeurs
- 30 Lexic-o-days https://www.wikidata.org/wiki/Wikidata:Events/30_lexic-o-days_2021
+
* 30 Lexic-o-days https://www.wikidata.org/wiki/Wikidata:Events/30_lexic-o-days_2021
  
=== Past 6 months review
+
=== Past 6 months review ===
 
* Dev push
 
* Dev push
 
* Recordings growth
 
* Recordings growth
Line 21: Line 23:
 
** LinguaLibre:Newsletter - hub for inward and outward communication
 
** LinguaLibre:Newsletter - hub for inward and outward communication
  
=== Bot & Wikidata
+
=== Bot & Wikidata ===
  
 
https://meta.wikimedia.org/wiki/User:Lingua_Libre_Bot (page présentation du bot et où il est actif)
 
https://meta.wikimedia.org/wiki/User:Lingua_Libre_Bot (page présentation du bot et où il est actif)
Line 29: Line 31:
 
https://xtools.wmflabs.org/ec/www.wikidata.org/Lingua_Libre_Bot
 
https://xtools.wmflabs.org/ec/www.wikidata.org/Lingua_Libre_Bot
 
-> le bot a 30 % de contrib sur les lexèmes, quasiment rien depuis 2020
 
-> le bot a 30 % de contrib sur les lexèmes, quasiment rien depuis 2020
Bottle necks: la "modélisation" fine des propriétés des lexèmes est encore balbutiante, il faut s'attendre à des désaccords entre Wikidatiens dans l'usage qu'ils attendent de LLBot.
+
 
 +
Bottle necks: la "modélisation" fine des propriétés des lexèmes est encore balbutiante, il faut s'attendre à des désaccords entre Wikidatiens dans l'usage qu'ils attendent de LLBot.
 +
 
 
Help needed:
 
Help needed:
  
Line 35: Line 39:
 
La cause de la suppression du bouton "générer une liste à partir de WD" est inconnue à ce jour (Poslovitch -> Enquêter!!). Pour que le bot recommence à bosser sur Lexemes, il faut réactiver ce bouton, et ça devrait se mettre à fonctionner tout seul. + ça permettrait de remplir le ticket https://phabricator.wikimedia.org/T274667
 
La cause de la suppression du bouton "générer une liste à partir de WD" est inconnue à ce jour (Poslovitch -> Enquêter!!). Pour que le bot recommence à bosser sur Lexemes, il faut réactiver ce bouton, et ça devrait se mettre à fonctionner tout seul. + ça permettrait de remplir le ticket https://phabricator.wikimedia.org/T274667
  
 
+
=== Bot Lists ===
=== Bot Lists
 
 
Librairie en Python pour l'API Mediawiki pour les Lexèmes : https://nudin.github.io/LexData/
 
Librairie en Python pour l'API Mediawiki pour les Lexèmes : https://nudin.github.io/LexData/
  
Line 45: Line 48:
 
* pour l'idéal, to do
 
* pour l'idéal, to do
  
=== Chinese dictionary
+
=== Chinese dictionary ===
 
Using the case of available Chinese dictionary as a case study for language's init on Wikidata lexeme.
 
Using the case of available Chinese dictionary as a case study for language's init on Wikidata lexeme.
 
* Définir le schema existant (cf. la requête https://w.wiki/33dS )
 
* Définir le schema existant (cf. la requête https://w.wiki/33dS )
Line 64: Line 67:
 
Proposer des présentations/ateliers autour de LinguaLibre ? (reprendre la présentation du Wikimedia Wikimeet India).
 
Proposer des présentations/ateliers autour de LinguaLibre ? (reprendre la présentation du Wikimedia Wikimeet India).
  
 +
== See also ==
 +
{{Technicals}}
 
[[Category:Technical reports|Wikidata lexemes]]
 
[[Category:Technical reports|Wikidata lexemes]]

Latest revision as of 14:03, 10 April 2023

March 2021

Présents

  • Léa Lacroix (Wikimedia Deutschland)
  • VIGNERON
  • Yug
  • Poslovitch

Agenda

Past 6 months review

  • Dev push
  • Recordings growth
  • Organizational structuring
    • LinguaLibre:Technical board - hub to lead developement efforts
    • LinguaLibre:Bot - hub for bot developements
    • LinguaLibre:Events - hub for IRL and online events to spread usage
    • LinguaLibre:Newsletter - hub for inward and outward communication

Bot & Wikidata

https://meta.wikimedia.org/wiki/User:Lingua_Libre_Bot (page présentation du bot et où il est actif)

https://wikidata.wikiscan.org/user/Lingua_Libre_Bot

https://xtools.wmflabs.org/ec/www.wikidata.org/Lingua_Libre_Bot -> le bot a 30 % de contrib sur les lexèmes, quasiment rien depuis 2020

Bottle necks: la "modélisation" fine des propriétés des lexèmes est encore balbutiante, il faut s'attendre à des désaccords entre Wikidatiens dans l'usage qu'ils attendent de LLBot.

Help needed:

Bot sur Lexemes : il existait, à l'époque, une méthode pour query Wikidata/Lexemes pour récupérer une liste de mots. Ces enregistrements, sur LL, obtiennent ensuite une "wikidataId". C'est cette wikidataId qui permettait au bot de contribuer sur les "bons" éléments sur Lexemes. La cause de la suppression du bouton "générer une liste à partir de WD" est inconnue à ce jour (Poslovitch -> Enquêter!!). Pour que le bot recommence à bosser sur Lexemes, il faut réactiver ce bouton, et ça devrait se mettre à fonctionner tout seul. + ça permettrait de remplir le ticket https://phabricator.wikimedia.org/T274667

Bot Lists

Librairie en Python pour l'API Mediawiki pour les Lexèmes : https://nudin.github.io/LexData/

Documentation du modèle par langues : https://www.wikidata.org/wiki/Wikidata:Lexicographical_data/Documentation/Languages

"Requête" pour la liste des parts of speech :

Chinese dictionary

Using the case of available Chinese dictionary as a case study for language's init on Wikidata lexeme.

Approach by minimal dictionary :

  1. Create 1,000 well defined items with writing, POS, english meaning(s) + some others minimal info.
  2. Bot publish on Wikidata Lexeme (with API ? with Lexdata, see above)
  3. Other contributions align with existing conventions
  4. Bot update to migrate conventions

Does languages have maturity `status` as alpha, beta, release 1 ? -> not now, but very good idea!! what criteria to determine this status?

Events

Une sorte de mois de la contribution autour des lexemes : https://www.wikidata.org/wiki/Wikidata:Events/30_lexic-o-days_2021

Proposer des présentations/ateliers autour de LinguaLibre ? (reprendre la présentation du Wikimedia Wikimeet India).

See also

Lingua Libre technical helps
Template {{Speakers category}} • {{Recommended lists}} • {{To iso 639-2}} • {{To iso 639-3}} • {{Userbox-records}} • {{Bot steps}}
Audio files How to create a frequency list?Convert files formatsDenoise files with SoXRename and mass rename
Bots Help:BotsLinguaLibre:BotHelp:Log in to Lingua Libre with PywikibotLingua Libre Bot (gh) • OlafbotPamputtBotDragons Bot (gh)
MediaWiki MediaWiki: Help:Documentation opérationelle MediawikiHelp:Database structureHelp:CSSHelp:RenameHelp:OAuthLinguaLibre:User rights (rate limit) • Module:Lingua Libre record & {{Lingua Libre record}}JS scripts: MediaWiki:Common.jsLastAudios.jsSoundLibrary.jsItemsSugar.jsLexemeQueriesGenerator.js (pad) • Sparql2data.js (pad) • LanguagesGallery.js (pad) • Gadgets: Gadget-LinguaImporter.jsGadget-Demo.jsGadget-RecentNonAudio.jsLiLiZip.js
Queries Help:APIsHelp:SPARQLSPARQL (intermediate) (stub) • SPARQL for lexemes (stub) • SPARQL for maintenanceLingualibre:Wikidata (stub) • Help:SPARQL (HAL)
Reuses Help:Download datasetsHelp:Embed audio in HTML
Unstable & tests Help:SPARQL/test
Categories Category:Technical reports