LinguaLibre
LinguaLibre:Technical board/Reports/2021/Wikidata Lexemes & Lingua Libre coordination assessment
< LinguaLibre:Technical board
March 2021
Présents
- Léa Lacroix (Wikimedia Deutschland)
- VIGNERON
- Yug
- Poslovitch
Agenda
- news de Lingua Libre : qu'est-ce qui se passe en ce moment ?
- améliorations de la doc autour des Lexèmes
- impliquer la communauté Wikidata dans la contribution sur Lingua Libre
- Lingua Libre bot : prochaines étapes, demandes des contributeurs
- 30 Lexic-o-days https://www.wikidata.org/wiki/Wikidata:Events/30_lexic-o-days_2021
Past 6 months review
- Dev push
- Recordings growth
- Organizational structuring
- LinguaLibre:Technical board - hub to lead developement efforts
- LinguaLibre:Bot - hub for bot developements
- LinguaLibre:Events - hub for IRL and online events to spread usage
- LinguaLibre:Newsletter - hub for inward and outward communication
Bot & Wikidata
https://meta.wikimedia.org/wiki/User:Lingua_Libre_Bot (page présentation du bot et où il est actif)
https://wikidata.wikiscan.org/user/Lingua_Libre_Bot
https://xtools.wmflabs.org/ec/www.wikidata.org/Lingua_Libre_Bot -> le bot a 30 % de contrib sur les lexèmes, quasiment rien depuis 2020
Bottle necks: la "modélisation" fine des propriétés des lexèmes est encore balbutiante, il faut s'attendre à des désaccords entre Wikidatiens dans l'usage qu'ils attendent de LLBot.
Help needed:
Bot sur Lexemes : il existait, à l'époque, une méthode pour query Wikidata/Lexemes pour récupérer une liste de mots. Ces enregistrements, sur LL, obtiennent ensuite une "wikidataId". C'est cette wikidataId qui permettait au bot de contribuer sur les "bons" éléments sur Lexemes. La cause de la suppression du bouton "générer une liste à partir de WD" est inconnue à ce jour (Poslovitch -> Enquêter!!). Pour que le bot recommence à bosser sur Lexemes, il faut réactiver ce bouton, et ça devrait se mettre à fonctionner tout seul. + ça permettrait de remplir le ticket https://phabricator.wikimedia.org/T274667
Bot Lists
Librairie en Python pour l'API Mediawiki pour les Lexèmes : https://nudin.github.io/LexData/
Documentation du modèle par langues : https://www.wikidata.org/wiki/Wikidata:Lexicographical_data/Documentation/Languages
"Requête" pour la liste des parts of speech :
- pour l'existant en SPARQL : https://w.wiki/33dG (pour le portugais)
- pour l'idéal, to do
Chinese dictionary
Using the case of available Chinese dictionary as a case study for language's init on Wikidata lexeme.
- Définir le schema existant (cf. la requête https://w.wiki/33dS )
Approach by minimal dictionary :
- Create 1,000 well defined items with writing, POS, english meaning(s) + some others minimal info.
- Bot publish on Wikidata Lexeme (with API ? with Lexdata, see above)
- Other contributions align with existing conventions
- Bot update to migrate conventions
Does languages have maturity `status` as alpha, beta, release 1 ? -> not now, but very good idea!! what criteria to determine this status?
Events
Une sorte de mois de la contribution autour des lexemes : https://www.wikidata.org/wiki/Wikidata:Events/30_lexic-o-days_2021
Proposer des présentations/ateliers autour de LinguaLibre ? (reprendre la présentation du Wikimedia Wikimeet India).