LinguaLibre

Difference between revisions of "2022-2023 projection"

Line 11: Line 11:
 
|| Each extracted audio would correspond to a sentence. Each sentence could be added to lexemes as a [https://www.wikidata.org/wiki/Property:P5831 "usage example"]. Having [https://www.wikidata.org/wiki/Property:P5831 usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] makes Wikidata lexicographical data more useful. With SPARQL, we could then answer questions of the style: [https://www.wikidata.org/wiki/Property:P5831 Usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] that were retrieved from interviews where the participant is a native speaker of that language. More information about this idea in [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Program_for_extracting_sentences_from_any_audio_stream_for_their_inclusion_in_Lingua_Libre this page].
 
|| Each extracted audio would correspond to a sentence. Each sentence could be added to lexemes as a [https://www.wikidata.org/wiki/Property:P5831 "usage example"]. Having [https://www.wikidata.org/wiki/Property:P5831 usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] makes Wikidata lexicographical data more useful. With SPARQL, we could then answer questions of the style: [https://www.wikidata.org/wiki/Property:P5831 Usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] that were retrieved from interviews where the participant is a native speaker of that language. More information about this idea in [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Program_for_extracting_sentences_from_any_audio_stream_for_their_inclusion_in_Lingua_Libre this page].
 
|| 5 months
 
|| 5 months
|| Enough for food
+
|| Unknown (I'm ok with enough money for food)
 
|| Yes
 
|| Yes
 
|-
 
|-
Line 18: Line 18:
 
|| There are lots of things in Wikidata lexicographical data that is missing [https://www.wikidata.org/wiki/Property:P443 pronunciation audio]. As of 2022/03/18 22:24:21 UTC, there is only 1 [https://www.wikidata.org/wiki/Property:P5831 usage example] that has a pronunciation audio. English has 129942 forms, but only 340 has pronunciation audios (i.e. ~0.0026% of English forms has pronunciation audio) and the same situation happens with other languages. More statistics on this at [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Interface_in_Lingua_Libre_that_focuses_on_adding_pronunciation_audio_that_is_missing this page].
 
|| There are lots of things in Wikidata lexicographical data that is missing [https://www.wikidata.org/wiki/Property:P443 pronunciation audio]. As of 2022/03/18 22:24:21 UTC, there is only 1 [https://www.wikidata.org/wiki/Property:P5831 usage example] that has a pronunciation audio. English has 129942 forms, but only 340 has pronunciation audios (i.e. ~0.0026% of English forms has pronunciation audio) and the same situation happens with other languages. More statistics on this at [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Interface_in_Lingua_Libre_that_focuses_on_adding_pronunciation_audio_that_is_missing this page].
 
|| 3 months
 
|| 3 months
|| Enough for food
+
|| Unknown (I'm ok with enough money for food)
 
|| Yes
 
|| Yes
 
|-
 
|-

Revision as of 22:46, 18 March 2022

This week, Wikimedia France is establishing its budget for the period of July 2022 to June 2023.

Please share here what you think we should get done this year on Lingua Libre. Feel free to add projects of yours that would require funding, as well as bugs and forseeable technical needs. Please remember to link phabricator tickets to the bugs and technical issues you raise. A maximum of 10 suggestions per person would be best.

Write your suggestions here
Username Project or problem Reason why this is important to accomplish or solve in 2022-2023 Approximate human time needed Estimated budget Would you like to be involved in this ?
Rdrg109 Program for extracting sentences from any audio stream for their inclusion in Lingua Libre. Each extracted audio would correspond to a sentence. Each sentence could be added to lexemes as a "usage example". Having usage examples with pronunciation audios makes Wikidata lexicographical data more useful. With SPARQL, we could then answer questions of the style: Usage examples with pronunciation audios that were retrieved from interviews where the participant is a native speaker of that language. More information about this idea in this page. 5 months Unknown (I'm ok with enough money for food) Yes
Rdrg109 Interface in Lingua Libre that focuses on adding pronunciation audio that is missing (forms and usage examples that have zero pronunciation audios) There are lots of things in Wikidata lexicographical data that is missing pronunciation audio. As of 2022/03/18 22:24:21 UTC, there is only 1 usage example that has a pronunciation audio. English has 129942 forms, but only 340 has pronunciation audios (i.e. ~0.0026% of English forms has pronunciation audio) and the same situation happens with other languages. More statistics on this at this page. 3 months Unknown (I'm ok with enough money for food) Yes
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule