LinguaLibre

Difference between revisions of "2022-2023 projection"

Line 7: Line 7:
 
! Username !! Project or problem !! Reason why this is important to accomplish or solve in 2022-2023 !! Approximate human time needed !! Estimated budget !! Would you like to be involved in this ?
 
! Username !! Project or problem !! Reason why this is important to accomplish or solve in 2022-2023 !! Approximate human time needed !! Estimated budget !! Would you like to be involved in this ?
 
|-
 
|-
| Rdrg109/0/13 || https://www.wikidata.org/wiki/User:Rdrg109/0/13 . Program for extracting sentences from any audio stream for their inclusion in Lingua Libre. Interface in Lingua Libre that focuses on adding pronunciation audio that is missing (forms and usage examples that have zero pronunciation audios) '''à compléter''' || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule
+
| Rdrg109
 +
|| Program for extracting sentences from any audio stream for their inclusion in Lingua Libre.
 +
|| Each extracted audio would correspond to a sentence. Each sentence could be added to lexemes as a [https://www.wikidata.org/wiki/Property:P5831 "usage example"]. Having [https://www.wikidata.org/wiki/Property:P5831 usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] makes Wikidata lexicographical data more useful. With SPARQL, we could then answer questions of the style: [https://www.wikidata.org/wiki/Property:P5831 Usage examples] with [https://www.wikidata.org/wiki/Property:P443 pronunciation audios] that were retrieved from interviews where the participant is a native speaker of that language. More information about this idea in [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Program_for_extracting_sentences_from_any_audio_stream_for_their_inclusion_in_Lingua_Libre this page].
 +
|| 5 months
 +
|| Enough for food
 +
|| Yes
 
|-
 
|-
| Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule
+
| Rdrg109
 +
|| Interface in Lingua Libre that focuses on adding pronunciation audio that is missing (forms and usage examples that have zero pronunciation audios)
 +
|| There are lots of things in Wikidata lexicographical data that is missing [https://www.wikidata.org/wiki/Property:P443 pronunciation audio]. As of 2022/03/18 22:24:21 UTC, there is only 1 [https://www.wikidata.org/wiki/Property:P5831 usage example] that has a pronunciation audio. English has 129942 forms, but only 340 has pronunciation audios (i.e. ~0.0026% of English forms has pronunciation audio) and the same situation happens with other languages. More statistics on this at [https://www.wikidata.org/wiki/User:Rdrg109/0/13#Interface_in_Lingua_Libre_that_focuses_on_adding_pronunciation_audio_that_is_missing this page].
 +
|| 3 months
 +
|| Enough for food
 +
|| Yes
 
|-
 
|-
 
| Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule
 
| Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule || Texte de la cellule

Revision as of 22:44, 18 March 2022

This week, Wikimedia France is establishing its budget for the period of July 2022 to June 2023.

Please share here what you think we should get done this year on Lingua Libre. Feel free to add projects of yours that would require funding, as well as bugs and forseeable technical needs. Please remember to link phabricator tickets to the bugs and technical issues you raise. A maximum of 10 suggestions per person would be best.

Write your suggestions here
Username Project or problem Reason why this is important to accomplish or solve in 2022-2023 Approximate human time needed Estimated budget Would you like to be involved in this ?
Rdrg109 Program for extracting sentences from any audio stream for their inclusion in Lingua Libre. Each extracted audio would correspond to a sentence. Each sentence could be added to lexemes as a "usage example". Having usage examples with pronunciation audios makes Wikidata lexicographical data more useful. With SPARQL, we could then answer questions of the style: Usage examples with pronunciation audios that were retrieved from interviews where the participant is a native speaker of that language. More information about this idea in this page. 5 months Enough for food Yes
Rdrg109 Interface in Lingua Libre that focuses on adding pronunciation audio that is missing (forms and usage examples that have zero pronunciation audios) There are lots of things in Wikidata lexicographical data that is missing pronunciation audio. As of 2022/03/18 22:24:21 UTC, there is only 1 usage example that has a pronunciation audio. English has 129942 forms, but only 340 has pronunciation audios (i.e. ~0.0026% of English forms has pronunciation audio) and the same situation happens with other languages. More statistics on this at this page. 3 months Enough for food Yes
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule
Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule Texte de la cellule