Shtooka

Shtooka

Shtooka est un projet lancé par Nicolas Vion visant à fournir sous licence libre des collections d'enregistrements sonores de mots, expressions, proverbes prononcés par des locuteurs dans leur langue maternelle. Ces collections sont utiles dans l'apprentissage des langues, la recherche linguistique, etc.

Le projet Shtooka existe depuis 2006[1] est s'est constitué en association loi de 1901 en 2009.

Sommaire

Enregistrements

Plus de 100 000 enregistrements[2] sont disponibles aux formats Ogg, MP3 et embarquent des métadonnées sur le fichier audio. Ces métadonnées, regroupées sous le nom de métadonnées SWAC (ou SWAC Metatags[3]), fournissent une quarantaine d'informations essentielles pour l'apprentissage telles que:

  • des informations sur ce qui est prononcé (le texte prononcé, la langue de prononciation du mot, ...)
  • des informations sur le locuteur (nom, sexe, année de naissance, le pays et la région d'origine du locuteur (permettant par exemple de discerner les accents).
  • des informations sur la prononciation du mot
  • des informations sur la collection audio
  • des informations techniques

Des enregistrements existent pour plusieurs langues: français, anglais, néerlandais, chinois, russe, tchèque, suédois, ukrainien, biélorusse. Ils sont utilisés dans le wiktionnaire[4].

Le projet a mis au point une technique originale permettant d'enregistrer environ 1 000 mots à l'heure [2].

Logiciels

Le projet développe également des logiciels pour ses besoins propres publiés sous licence GPL:

  • Kit Shtooka
    • Shtooka Explorer permet d'explorer les collections audio
    • Shtooka Recorder permet d'enregistrer la prononciation de mots et expressions
    • Shtooka Repeat permet de faciliter l'apprentissage du vocabulaire
  • Swac Tools permettant plus spécifiquement de travailler sur les métadonnées SWAC
    • Swac Get
    • Swac Explore
    • Swac Play
    • Swac Scan

Licences libres

Shtooka est attaché aux licences libres et publie:

Références

Voir aussi

  • (en) Site officiel
  • (fr) Perroquet, un logiciel qui permet d'améliorer la compréhension orale d'une langue en écoutant des extraits de films en version originale. Il faut pouvoir comprendre et restituer ce qui a été dit lors d'un extrait pour pouvoir voir la suite du film.
  • (fr) Tatoeba, base de données de phrases traduites dans plusieurs langues en collaboration avec le projet Shtooka pour l'audio

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Shtooka de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать реферат

Regardez d'autres dictionnaires:

  • Татоэба — Tatoeba Project …   Википедия

  • French phonology — This article mainly discusses the phonological system of standard French based on the Parisian dialect. French is notable for its uvular r, nasal vowels, and two processes affecting word final sounds: liaison, a certain type of sandhi, wherein… …   Wikipedia

  • Conjugaison anglaise — La conjugaison anglaise se caractérise par un nombre limité de formes verbales et une certaine complexité, pour le francophone, quant à l utilisation des temps. Leur usage est en effet plus guidé par l aspect que par la situation de l action sur… …   Wikipédia en Français

  • La boite à outils du prof — est une compilation de logiciels libres (certains sont seulement gratuits) qui s adresse d abord aux enseignants, mais aussi aux autres utilisateurs de Windows. Tous peuvent être installés gratuitement en toute légalité. Cette compilation existe… …   Wikipédia en Français

  • Langue ukrainienne — Ukrainien  Cet article concerne la langue ukrainienne. Pour le peuple ukrainien, voir Ukrainiens. Ukrainien українська мова (ukrayins ka mova) Parlée en Ukraine, République de Moldavie, Transnistrie, Pologne, Slovaquie, Russie …   Wikipédia en Français

  • Mandarin standard — Mandarin 普通話 ou 普通话 (pǔtōnghuà) Parlée en  Chine   …   Wikipédia en Français

  • Prononciation du français — Cet article fait partie de la série : Langue française Langue d oïl Dialectes Créoles Francophonie Histoire Serments de Strasbourg Ordonnance de Villers Cotterêts …   Wikipédia en Français

  • Tchèque —  Pour l’article homophone, voir Tchek. Cet article concerne la langue tchèque. Pour le peuple tchèque, voir Tchèques. Pour race de poule, voir Poule Tchèque. Tchèque Čeština …   Wikipédia en Français

  • Ukrainien — Cet article concerne la langue ukrainienne. Pour le peuple ukrainien, voir Ukrainiens. Ukrainien українська мова (ukrayins ka mova) Parlée en Ukraine, Moldavie, Transnistrie, Pologne, Slovaquie, Russie, Biélorussie …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”