Tu voulais des datasets en #kabyle, voici 3.55 Go de fichiers issus du site Web de Ayamun (Amar Mezdad écrivain kabyle connu) : 230 fichiers PDFs.
Tu voulais des datasets en #kabyle, voici 3.55 Go de fichiers issus du site Web de Ayamun (Amar Mezdad écrivain kabyle connu) : 230 fichiers PDFs.
Article : OpenStreetMap - Cartes et navigation en #kabyle.
https://kabyleinfloss.blogspot.com/2026/05/openstreetmap-cartes-et-navigation-en.html
Autre datasets en #kabyle
+788000 phrases en kabyle sur Tatoeba (maintenues par des humains).
Autre datasets en #kabyle :
53051 phrases audio scriptées en kabyle.
Autres datasets en #kabyle :
Common Voice Scripted Speech 25.0 - Kabyle
Volume : 17.3 Go de données audio.
https://mozilladatacollective.com/datasets/cmn38spwm005vmi07bejigyo6
Autre brouillon :
Texte complet de la traduction en #kabyle du « Retour de l'enfant prodigue » d'André Gide.
Traduction faite par le professeur Kamal Bouamara. Avec son autorisation, le texte à été utilisé pour générer des couplets entièrement en voix de synthèse en kabyle. (Avec tout les défaut de synthèse qui vont avec).
Brouillon : https://butterflyoffire.codeberg.page/bouamara.html
Autres brouillons pour la langue #kabyle :
- Des phrases audio générées complètement via OmniVoice et qui n'ont jamais été prononcés par un humain.
Démo des voix de synthèse : https://butterflyoffire.codeberg.page/voice.html
Quelques espaces et outils pour la langue #kabyle :
LibreTranslate avec support de quelques modèles expérimentauxen kabyle : https://huggingface.co/spaces/Imsidag-community/LibreTranslate_Kabyle
Tatoeba Kabyle Corpus Standardisation Checker : https://huggingface.co/spaces/Imsidag-community/kabyle-tatoeba-checker
Traduction MarianMT vers le kabyle : https://huggingface.co/spaces/boffire/marianmt-en-kab
Mmeslay SpeechToText : https://huggingface.co/spaces/g1ya/Mmeslay
Modèle OCR kabyle pour Tesseract-ocr : https://huggingface.co/AitBAD/kab-Taqbaylit-Tesseract-ocr
OmniVoice Speech Processing :
https://huggingface.co/spaces/boffire/OmniVoice-kabyle
Corpus et datasets destinés pour la langue #kabyle.
PDFs Béjaïa : https://huggingface.co/datasets/boffire/bejaia
PDFs Bouira : https://huggingface.co/datasets/boffire/bouira
Adlis PDFs : https://huggingface.co/datasets/boffire/adlis-pdfs
Autres datasets que j'ai regroupé ici (nettoyés partiellement pour certains) : https://huggingface.co/Imsidag-community/datasets
La bibliographie amazighe s’enrichi
> … Cet ouvrage constitue la version en langue française, intégralement refondue et augmentée d’ « Amyag n teqbaylit » publié en 2024, rédigé entièrement en langue amazighe, dans sa variante #kabyle.
https://www.lexpressiondz.com/culture/la-bibliographie-amazighe-s-enrichi-405548