Tu voulais des datasets en #kabyle, voici 3.55 Go de fichiers issus du site Web de Ayamun (Amar Mezdad écrivain kabyle connu) : 230 fichiers PDFs.

https://huggingface.co/datasets/boffire/ayamun-pdfs

boffire/ayamun-pdfs · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

OpenStreetMap - Cartes et navigation en kabyle

 Beaucoup ne savent pas que le projet libre et ouvert de cartographie collaborative OpenStreetMap prend en charge la langue kabyle sur son ...

Autre datasets en #kabyle

+788000 phrases en kabyle sur Tatoeba (maintenues par des humains).

Autre datasets en #kabyle :

53051 phrases audio scriptées en kabyle.

https://tatoeba.org/kab/audio/index/kab

Autres datasets en #kabyle :

Common Voice Scripted Speech 25.0 - Kabyle
Volume : 17.3 Go de données audio.

https://mozilladatacollective.com/datasets/cmn38spwm005vmi07bejigyo6

Common Voice Scripted Speech 25.0 - Kabyle | Mozilla Data Collective

A collection of read speech recordings in Kabyle (Taqbaylit).

Mozilla Data Collective

Autre brouillon :

Texte complet de la traduction en #kabyle du « Retour de l'enfant prodigue » d'André Gide.

Traduction faite par le professeur Kamal Bouamara. Avec son autorisation, le texte à été utilisé pour générer des couplets entièrement en voix de synthèse en kabyle. (Avec tout les défaut de synthèse qui vont avec).

Brouillon : https://butterflyoffire.codeberg.page/bouamara.html

Tuɣalin n Weqcic Ijaḥen

Autres brouillons pour la langue #kabyle :

- Des phrases audio générées complètement via OmniVoice et qui n'ont jamais été prononcés par un humain.

Démo des voix de synthèse : https://butterflyoffire.codeberg.page/voice.html

Kabyle Synth Voice — Validation

Quelques espaces et outils pour la langue #kabyle :

LibreTranslate avec support de quelques modèles expérimentauxen kabyle : https://huggingface.co/spaces/Imsidag-community/LibreTranslate_Kabyle

Tatoeba Kabyle Corpus Standardisation Checker : https://huggingface.co/spaces/Imsidag-community/kabyle-tatoeba-checker

Traduction MarianMT vers le kabyle : https://huggingface.co/spaces/boffire/marianmt-en-kab

Mmeslay SpeechToText : https://huggingface.co/spaces/g1ya/Mmeslay

Modèle OCR kabyle pour Tesseract-ocr : https://huggingface.co/AitBAD/kab-Taqbaylit-Tesseract-ocr

OmniVoice Speech Processing :
https://huggingface.co/spaces/boffire/OmniVoice-kabyle

LibreTranslate Kabyle - a Hugging Face Space by Imsidag-community

LibreTranslate with Kabyle language support via different tr

Corpus et datasets destinés pour la langue #kabyle.

PDFs Béjaïa : https://huggingface.co/datasets/boffire/bejaia

PDFs Bouira : https://huggingface.co/datasets/boffire/bouira

Adlis PDFs : https://huggingface.co/datasets/boffire/adlis-pdfs

Autres datasets que j'ai regroupé ici (nettoyés partiellement pour certains) : https://huggingface.co/Imsidag-community/datasets

boffire/bejaia · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

La bibliographie amazighe s’enrichi

> … Cet ouvrage constitue la version en langue française, intégralement refondue et augmentée d’ « Amyag n teqbaylit » publié en 2024, rédigé entièrement en langue amazighe, dans sa variante #kabyle.

https://www.lexpressiondz.com/culture/la-bibliographie-amazighe-s-enrichi-405548