Autre datasets en #kabyle

+788000 phrases en kabyle sur Tatoeba (maintenues par des humains).

Autre datasets en #kabyle :

53051 phrases audio scriptées en kabyle.

https://tatoeba.org/kab/audio/index/kab

Autres datasets en #kabyle :

Common Voice Scripted Speech 25.0 - Kabyle
Volume : 17.3 Go de données audio.

https://mozilladatacollective.com/datasets/cmn38spwm005vmi07bejigyo6

Common Voice Scripted Speech 25.0 - Kabyle | Mozilla Data Collective

A collection of read speech recordings in Kabyle (Taqbaylit).

Mozilla Data Collective

Autre brouillon :

Texte complet de la traduction en #kabyle du « Retour de l'enfant prodigue » d'André Gide.

Traduction faite par le professeur Kamal Bouamara. Avec son autorisation, le texte à été utilisé pour générer des couplets entièrement en voix de synthèse en kabyle. (Avec tout les défaut de synthèse qui vont avec).

Brouillon : https://butterflyoffire.codeberg.page/bouamara.html

Tuɣalin n Weqcic Ijaḥen

Autres brouillons pour la langue #kabyle :

- Des phrases audio générées complètement via OmniVoice et qui n'ont jamais été prononcés par un humain.

Démo des voix de synthèse : https://butterflyoffire.codeberg.page/voice.html

Kabyle Synth Voice — Validation

Quelques espaces et outils pour la langue #kabyle :

LibreTranslate avec support de quelques modèles expérimentauxen kabyle : https://huggingface.co/spaces/Imsidag-community/LibreTranslate_Kabyle

Tatoeba Kabyle Corpus Standardisation Checker : https://huggingface.co/spaces/Imsidag-community/kabyle-tatoeba-checker

Traduction MarianMT vers le kabyle : https://huggingface.co/spaces/boffire/marianmt-en-kab

Mmeslay SpeechToText : https://huggingface.co/spaces/g1ya/Mmeslay

Modèle OCR kabyle pour Tesseract-ocr : https://huggingface.co/AitBAD/kab-Taqbaylit-Tesseract-ocr

OmniVoice Speech Processing :
https://huggingface.co/spaces/boffire/OmniVoice-kabyle

LibreTranslate Kabyle - a Hugging Face Space by Imsidag-community

LibreTranslate with Kabyle language support via different tr

Corpus et datasets destinés pour la langue #kabyle.

PDFs Béjaïa : https://huggingface.co/datasets/boffire/bejaia

PDFs Bouira : https://huggingface.co/datasets/boffire/bouira

Adlis PDFs : https://huggingface.co/datasets/boffire/adlis-pdfs

Autres datasets que j'ai regroupé ici (nettoyés partiellement pour certains) : https://huggingface.co/Imsidag-community/datasets

boffire/bejaia · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

La bibliographie amazighe s’enrichi

> … Cet ouvrage constitue la version en langue française, intégralement refondue et augmentée d’ « Amyag n teqbaylit » publié en 2024, rédigé entièrement en langue amazighe, dans sa variante #kabyle.

https://www.lexpressiondz.com/culture/la-bibliographie-amazighe-s-enrichi-405548

Dans l'une de ces dernières conférences, Arezki Boudif a souligné une remarque intéressante en disant que :

- Beaucoup de ceux et de celles qui écrivent en #kabyle sont de formation autre que les langues : médecins, informaticiens, physiciens, mathématiciens, … (au masculin comme au féminin).

Et je crois qu'il a bien fait de le souligner.

The Grapes of Wrath ou Les Raisins de la colère, de John Steinbeck.

Lauréat du Prix Nobel de littérature en 1962, a été traduit par Arezki Boudif et édité en #kabyle sous le titre :

Iguza n Wurfan.
Aux Éditions : Axxam n tmusni.

Arezki Boudif est chercheur en biotechnologie aux "ZêtaZunis d'AmeriK".