Tu voulais des datasets en #kabyle, voici 3.55 Go de fichiers issus du site Web de Ayamun (Amar Mezdad écrivain kabyle connu) : 230 fichiers PDFs.

https://huggingface.co/datasets/boffire/ayamun-pdfs

boffire/ayamun-pdfs · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

Albert Camus : l'étranger … en kabyle.

Si tu ne sais pas chercher et trouver des ressources dans des langues minorisées, c'est que le problème c'est toi et non pas les langues minorisées.

Si tu as des datasets à mettre ligne afin de créer des modèles autour du kabyle ou des autres langues minorisées, c'est sur HuggingFace que je t'encourage à les mettre au lieu que les robots viennent harceler ton petit site web.

Tu bosse sur de l'OCR, upload sur HuggingFace.
Tu bosse sur la reconnaissance vocale, upload sur HuggingFace.
Tu créée des classificateurs, uploade sur HuggingFace.

Si tu veux que ta langue existe, upload sur HuggingFace sinon assume qu'elle disparaisse.
N'écoute pas ces gens qui te disent que HuggingFace est fait exclusivement pour l'IA. C'est faux.

N'écoute pas les westerns, iels peuvent ouvrir et fermer des noms de domaines à n'importe quel moment.

Toi tu n'as même pas le droit à un .dz alors upload sur HuggingFace.

Ne m'écoutes pas … gardes tes remarques pour d'ici une année.