uno de los proyectos que estoy fermentando es esta plataforma para tener un primer contacto con los idiomas nativos de Venezuela, empezando por 10 lecciones de Yukpa (+150 palabras y un poquito de gramática). estoy adelantando cosas para las lecciones de idioma Ye'kwana y Kariña. he tenido que sortear demasiados problemas lingüísticos, tecnológicos, comunitarios y laborales para darle forma y contenido. sin apoyo del gobierno ni de ninguna institución, pero mi comunidad me respalda 🏹
@kupaye Menudo trabajazo. Muchas gracias por visibilizar la diversidad lingüística y ya nos irás contando :)
@kupaye hay material que se pueda usar entrenar un modelo de traducción?
Algo que esté en español y en el idioma nativo.
Se necesitan algo así de 1 millón de palabras para algo que funcione de manera razonable.
Trabajo con un grupo que busca desarrollar estos modelos fe traducción para lenguajes nativos de África y América
@pudupudu no me queda claro a qué te refieres. pero por ahora no tengo ni de cerca un millón de palabras grabadas (+100 horas), tampoco me he metido con TTS-STT, pero le tengo el ojo puesto al modelo XLSR para representar patrones acústicos (basado en wav2vec 2.0). aparentemente se puede usar con pocas horas, podría funcionar en lenguas con escasos recursos digitales (<10 horas, ciertas condiciones aplican). simulaciones que deben probarse. https://arxiv.org/pdf/2006.13979 ¿qué tienen ustedes?
@kupaye el resultado final es un modelo que se puede usar en Bergamot https://share.google/3ZLJCzk4XxckFSC3P
Para eso, hace falta tener material que permita traducir a un lenguaje conocido. Su además tenés material hablado es mejor, pero hace falta la transcripción.
Bergamot - a project to add and improve client-side machine translation in a web browser

Website for the browsermt organization

@kupaye saludos, muy buena iniciativa.