@guyou ca me saoule ces annonces d'assistant opensource qui n'en sont pas.

Ca utilise le cloud Google pour la reconnaissance vocale. (Donc google sait tout ce que tu dis chez toi)...

C'est le gros point noir pour tous ces projet. Il n'y a pas de reconnaissance vocale libre qui marche sans envoyer ses données aux GAFAM.

Quand à la synthèse vocale. Tout ce qui est libre a un son synthéthique des années 90. Donc ces projets utilisent souvent aussi le cloud pour generer le son.

@tuxicoman je suis mille fois d'accord avec toi. Ceci dit, en attendant des progrès significatifs des implémentations libre du tts et stt, je me dis que c'est déjà mieux d'avoir un bot open-source car, au moins, tu peux t'assurer que la détection du hot-word est faite en local et que seule la *requête* est envoyée chez les GAFAM.

@guyou montre moi un code libre qui fait de la detection de hot word... J'ai pas trouvé.

C'est pas si simple car il faut que ca marche avec differentes intonations, ce qui necessite un apprentissage fastideux pour l'humain (j'ai autre chose a faire que lui dire quand il se trompe alors que je compte sur lui)
D'où le succès des offres "cloud" où tu pars sur une base de données dejà entrainée par les autres utilisateurs.

@tuxicoman je n'ai pas encore d'expérience dans le domaine et, lisant la doc de #openjarvis, je pensais que #PocketSphinx fonctionnait (au moins pour les hot-words).
Ceci dit, mon idée d'application consiste à réemployer un #nabaztag (projet visionnaire) et utiliser un tag #rfid ou le bouton physique pour déclencher l'écoute, me permettant ainsi de rester pleinement maître de ce qui est diffusé.
@guyou je te conseilles de regarder leur code :-)