Mozilla Common voice project is very good as long as it is not abused by totalitarian regimes to eavesdrop on citizens. If you live in such a country, avoid donating your voice.

چه کسی تضمین می‌دهد که از مشارکت در پروژه‌هایی مثل ‌Mozilla Common Voice، برای پیاده سازی سرویس‌های شنود از مکالمات صوتی شهروندان استفاده نخواهد شد؟؟؟ در صورتی که نگران حفاظت از حریم خصوصی خودتان هستید، از مشارکت در این پروژه و به اشتراک گذاشتن صدای خودتان خودداری کنید و به دیگران هم توصیه کنید که این کار را انجام ندهند

RMS praised Mozilla Speech recognition in 2017 as a crucial effort for free speech recognition. In 2018, he feared a surveillance solution build on similar technology licensed under LGPL 2.1.

https://stallman.org/archives/2017-may-aug.html#27_August_2017_(Mozilla_speech_recognition)

https://stallman.org/archives/2018-mar-jun.html#24_May_2018_(Interpol_voice_recognition)

- در ماه می ۲۰۱۷ آقای استالمن در وبلاگ خودش از پروژه موزیلا برای Speech recognition پشتیبانی کرد و آن را بسیار پر اهمیت نامید.
- در ماه می ۲۰۱۸ ایشان از استفاده از نرم افزار آزاد توسط اینترپول انتقاد کرد و آن را روشی برای شنود غیر قانونی دانست.

@AliMirjamali
با همین فرمون آیا مجاز است که سوال «چه کسی تضمین می‌دهد که از گنو/لینوکس برای سرکوب مردم ایران استفاده نشود؟»
را بپرسیم؟
آگر پرسیدیم و جواب هیچ‌کس بود. حال باید چه کنیم؟ از کمک به پروژه‌های گنو/لینوکسی خودداری کنیم؟
از ارتباط با کسانی که گنو/لینوکس بر روی سیستم خود نصب دارند یا به آن کمک‌رسانی می‌کنند چه؟
@shogath
در این مورد بخصوص یعنی speech recognition یا موردی مثل Face recognition، از نظر من خطرات آن در مقایسه با مزایای آن اینقدر زیاد است که بهتر است از انجام آن اجتناب شود.
@AliMirjamali گنو/لینوکس که پلتفرمی‌تر است و تعداد افراد بیشتری را در برمی‌گیرد.

@shogath
اون مزایای عمومی بیشتری دارد.

در مورد Speech recognition، شخص من ترجیح می‌دهم که منافع جمع کل جامعه را در مقایسه با منافع هموطنان ناشنوایمان اولویت بدهم. احتمالاً آنها هم درک خواهند کرد. الان مایل هستم چند ناشنوا حرفهای من را بخوانند، و بعد نظر بدهند. فقط آنها هستند که می‌توانند نظر بی‌طرف بدهند.

@AliMirjamali @shogath
آیا مشارکت با گمنامی (بدون ایجاد پروفایل خاص و مشخص) هم به نظر شما خطرناکه؟
اگر آره که به نظرم خیلی سخت‌گیرانه است. چون همین الان صدای من و شما و خیلی‌های دیگه در یوتیوب و جاهای دیگه موجوده.
همچنین صوت مکالمات و ....
(هرچند سخت‌تره ولی ممکنه)

اما اینکه کل افراد بدون ایجاد پروفایل خاص مشارکت کنند به نظرم لازمه.

@haghighi @shogath
اصولاً چنین برنامه‌هایی یک model template بخصوص به کاربر می‌دهند که طیف کامل آوای شخص را ضبط کنند. کاربر باید اول از رویش یک بار بخواند. این مقاله خوب توضیح داده:

https://medium.com/ibm-data-ai/watson-speech-to-text-how-to-train-your-own-speech-dragon-part-1-data-collection-and-fdd8cea4f4b8

اگر لهجه یا گویش اندکی با مدلهای موجود در الگوریتم train شده فرق داشته باشد، نیاز به آموزش مجدد الگوریتم برای آن لهجه/گویش وجود دارد. شما با آموزش یک لهجه، بیشتر افراد با لهجه مشابه را برای الگوریتم قابل شناسایی می‌کنید.
(مثال: لهجه انگلیسی/اسکاتلندی/آمریکایی‌مدرن/تگزاسی/استرالیایی/...).

Watson Speech-To-Text: How to Train Your Own Speech “Dragon” — Part 1: Data Collection and…

Over the past years, we’ve seen a lot of AI chatbots deployed in across many organizations. They typically handle general questions about…

@AliMirjamali @haghighi
آفرین. به همین خاطر به شما می‌گویم جمع‌آوری یک میلیون سمپل از ارتش سایبری در مورد عبارت‌های «خامنه‌ای»، «براندازم»، «ولایت فقیه» و غیره با لهجه‌ها و گویش‌های مختلف، با Intonation های مختلف با حالات روحی مختلف(شاد، ناراحت، عصبانی و ...)
به مراتب بهتر از ۱۰ میلیون سمپل جنریک که به ندرت حاوی کلمات بالاست کار خواهد کرد.

@shogath @haghighi
درست می‌فرمایید. شاید (به احتمال زیاد) من اشتباه کرده باشم. من مرده و شما زنده، دو سال دیگر ببینیم که شاهد حضور معادل فارسی و آزاد Alexa یا Google Home Assistant و نرم‌افزارهای آزاد زیر نویس اتوماتیک برای VLC و PeerTube خواهیم بود، یا احضار مردم بدون حکم دادگاه و با script متنی مکالمه تلفن ثابت و موبایل. در حالت دوم، مایلم که «حتی اسم» از دوستانم و افرادی که برایم مهم هستند در توسعه یک سیستم شنود همگانی نباشد.

امیدوارم که من اشتباه کرده باشم و بکنم. هر کسی اشتباه می‌کند.

@AliMirjamali @haghighi
چیزی که حاکمیت نیاز دارد بسیار کوچکتر است ازین پروژه‌ای که موزیلا راه‌اندازی کرده است. اگر پروژه‌های بزرگ برای همه امور کاربردی بودند AGI تا الان به ظهور رسیده بود و ماشین‌ها به جای ما فکر می‌کردند. به همین خاطر Strong AI شکست خورد و به پروژه‌های کوچکتر و خاص‌منظوره‌تر رو آورده شد. اگر می‌بینید مدلی که امروزه برای بینایی ماشین استفاده می‌شود توانایی تشخیص صوت را ندارد علتش همین است.

در هوش‌مصنوعی و بالاخص یادگیری ماشین هر چقدر پروژه خاص‌منظوره‌تر طراحی شود نتیجه بهتری می‌گیرد.
به همین خاطر در همه کتب رفرنس یادگیری ماشین قسمتی را به عنوان No Free Lunch Theorem اختصاص می‌دهند که ذهنیت صحیحی از ابزاری که می‌خواهند توسعه دهند داشته باشند.

@shogath @AliMirjamali من غیر از اون مثال شوگات در مورد گنو لینوکس، با بقیه حرف‌هاش موافقم.
گنو لینوکس و چیز‌های مشابه رو نمیشه چندان شبیه سمپل‌ها و روش‌های تشخیص صوت یا هویت دونست.

چون برای گنو جایگزین کم نیست و به یک بلوغی رسیده که بدون مشارکت ایرانی جماعت همچنان اوکیه.
اما تشخیص صوت هنوز به اون بلوغ عمومی نرسیده و نیاز به کار هست.
و مورد دیگه اینکه کلمات و سمپل‌های خاصی برای این امور لازمه. هرچند بعید میدونم ج.ا. نداشته باشه اینو.

در کل زیاد بدبین بودن باعث انقعال مطلق میشه.

@haghighi @AliMirjamali
به عنوان مثال عرض می‌کنم. iptables رو در نظر بگیرید. تمامی ویژگی‌هایی که جناب جمالی برای یک چاقوی کشتار در نظر دارند را یکجا دارد.
بنده فکر می‌کنم اگر با همان فرمان قضاوت کنیم و طفره نرویم iptables در کشتار آبان ماه ۹۸ مشارکت فعال داشته و تمامی انسان‌هایی(صرفنظر از ایرانی یا خارجی‌ بودنشان) که به توسعه و پیشرفت آن کمک کرده‌اند در آن کشتار دخیلند.