Mozilla Common voice project is very good as long as it is not abused by totalitarian regimes to eavesdrop on citizens. If you live in such a country, avoid donating your voice.

چه کسی تضمین می‌دهد که از مشارکت در پروژه‌هایی مثل ‌Mozilla Common Voice، برای پیاده سازی سرویس‌های شنود از مکالمات صوتی شهروندان استفاده نخواهد شد؟؟؟ در صورتی که نگران حفاظت از حریم خصوصی خودتان هستید، از مشارکت در این پروژه و به اشتراک گذاشتن صدای خودتان خودداری کنید و به دیگران هم توصیه کنید که این کار را انجام ندهند

RMS praised Mozilla Speech recognition in 2017 as a crucial effort for free speech recognition. In 2018, he feared a surveillance solution build on similar technology licensed under LGPL 2.1.

https://stallman.org/archives/2017-may-aug.html#27_August_2017_(Mozilla_speech_recognition)

https://stallman.org/archives/2018-mar-jun.html#24_May_2018_(Interpol_voice_recognition)

- در ماه می ۲۰۱۷ آقای استالمن در وبلاگ خودش از پروژه موزیلا برای Speech recognition پشتیبانی کرد و آن را بسیار پر اهمیت نامید.
- در ماه می ۲۰۱۸ ایشان از استفاده از نرم افزار آزاد توسط اینترپول انتقاد کرد و آن را روشی برای شنود غیر قانونی دانست.

@AliMirjamali
با همین فرمون آیا مجاز است که سوال «چه کسی تضمین می‌دهد که از گنو/لینوکس برای سرکوب مردم ایران استفاده نشود؟»
را بپرسیم؟
آگر پرسیدیم و جواب هیچ‌کس بود. حال باید چه کنیم؟ از کمک به پروژه‌های گنو/لینوکسی خودداری کنیم؟
از ارتباط با کسانی که گنو/لینوکس بر روی سیستم خود نصب دارند یا به آن کمک‌رسانی می‌کنند چه؟
@shogath
در این مورد بخصوص یعنی speech recognition یا موردی مثل Face recognition، از نظر من خطرات آن در مقایسه با مزایای آن اینقدر زیاد است که بهتر است از انجام آن اجتناب شود.
@AliMirjamali گنو/لینوکس که پلتفرمی‌تر است و تعداد افراد بیشتری را در برمی‌گیرد.

@shogath
اون مزایای عمومی بیشتری دارد.

در مورد Speech recognition، شخص من ترجیح می‌دهم که منافع جمع کل جامعه را در مقایسه با منافع هموطنان ناشنوایمان اولویت بدهم. احتمالاً آنها هم درک خواهند کرد. الان مایل هستم چند ناشنوا حرفهای من را بخوانند، و بعد نظر بدهند. فقط آنها هستند که می‌توانند نظر بی‌طرف بدهند.

@AliMirjamali فقط افراد ناشنوا نیستند. به کمک افراد نابینا هم می‌شود. افرادی که از نعمت خواندن کتاب‌های معمولی عاجزند. کمپین‌هایی مثل کمپین زیر راه افتاده‌اند. اما همواره با کمبود نیروی داوطلب مواجه‌اند:

https://www.instagram.com/p/CHr7I5xnzu1/

استفاده‌های دیگر؟ شما می‌خواهید تلاش کنید که نسخه آزاد Google Home یا Alexa را با برد سخت‌افزاری خود راه‌اندازی کنید.

یا این که شما می‌خواهید کتابخوان خود را مجهز به یک خواننده متن خوب بکنید که فشار کمتری به چشم‌هایتان بیاید.

می‌توان چاقو و چاقوسازی را ممنوع کرد اما کشتار را خیر.

@shogath

با تکنولوژی text-to-speech برای نابینایان هیچ مشکلی ندارم و آن را بسیار خوب و عالی می‌دانم. آینده به ما نشان خواهد داد که چاقوی ساخته شده، چاقوی میوه خوری است یا چاقوی شکاری که کاربردی به جزء کشتن حیوانات و انسان ندارد.

@AliMirjamali
آینده به ما نشان داد که سیستم عامل فیلترکننده و دکمه خاموش اینترنت گنو/لینوکس است.
ای کاش گنو/لینوکس را در نطفه خفه می‌کردیم که همچین چاقوی شکاری در دست سردمداران علم کوانتوم و بخش خصوصی نشود.

@shogath
لینوکس هم یک چاقوی دولبه است. ولی قابل مقایسه نیست. مزایای فراوانی دارد که قطعاً بر معایب آن برتری کامل دارد.

موارد پر فایده دیگر هم هست. .مثلاً OCR training که کاربران علاقمند از کتاب عکس بگیرند و فونت و حروف‌چینی را به نرم‌افزار آموزش دهند (تصحیح یا تایپ مجدد موارد مشکل‌دار).

@AliMirjamali
از دید بنده هر دو قابل مقایسه‌اند. هر دو مزایا و معایب دارند. هر دو مزایاشان از معایبشان بیشتر است. هر دو نرم‌افزار یا دادگان آزادند. نمی‌توانم هضم کنم که یکی با دیگری فرق دارد. هر دو به عنوان ابزار تسهیل‌گر کشتار استفاده می‌شوند. هر دو می‌توانند کیفیت زندگی ما را بهتر کنند.

اگر به یکی ایرادی میگیرید. به صورت خودکار به دیگری نیز وارد است.

@shogath
الان مثلاً از یک OCR فارسی چه استفاده ناجوری می‌شود کرد؟ یا از text-to-speech چه استفاده ناجوری می‌شود کرد؟
@AliMirjamali
همان استفاده‌ای که برای شنود در Speech می‌شود. عکس‌های خام افراد از OCR رد می‌شود و اگر متنی در آن باشد(به همانند Speech) شنود می‌شود.
@shogath
فکر کنم اشتباه می‌فرمایید. من در مورد سرویس تبدیل متن به تکست صحبت می‌کنم و در خصوص عکس صحبتی نکردم. وگرنه من با Face recognition کلاً مخالف هست. چه آزاد و چه غیر آزاد. حالا کاربر به جای اینکه با دوربین و نشان دادن صورت خودش، قفل گوشی را باز کند، به جایش رمز بزند.
@AliMirjamali
سرویس OCR سرویسی است که به آن تصویر می‌دهید (معمولا حاوی متن). اگر OCR متنی ببینید String آن و محل قرارگیری آن در تصویر که به bounding box معروف است را به شما می‌دهد.
@shogath
اصل سرویس OCR مخفف Optical Character Recognition است و برای شناسایی متن. شناسایی تصویر به صورت Bounding box همین الان به خوبی انجام می‌شود و نیاز به machine learning ندارد.
@AliMirjamali بنده به عنوان یک مهندس یادگیری ماشین خدمت شما عرض می‌کنم. بهترین دقت‌ها را در OCR مدل‌های یادگیری عمیق دارند. مدل‌های AWS Textract، Google Cloud Vision بر همین مبنا کار می‌کنند.
@shogath
من پست قبلی شما را الان دیدم و متوجه شدم که اشتباه فهمیدم. شما درست می‌فرمایید.
@AliMirjamali
ساده‌ترین آن استخراج متن استوری‌های اینستاگرام است.
@shogath
در این مورد حق با شما است. البته به نظر من خطرش کم است. اکانتی که ناشناس باشد، با تایپ یک متن یا پست کردن آن به صورت عکس، یک میزان در خطر قرار دارد.