(「マストドン」は、米国とEUの間で個人情報データ保存場所(いわゆるセーフハーバー問題)に関する議論がなされている昨今、脱中央集権(具体的には米国大手IT企業)の概念を持つEU圏の若者によって開発されたわけで、このプラットフォームの真の意味は、インスタンス所在地のジオグラフ(※)を見れば「人的コミュニケーションとしての"ザ・インターネット"」の実質的な再構築であることにピンと来る人はピンと来るかと思うんだけど、果たしてその視点を持って現象を捉えてる日本人がどれだけいるかが、日本語圏ユーザーの観察の中で自分が気になっている点の一つです。)
【※】
#Mastodon🐘 Network Monitoring
#マストドン🐘 インスタンス統計サイト
https://mnm.eliotberriot.com https://mastodon.social/media/XmSTGuVSpq6TonSxr1o
(あと、#マストドン🐘 日本語圏フィーバーとは別に、欧州圏インスタンスユーザーの中から多言語翻訳bot(言語コードを付けてトゥートすると翻訳してリプしてくれる)を提供する人が出ている現象も興味深く観察している)
https://mastodon.social/@cs/3533605
#MastodonFedeverse 🐘🌐
#Languages
https://mastodon.social/media/BF2eJVz6xyFj8jclOgg
機械翻訳技術に関してですが、現状、欧州言語間ではかなりの精度で言葉の壁はなくなりつつありますが、ラテン文字言語(表音文字)と日本語・中国語など(表意文字)の相互翻訳では、言葉のニュアンスの汲み取り方が現状の技術ではとても難しいので、ニューラルネットワークでの深層学習理論が確立されるまでは鵜呑みにせず、状況や相手の使用言語を少し勉強し理解する志を持ったうえで活用してほしい所存。かしこ。
【機械翻訳参考動画】
なぜ日本語(表意文字言語)がラテン文字言語に比べて機械翻訳が難しいかは、この動画を見るとおわかりいただけるかも。(文節文脈解釈のプロセスにおいての差)
"How Computers Translate Human #Languages"
https://www.youtube.com/watch?v=X4BmV2t83SM&cc_load_policy=1
※日本語字幕対応動画です。右下歯車マークで設定
おお、@[email protected] 氏の 「#マストドン ネットワークモニタリング」、トゥート内容分析が進化していた。
言語別分析興味深いな。
[#Mastodon Network Monitoring]
#Languages
1:不明(UNKNOWN)40%
2:英語(en)23%
3:日本語(ja)17%
4:フランス語(fr)12%
5:スペイン語(es)5%
6:その他(Others) 3%
日本語は英語に次ぐ3位か。
https://mnm.eliotberriot.com/dashboard/db/statuses https://mastodon.social/media/MaNqTh3_AzqNhitTiUk
てゆうか、UNKNOWNってたぶん英語と日本語混在状態やアスキーアート及び無言添付ファイルで判別できない状態だろうから、日本語は実質2番目に多く使われてる言語ですね。
@ken_sugar
インフラの提供は個人じゃ無理ってのも再確認された気もするが
@Fennecus
そのあたり、創始者のオイゲン(@Gargron)は、5000ユーザー程度が収納されたインスタンスが分散建立されるのが理想というグランドデザインを描いているかと思います。
https://mastodon.social/@ken_sugar/4274134
@ken_sugar @Gargron
なお私のインスタンスは現在28ユーザー
理想と現実の差を知った今日この頃
少な、と思ったら2017年の投稿か。今はどうなってるんだろう。