有些 Mastodon 跟 Misskey 站點,完全不提供搜尋的功能,也就是說,不光是中文,連英文也沒辦法搜尋。有時候蠻好奇取消搜尋的考量是什麼。單純只是減少系統負荷嗎?
@kokoysan 不一定喔
有可能只是因為 Elasticsearch 太吃資源,不是每個伺服器都有辦法跑 QQ

@zeroplex 會有這個疑問是因為,不支援搜尋的一個 Mastodon 站點,主要訴求是言論自由,不希望有言論打壓的情況發生。這類網站,可能會充斥一些不被國家或社會允許的內容。猜想,有沒有可能,考量的重點不是系統資源,而是保護發文內容不會那麼輕易被不相干的第三者挖掘?

當然,光是不提供搜尋,並不能保護什麼。

只是覺得,能花錢解決的,應該都不是什麼太大的問題。

而且不光是 Mastodon,有些 Misskey 站點也無法搜尋,包括英文內容也沒辦法。Misskey 不需要 MeiliSearch,光是使用 PostgreSQL 的搜尋功能就可以。

@kokoysan 我覺得分散式的架構,可以保護的是「使用者言論自由權力不會因平台誤會、惡意而完全被奪走」

即使沒有辦法搜尋,訊息仍然可以靠著捲動頁面或是用搜尋引擎找到,不會被刪除或是已其他形式消失

------

搜尋功能是另一個問題,這邊分成二個「全文檢索引擎」和「搜尋成效」

「全文檢索引擎」(full text seasrch engine)用來可以對文字進行模糊搜尋,例如搜尋「東東夜市」,即使訊息中沒有「東東夜市」,但仍然可以給你包含有「大東夜市」。MySQL、PostgreSQL 和僅提供全文檢索用得 Elasticsearch 都可以作到這類的搜尋。

再來是搜尋成效,同樣的範例,打錯字但是仍然能找到資料的效果,MySQL 和 PostgreSQL 可能就沒有 Elasticsearch 和 Meilisearch 那麼好。(聽說 PostgreSQL 現在有外掛可以用,我還沒玩到,這個就要 call out 了 XD)

另外 Elasticsearch 本身並不支援中文字搜尋,且運行需要的系統資源相當於一個沒有搜尋功能的 Mastodon 那個肥。所以個人傾向使用 Meiliseach。

----

附註:我之前對 Meilisearch 的中文搜尋功能上的一些測試心得
https://blog.zeroplex.tw/2024/10/24/ai-%E5%A5%88%E7%B1%B3%E9%87%8F%E5%AD%90%E7%A7%91%E6%8A%80%E4%B9%8B-llm-%E4%BB%80%E9%BA%BC%E7%9A%84-meilisearch-%E7%B0%A1%E4%BB%8B/

如果想要看實際上中文的支援,可以到以下網頁測試:
https://zeroplex.tw/news

#Mastodon #elasticsearch #meilisearch

(AI 奈米量子科技之 LLM 什麼的) Meilisearch 簡介 - Zeroplex 生活隨筆

標題不知道寫什麼好,反正外掛說 SEO 100 分 ..... 在開始聊 Meilisearch 之前,我想先

Zeroplex 生活隨筆