@osma @rolle @turvanen @jonne @sivusta
Eivätkös täällä käytännössä valtaapitävät uhanneet aiemmin sulkea sellaiset tahot federoinnista, jotka rohkenevat tarjota kattavaa tekstihakua? Muistaakseni joku ainakin yritti toteuttaa sellaisen palvelun ja joutui sulkemaan.

Vai koskiko se vain sitä, jos se olisi oikeasti kattava, eikä vain instanssinsisäinen (+jokin joukko muualta tulevaa dataa mitä joku sattuu seuraamaan)?

@pekka

Tuo on eri asia, eli juuri instanssin ulkopuoliset haut ilman opt-outia ovat epätoivottuja.

Vyr:n extended search patch on käytössä esim. Universeodonissa 13000 käyttäjälle.

https://github.com/VyrCossont/mastodon/pull/8

https://universeodon.com/explore

@osma @turvanen @jonne @sivusta

Extended post and account search by VyrCossont · Pull Request #8 · VyrCossont/mastodon

This patch combines the expanded account and post search scope and advanced operators of #2 and #5 with the UI and parser improvements of mastodon#24055. (RIP 24055.) This means you can full-text s...

GitHub

@pekka

Mutta käytännössä kun esim. oma aktiivinen instanssini releineen federoi 99%, instanssini haku on sen verran kattava, että ei kaipaa muuta.

@osma @turvanen @jonne @sivusta

@rolle @osma @turvanen @jonne @sivusta
99% mistä?

Kattaako se tekstihaku siis myös palvelimen ulkopuolelta tulevan sisällön ja millä rajoitteilla?

@pekka

En ole ihan varma miten tämä "99.34% of instances" on laskettu https://instances.social/mementomori.social mutta antaa osviittaa siitä miten hyvin pitkin Fediverseä instanssini on levinnyt.

Tietenkään ei ole ihan niin yksiselitteistä kun puhutaan esim. sisällön löydettävyydestä. Haku kattaa siis kaiken mistä instanssini tietää, myös muiden palvelimilta. Omalla palvelimellanihan on siis 89 aktiivista käyttäjää, pelkästään näiden sisällöistä haku ei hae vaan ihan kaikkialta, kaikista profiileista joissa on merkitty discoverable -täppä, eli haluaa tulla löydetyksi.

@osma @turvanen @jonne @sivusta

Mastodon instances

@pekka

Rajapinta sanoo "domain_count":18455

Eli teoriassa tuo määrä domaineja sisältyy hakuun, se matsku mitä on instanssini perustamishetkestä (marras 2022) indeksoitu. https://mementomori.social/api/v1/instance

@osma @turvanen @jonne @sivusta

@rolle @pekka
Hieman selitystä sivusta:
1. palvelimen omat käyttäjät ja heidän postauksensa
2. näiden käyttäjien seuraamat käyttäjät muualla ja heidän postauksensa siitä asti, kun ensimmäinen seuraaja aloitti
3. relay-palvelinten läpi tuleva federated-virta, käytännössä kaikkien relayssä mukana olevien palvelinten julkiset postaukset

Ja sitten lisäksi tosiaan se, kuinka kauan indeksiä säilytetään.

@turvanen @jonne @sivusta

@osma @rolle @turvanen @jonne @sivusta
Tuo yllelinkattu api-vastaus näyttää siis kertovan että instanssilla on 89 käyttäjää ja se on tietoinen 18457 muusta palvelimesta mutta varsinaisia postauksia se sisältää yhteensä vain 24135.

Ja nuo instances.socialin hieman vanhentuneet luvut kertovat että tuo määrä on:
23834 Statuses
0% of total (885424463)

Eli kokonaisuuden kannalta tekstihaku ei löydä juuri mitään.