Ciao amic* del computer che ne sapete più di me che ne so poco di queste cose, secondo voi sarebbe possibile fare un motore di ricerca pubblico distribuito, o anche no, che fosse free software e il cui sviluppo e i cui costi fossero sostenuti economicamente soltanto con sottoscrizioni libere, e che indicizzasse solo il testo del web, ovviamente senza "AI", che non veicolasse alcuna pubblicità, che non trattasse in alcun modo i dati dellə utent* e che desse una ricerca base e una ricerca avanzata senza "bias" né censura, con opzioni suppergiù simili a quelle della ricerca avanzata di google e con l'aggiunta della possibilità di ordinare i risultati per ordine cronologico di pubblicazione, e magari anche altre cose che, come questa, non ho mai visto sui motori di ricerca?
Gli unici calcoletti che ho fatto sono assai spannometrici ma li metto lo stesso: pare ci siano circa 4 miliardi di pagine web al presente - https://www.worldwidewebsize.com/ -, facciamo che mediamente il testo utile ai fini dell'indicizzazione di una di queste pagine pesi 10.000 byte, sarebbero 40 terabyte in tutto... boh forse ci starebbe.

(Boost apprezzati)

#MotoriDiRicerca #MotoriDiRicercaPubblici #google #informatica

WorldWideWebSize.com | The size of the World Wide Web (The Internet)

The size of the World Wide Web (The Internet) is estimated here every day. The Indexed Web contains at least 3.98 billion pages. Last update Wednesday, 15 January, 2025

Che sòla questo fediverso però :))
2 boost e manco una risposta.
Su quello in inglese, https://todon.nl/@jones/115157414998945472, 1 boost...
Bah.
Jones (@[email protected])

Hello :) A question to those who know more about these things than i do (my knowledge is rather scarce in this regard): do you think it would be possible to create a distributed (or not) public search engine that would be free software and whose development and hardware costs would be financially supported solely by free subscriptions and that would only index web text, obviously without “AI” and without conveying any advert and without processing user data in any way and without applying "biases" or censorship, featuring basic search plus advanced search options including the possibility to sort results by publication date, and maybe even other things i've never seen on search engines? The only calculations i've done are very rough, but i'll put them out there anyway: there seem to be about 4 billion web pages at present - https://www.worldwidewebsize.com/ - Let's say that on average the text useful for indexing one of these pages weighs 10,000 bytes, that would be 40 terabytes in total... I don't know, maybe it would work. (Boosts appreciated) #SearchEngines #PublicSearchEngines

Todon.nl
@jones Forse è perché hai chiesto a chi ne sa più di te sull'argomento e non sanno se possono rispondere o no
@sparkit ah forse si, almeno nella versione italiana, perché in quella inglese ho scritto esplicitamente che ne so poco, https://todon.nl/@jones/115157414998945472 - ora riacchitto anche quella italiana, grazie :)
Jones (@[email protected])

Hello :) A question to those who know more about these things than i do (my knowledge is rather scarce in this regard): do you think it would be possible to create a distributed (or not) public search engine that would be free software and whose development and hardware costs would be financially supported solely by free subscriptions and that would only index web text, obviously without “AI” and without conveying any advert and without processing user data in any way and without applying "biases" or censorship, featuring basic search plus advanced search options including the possibility to sort results by publication date, and maybe even other things i've never seen on search engines? The only calculations i've done are very rough, but i'll put them out there anyway: there seem to be about 4 billion web pages at present - https://www.worldwidewebsize.com/ - Let's say that on average the text useful for indexing one of these pages weighs 10,000 bytes, that would be 40 terabytes in total... I don't know, maybe it would work. (Boosts appreciated) #SearchEngines #PublicSearchEngines

Todon.nl