Found a new (to me) free #SearchEngine for #academic web resources.
https://base-search.net/about/en/index.php
The index contains more than 400 million records from more than 11,000 content providers. 60% of the indexed records are accessible for free (Open Access). BASE is operated by Bielefeld University Library.
#OERSI is now indexed by #BASEsearch, one of the world's largest search engines for academic web resources:
https://www.base-search.net/Search/Results?q=coll:ftid13931&refid=dctablede
#LLMs #StochasticParrots #AcademicFraud
From the article ''Moreover, considering that Google Scholar has no real competitor, there is a strong case for establishing a freely accessible, non-specialized academic search engine that is not run for commercial reasons but for reasons of public interest.''
There is! Spread the word about #OpenAlex https://openalex.org/ and #BASEsearch https://www.base-search.net/
Full details of our new subject classifier can be found in Christoph Broschinski's Master's thesis: https://nbn-resolving.org/urn:nbn:de:hbz:79pbc-opus-25138
In der wissenschaftliche Suchmaschine BASE werden bereits seit Jahren Dokumente maschinell nach der Dewey Decimal Classification (DDC) erschlossen. Die vorliegende Arbeit beschreibt die Erstellung eines Systems des maschinellen Lernens mit dem Ziel, das mittlerweile veraltete Klassifikationssystem in BASE zu ersetzen. Zu diesem Zweck ist es erforderlich, Daten aus BASE zu gewinnen, die als Trainingsmenge eines maschinellen Lernverfahrens dienen können. Es wird gezeigt, wie mithilfe einer explorativen Analyse aus einem Korpus von über 220 Mio. Dokumenten geeignete Daten extrahiert, kuratiert und zu sprachspezifischen Lernkorpora umgearbeitet werden können, die hierzu entwickelte Software ist ein integraler Bestandteil dieser Arbeit. Auf dieser Grundlage werden mithilfe des Toolkits Annif eine Reihe von Klassifikatoren erstellt, deren Leistungsfähigkeit anschließend evaluiert und ein geeigneter Kandidat ausgewählt wird. Ein finaler Vergleich zeigt, dass das in dieser Ausarbeitung erstellte System dem zur Zeit im Einsatz befindlichen BASE-Klassifikator weit überlegen ist. Abschließende Betrachtungen zeigen allerdings auch verschiedene Schwächen des Ansatzes auf, die zugleich einen Bogen zu allgemeinen Erwägungen im Rahmen des derzeitigen „Frühlings“ der künstlichen Intelligenz schlagen.
#BASEsearch technology update:
We ripped out the #DDC classifier created by Mathias Lösch 12 years ago and replaced it with one created by Christoph Broschinski. It is using #annif, the automated subject indexing toolkit.
DDC classification is what allows users to browse our index by subject area: https://www.base-search.net/Browse/Dewey
Christoph found out that the decision tree based #Omikuji https://github.com/tomtung/omikuji outperformed #ANN-based https://fasttext.cc/ so we are luckily using explainable AI #XAI.
#BASE wird heute 20 Jahre alt!
Die damalige Ankündigung hat im Prinzip nichts von ihrer Aktualität verloren: https://www.inetbib.de/listenarchiv/msg24765.html
Inzwischen findet man in BASE Nachweise für fast 400 Mio. akademische Dokumente aus knapp 11.500 Quellen und viele Links zu Volltexten: https://base-search.net
This toot in English: https://openbiblio.social/@base/112670487737084794
#BASEsearch #academicSearch #searchEngine #scholComm #Suchmaschine #akademischeSuche #Suche #BASEsuche #Wissenschaftskommunikation
20 years ago today, Bielefeld Academic Search Engine (BASE) went online.
We have grown continually ever since, indexing almost 400 million academic documents from nearly 11,500 sources these days.
The original announcement is still online (in German): https://www.inetbib.de/listenarchiv/msg24765.html
It started like this:
> Can libraries leave the academic Internet to commercial search engines such as Google, Yahoo and soon Microsoft?
> The answer from Bielefeld to this question is clear …
#BASE indexes 340+ million documents from more than 11.111 sources (publication repositories, publishers etc.).
https://www.base-search.net/
Want to try a different search experience? Go to one of our partners:
– @MetaGer's science tab gets its results from us: https://metager.org/?focus=science
– #OpenKnowledgeMaps also uses #BASEsearch by default, and clusters results to give you an overview of your subject: https://openknowledgemaps.org/
#MetaGer #academicSearch #scholarlySearch #publicationSearch #searchEngine