heise+ | Alternative Suchmaschinen: Brave Search, SearXNG und Swisscows im Detail

Brave Search betreibt einen eigenen Index und ein KI-Arsenal; SearXNG lässt sich lokal installieren; Swisscows blockiert Gewalt und Pornografie.

https://www.heise.de/tests/Alternative-Suchmaschinen-Brave-Search-SearXNG-und-Swisscows-im-Detail-11192914.html?wt_mc=sm.red.ho.mastodon.mastodon.md_beitraege.md_beitraege&utm_source=mastodon

#API #Datenschutz #IT #KünstlicheIntelligenz #OpenSource #Suchmaschine #Tor #news

Alternative Suchmaschinen: Brave Search, SearXNG und Swisscows im Detail

Brave Search betreibt einen eigenen Index und ein KI-Arsenal; SearXNG lässt sich lokal installieren; Swisscows blockiert Gewalt und Pornografie.

c't Magazin

RE: https://troet.cafe/@toranpetto/116397499472543647

Frag ihn doch mal, ob er MetaGer kennt. Viele ältere Menschen kennen noch MetaGer von früher. Uns gibt es tatsächlich immer noch, mit Fokus auf Privatsphäre.
#Suchmaschine

Keine Halluzinationen, keine Fake News: Eine Anleitung, um mit KI online zu recherchieren

Wie bringt man ein Sprachmodell dazu, eine verlässliche und brauchbare Antwort zu liefern?

1) Die blinden Flecken der KI kennen

Wichtig ist als Erstes natürlich die Abschätzung, ob die künstliche Intelligenz die richtige Anlaufstelle ist. Die Masse an Informationen, die den grossen Sprachmodellen zur Verfügung steht, ist gigantisch. Trotzdem ist sie endlich – und es existieren riesige dunkle Flecken. Also, machen wir uns als Erstes bewusst, wo die schlecht erschlossenen Bereiche liegen:

  • Analoge und abgeschottete Inhalte
    Viel wertvolles Wissen liegt hinter einer Bezahlschranke oder war nie online: Ältere Zeitungen, Firmeninterna, historische Dokumente.
  • Aktuelles und ungefestigtes Wissen
    An der «blutigen Kante» schneidet man sich leicht, wenn man sich auf die KI verlässt. Über laufende Entwicklungen weiss die KI oft nicht Bescheid; die Modelle ohne Webzugang haben einen eingefrorenen Wissensstand.
  • Regionale und sprachliche Randbereiche
    Alle die Bereiche, die im Web nicht gut erschlossen sind, entziehen sich oft auch den Sprachmodellen: kleinräumige Gebiete, Dialekte, lokale Kontexte und Milieus. Umgekehrt ist Englisch massiv überrepräsentiert.
  • Implizites Erfahrungswissen
    Man spricht auch von tacit knowledge oder implizitem Wissen. Man – also Mensch – «weiss es einfach», ohne dass man es irgendwo nachschlagen müsste.
  • Privates und Persönliches
    Nicht über jede Person steht etwas im Internet. Ausserdem haben Sprachmodelle notorisch Mühe, damit zu verstehen, dass man Personen anhand des Namens nicht eindeutig unterscheiden kann, besonders, wenn sie Paul Meier oder John Miller heissen.
  • Verzerrte oder einseitige Datenräume
    In manchen Wissensbereichen finden starke Beeinflussungsversuche durch PR, politische Parteien, Lobbyisten statt, die sich zu Informationskriegen auswachsen können. Welchen Einfluss die Versuche aufs Informationsangebot im Web haben, Suchmaschinen zu optimieren bzw. zu manipulieren, dokumentiere ich laufend hier im Blog. Im Bereich der KI nennt man das LLM-Grooming oder AI grooming.
  • Sprachlich schwer erfassbare Sachverhalte
    Nicht alle Dinge lassen sich gut in Worte fassen. Akustische, haptische oder sensorische Eindrücke, Gefühle, Schmerz und Ähnliches. Natürlich kann die KI solche Dinge anhand der Informationen abbilden, die im Netz darüber geschrieben wurden. Aber hier wird besonders klar, dass es sich immer um Eindrücke aus dritter Hand handelt.
  • Wenn wir uns dieser Grenzen bewusst sind, reduzieren wir das Risiko deutlich, auf Halbwissen hereinzufallen, das uns ein Sprachmodell im Brustton der Überzeugung präsentiert.

    2) Explizit Qualität einfordern

    Überdies hilft es, beim Prompt explizit eine Antwort anhand seriöser, fundierter Informationen einzufordern. Das hilft besonders, wenn die Websuche zum Zug kommt: Bei Informationen, die auf diesem Weg in die Antwort einfliessen, kann die KI eine Quellenkritik vornehmen – wobei an dieser Stelle noch einmal explizit darauf hingewiesen sei, dass diese Disziplin keine Stärke der Sprachmodelle ist. Die KIs neigen dazu, einen Reddit-Post genauso verlässlich zu halten wie das Paper einer grossen Universität.

    Mein Tipp jedenfalls ist, beim E-E-A-T-Modell anzusetzen. Das stammt von Google und wird zur qualitativen Bewertung von Suchresultaten herangezogen (wenngleich mit durchwachsenen Resultaten).

    Ich gebe es zu: Diese Infografik habe ich nicht selbst gezeichnet, sondern von Gemini fabrizieren lassen.

    Trotzdem: Es lohnt sich, das Modell zu kennen und beim Prompten zu berücksichtigen. Dabei hilft diese Übersicht, die die Bedeutung der Buchstaben erklärt und zeigt, wie man sie bei Suchen verwendet:

    • Experience – Erfahrung
      «Suche nach Berichten aus erster Hand (Foren, Rezensionen, Fallstudien)»
    • Expertise – Fachwissen
      «Bevorzuge Quellen von Leuten mit nachgewiesener Qualifikation.» Oder: «Beschränke dich auf journalistische Medien mit einem einwandfreien Leumund und auf wissenschaftliche Inhalte.»
    • Authoritativeness – Autorität
      «Verwende die Quellen der ersten Wahl (offizielle Institutionen, Marktführer, Standardwerke.»
    • Trustworthiness – Verlässlichkeit
      «Achte darauf, dass Fakten gut abgestützt sind, sowie auf Transparenz und inhaltliche Verifikation. Keine Fake News, keine interessensgesteuerten Inhalte!»

    Beispiele aus der Praxis

    Mit diesen Kenntnissen im Hintergrund formulieren wir unsere Prompts konkret und eindeutig. Für eine aktuelle Recherche, die auf journalistischen Informationen basiert, verlangen wir etwa:

    Analysiere die aktuelle politische Lage im Iran. Nutze für die Websuche ausschliesslich überregionale Qualitätsmedien mit hohen journalistischen Standards (wie Reuters, AP, «Die Zeit», «Tagesanzeiger», «Spiegel» und «New York Times»). Schliesse Boulevardmedien und Medien mit einer klaren politischen Ausrichtung aus.

    Wenn wir den Stand der Dinge aus wissenschaftlicher Sicht herausfinden möchten, ist das ein guter Prompt:

    Erkläre den aktuellen Stand der Forschung zur CRISPR/Cas-Methode. Beschränke deine Suche auf akademische Datenbanken wie Google Scholar, Researchgate oder Universitäts-Domains (.edu, .ac.at, .ch). Bevorzuge Peer-Review-Studien und zitiere die wichtigsten Autoren mit ihrer Institution.

    Abseits der traditionellen Medien lässt es sich wunderbar recherchieren, insbesondere zu Themen, die für einen Titel mit einem breiten Publikum zu fachspezifisch und nischig wären. Hier formuliere ich z.B. so:

    Fasse die Trends bei den agentischen Browsern zusammen. Suche gezielt nach Analysen von anerkannten Branchen-Experten und bekannten Fach-Blogs (z.B. Wired, Techcrunch, zuverlässigen Blogs wie Clickomania.ch oder substanzielle Substack-Newsletter von Fachleuten). Ignoriere generische SEO-Artikel von Firmenwebseiten.

    Schliesslich hielte ich es für falsch, den riesigen Bereich des User Generated Content von vornherein auszuschliessen. Denn manche Informationen gibt es nur dort. Aber auch hier erleichtert man sich das Leben mit der richtigen Vorgabe:

    Ich brauche Hilfe, um bei meinem Raspberry Pi eine exFAT-formatierte Festplatte zu mounten. Suche nach Lösungen in spezialisierten Experten-Communitys (z. B. Stack Overflow, Github Issues, spezifische Subreddits mit hoher Upvote-Rate). Gewichte Antworten höher, die von verifizierten Experten oder Nutzern mit hoher Reputation innerhalb der Community stammen.

    3) Die KI zur Selbstreflexion bewegen

    Und ja, bei einer KI von Selbstreflexion zu reden, ist eine unzulässige Anthropomorphisierung. Aber ihr versteht, was ich meine. Wir können eine Auskunft auch nachträglich überprüfen, indem wir das E-E-A-T-Prinzip explizit ins Spiel bringen:

    Bewerte die oben genannten Quellen nach dem E-E-A-T-Prinzip. Warum hast du diese Quellen als vertrauenswürdig eingestuft?

    Falls ihr einen Lieblingsprompt zur Quellenauswahl habt, freue ich mich, wenn ihr mir den via Kommentare zukommen lasst!

    Beitragsbild: Das hilft bei der Recherche: Genau hinschauen bei den Quellen und die Ergebnisse fein säuberlich dokumentieren (Dan Dimmock, Unsplash-Lizenz).

    #ChatGPT #KI #KIQuicktipp #LLMs #Suchmaschine
    Schon gewusst, dass wir neben dem MetaGer Proxy auch einen "Tor Hidden Service" anbieten, um auch dem allerhöchsten Sicherheitsbedürfnis entgegen zu kommen? Wir unterhalten eine MetaGer-Instanz im Tor-Netzwerk, die über: https://metager.de/tor/ erreichbar ist. Für die Benutzung benötigst du einen Browser, den du auf https://www.torproject.org/ herunter laden kannst.
    #Suchmaschine #Schongewusst
    @[email protected]

    Heulen und zwar ganz viel.

    Beispielsweise der Roman Faust von Goethe ist eine #Primärquelle.

    Die Kritiken von Literaturkritikern, die über den Roman Faust von Goethe erschienen, sind eine #Sekundärquelle.

    An dritter Stelle steht das grüne Reklamheft über Faust von Goethe.

    Der Artikel in einer Enzyklopädie über faust von Goethe ist eine #Tertiärquelle.

    #Wikipedia, #Grokipedia und die Ausgaben von #Chatbots sind Tertiärquellen, kuratierte Informationen über den Roman Faust von Goethe.

    Wikipedia verwendet als Quellen ausschließlich Sekundärquellen und für Zitate die Primärquelle.

    Grokipedia verwendet auuschlieslich Websites als Quellen (keine Bücher, Archive, die nicht online sind).

    Die #Suchmaschine #Google verwendete in der Vergangenheit häufig Wikipedia als Quelle.

    Heute verwenden die Chatbots als Quelle Wikipedia und Grokipedia.

    In einer fernen Vergangenheit haben Eltern ihren Kindern empfohlen, in Wikipedia zu recherchieren.

    In einer näheren Vergangenheit haben Eltern ihren Kindern empfohlen, in Google zu recherchieren.

    Heute empfehlen Eltern ihren Kindern mit dem Chatbot zu recherchieren.

    Die Idee einer #Enzyklopädie ist eigentlich, sich in dieser Enzyklopädie einen #Überblick zu verschaffen und dann die verwendeten sekundärquellen selbst als #Quelle zu verwenden.

    Wikipedia stirbt. Es machen zu wenig Leute dabei mit.

    In Zukunft werden Menschen mit den Chatbots recherchieren und die Chatbots werden in Grokipedia recherchieren.

    "Search live": zu suchen wird immer leichter. Werden in fünf oder zehn Jahren die Menschen noch in der Lage sein, eine "alte" Suchmaschine zu bedienen? Mit all ihren Funktionen und Möglichkeiten?
    #Suchmaschine #Google

    https://www.handelsblatt.com/unternehmen/dienstleister/search-live-mit-google-plaudern-statt-tippen/100215288.html

    Search Live: Mit Google plaudern statt tippen

    Die Suchmaschine hat ihre Smartphone-App um eine nützliche Funktion erweitert: den Dialog mit der KI. Das bietet neue Möglichkeiten.

    Handelsblatt

    Wie unterscheiden sich eigentlich die Klimarisiken innerhalb Deutschlands?

    Die interaktive Visualisierung von VISLAB zeigt regionale Auswirkungen des Klimawandels: steigende Temperaturen, Hochwasser- oder Starkregenrisiken. Grundlage sind hier Klimaprojektionen und raumbezogene Daten.

    So werden lokale Herausforderungen & komplexe Zusammenhänge verständlich und für die eigene Region sichtbar.

    👉 https://klima-risiken.vislab.io/

    #Umweltdaten #OpenData #Suchmaschine #Transparenz #FAIRdata

    Klimawandelrisiken in Deutschland

    Der Klimawandel ist längst in Deutschland angekommen. In den nächsten Jahren und Jahrzehnten, werden wir die Auswirkungen immer deutlicher spüren. Die lokalen Risiken sind stark davon abhängig wo man in Deutschland wohnt. Finde auf dieser Seite heraus, welchen Herausforderungen sich deine Region stellen muss.

    https://www.vislab.io
    Oh, happy day!
    *ENDLICH* funktioniert die Auswahl von #Suchmaschine /n im @zenbrowser #Zen #Firefox
    👍🏽

    Meine heute DUT Aktion bestand darin, bei der Suchmaschine Metager Geld einzuwerfen und damit Token für eine werbefreie und anonyme Suche zu erwerben. Die ersten Suchergebnisse waren qualitativ gut.

    Da die Token nicht an Geräten oder Nutzern kleben, eignen sie sich aus zum gemeinsamen Gebrauch in der Familie oder als kleines digitales Geschenk für Neugierige.

    #did #DUT #diday #Metager #didit #internetsearch #Suchmaschine #searchengine

    @cybertyperch Vielleicht wäre #SearXNG als #Suchmaschine auch was für dich