Hardware: HP EliteDesk 800 G1 SFF 16Gb RAM & https://www.jacob.de/produkte/Intel-Ethernet-Server-Adapter-I350-T4-I350T4V2-artnr-2094756.html #i350t4
If you're in for reading some #SRE horrors, take a look at https://engineering.zalando.com/posts/2025/12/we-hacked-ourselves-so-you-dont-have-to.html
Explains how a team at #ZalandoTech learned to analyze long running #Elasticsearch queries the hard way.

Once upon a time, during a normal Sunday, our team ran into an unexpected challenge: an Elasticsearch cluster that suddenly became sluggish and unresponsive due to a self-inflicted Denial of...
Malcolm v25.12.1 contains a few critical bug fixes and component version updates.
https://github.com/idaholab/Malcolm/compare/v25.12.0...v25.12.1
zeek.intel.file_mime_type to file.mime_type so filters created from it can work on other dashboards/var partition (#835)Malcolm is a powerful, easily deployable network 🖧 traffic analysis tool suite for network security monitoring 🕵🏻♀️.
Malcolm operates as a cluster of containers 📦, isolated sandboxes which each serve a dedicated function of the system. This makes Malcolm deployable with frameworks like Docker 🐋, Podman 🦭, and Kubernetes ⎈. Check out the Quick Start guide for examples on how to get up and running.
Alternatively, dedicated official ISO installer images 💿 for Malcolm and Hedgehog Linux 🦔 can be downloaded from Malcolm's releases page on GitHub. Due to limits on individual files in GitHub releases, these ISO files have been split 🪓 into 2GB chunks and can be reassembled with scripts provided for both Bash 🐧 (release_cleaver.sh) and PowerShell 🪟 (release_cleaver.ps1). See Downloading Malcolm - Installer ISOs for instructions.
As always, join us on the Malcolm discussions board 💬 to engage with the community, or pop some corn 🍿 and watch a video 📼.
#Malcolm #HedgehogLinux #Zeek #Arkime #NetBox #OpenSearch #Elasticsearch #Suricata #PCAP #NetworkTrafficAnalysis #networksecuritymonitoring #OT #ICS #icssecurity #CyberSecurity #Cyber #Infosec #INL
Настоящие и будущее поиска в Ecommerce
В этом материале мы детально рассмотрим, какие архитектуры и подходы применяются в средних и крупных интернет‑магазинах, с какими проблемами они сталкиваются и какие решения оказываются наиболее эффективными. Эпизодически мы будем смотреть на лидеров российских маркетплейсов, поскольку они дальше продвинулись в развитии поисковых технологий и зачастую задают тренды российского рынка.
https://habr.com/ru/companies/compo/articles/977838/
#search #pimсистема #mdmсистема #ai #листинг #поиск_товаров #индексация_поиска #elasticsearch #opensearch #поисковые_системы
I wonder if it makes sense to approach job search through hobbies and side activities rather than just by past employment history.
In my free time, I do #microbiology. I have a #biolab in the cellar with petri dishes and microscopes and all. I ferment #olives which grow in my tree and make pickles out of them, I make two kinds of #sourdough bread from a culture I extracted from quince fruit peels from my own tree, one wheat and one #rye.
I do #mycology. I have some 2,000 photos of wild #mushrooms in my Facebook photo albums.
I do a lot of software-defined radio, I have more #antennas than I care to count, and also more #SDR modules than I care to count. I stream radio data directly to my own #ElasticSearch which I can visualize in different ways in Kibana.
I do home automation, and the house has countless sensors and cameras. I use #HomeAssistant for this, with lots of modules I have implemented myself, for example for scraping data from my Huawei solar panels and graphing their historical data.
I have a home #Kubernetes cluster with many nodes and several public-facing services with some 99.9% uptime like a local Mastodon instance and also a #Matrix instance, in addition to lots of local services.
I am a data archivist and I have lots of stuff backed up locally if the internet goes down like it did during the notorious #apagon in Spain.
I play strategy games in Playstation, some of my current favorite games are #Stellaris and #Tropico6. I just like resource optimization over time.
I grow vegetables and some fruit trees. Trying to get really hot chilis growing here as they aren't readily available in stores. I have eaten the One Chip Challenge without even wincing a bit. I am a #ChiliHead.
I administrate all sorts of online communities and web pages. I read a lot of books and whenever I get into a new domain, I tend to read several definitive reference books of the topic from cover to cover. For example I now know more about #cancer biology than I ever thought I would.
I used to take a lot of #Coursera courses, also in non-technical topics such as #virology, #BrainPhysiology, #AnimalBehavior and such.
We have 3 cats, 2 siamese and 1 rescued as a kitten from the neighboring empty plot where he was born.
Ask me anything about these things!
If you need someone like this in your team to build great things, working remotely from Spain, let's chat!
How to Install #Zammad on #AlmaLinux #VPS (10-Minute Quick-Start Guide) This article provides a guide on how to install Zammad on #AlmaLinux VPS.
If you're looking to run a robust open-source #helpdesk on your AlmaLinux VPS, Zammad is a great pick. It's modern, feature-packed, and supports everything from ticketing to chat and reporting. This guide ...
Continued 👉 https://blog.radwebhosting.com/how-to-install-zammad-on-almalinux-vps/?utm_source=mastodon&utm_medium=social&utm_campaign=mastodon.raddemo.host #opensource #ticket #customersupportplatform #selfhosting #elasticsearch #selfhosted #certbot #letsencrypt
In #Wikipedia steht die Antwort möglicherweise. Es dauert aber, herauszufinden, in welchem Artikel, Listenartikel oder Unterartikel. Die #Suche von Wikipedia verwendet zwar #ElasticSearch, aber um die Vorteile von dieser starken Engine auch zu erhalten, hätten 100000e Menschen, die Wikipedia-Artikel auch verschlagworten müssen (#wikidata). Ausserdem kann es sein, dass etwas so praktisches wie formatstrings als #unenzyklpädisch eingestuft wurde und daher entfernt.
In #Stackexchange muss ich mehrfach bestätigen, dass ich ein Mensch bin, finde dann einen Artikel, der unbeantwortet geschlossen wurde, weil #Duplikat. Dann zwei veraltete, die inzwischen falsch sind, dann welche mit einem nicht mehr funktionierenden link auf die Lösung.
Bei #archive_org, archive.is und #AnnasArchive muss ich die #URL des gesuchten Artikels wissen, um suchen zu können.
Eine #Suchmaschine sucht nicht. Eine Suchmaschine liest die "Sutemap.XML" Dateien aus, die websitebetreiber online stellen für die #crawler der Suchmaschinen. Ich finde also fünf Jahre alte Artikel auf Websites die seit fünf Jahren nicht mehr gepflegt werden. Und maximal ein jahr alte Artikel, die meine Frage nicht beantworten aber in der #sitemap stehen. Die 100 Websites, die die richtige Antwort in einem zwei bis vier Jahre alte Artikel enthalten, finde ich nicht, weil diese Artikel nicht mehr in der sitemap stehen.
Die GPTbots haben Wikipedia, stackexchange, Archiv.org, Annas archive und alle Websites gescrapt und dabei #robots.txt und sitemap ignoriert. Ich bekomme die richtige Antwort und zwar schneller als mit allen zuvor genannten Varianten.
Oder ich suche in #Grokipedia. Grokipedia besteht aus 1Million statischen seiten im #CDN von #Cloudflare die von wikipedia gescrapt wurden. Die suche ist ein GPTbot und 57mal besser als die suche in wikipedia.
@malteengeler @awinkler @evawolfangel @bkastl @Raymond @wikipedia
Как мы учили поиск понимать контекст: практическое руководство Купера для маркетплейсов
В IT-сообществе только и разговоров об эмбеддингах, metric learning, косинусных расстояниях и семантическом поиске. На конференциях все хвастаются красивыми слайдами про нейросети и векторные пространства. Но если заглянуть под капот и посмотреть, что реально работает в поиске крупных маркетплейсов и e-commerce платформ, то там, как правило, он — добрый, старый полнотекстовый индекс. Почему? Потому что полнотекстовый поиск — это стабильно, быстро и понятно. Минус только один, его уже недостаточно. Да, он классно ловит точные совпадения, но синонимы, переформулировки и небольшие ошибки прощает пользователям уже с большим трудом. Меня зовут Игорь Самарин , я Machine Learning Engineer из команды поиска в Купере, где уже полтора года занимаюсь проектами, связанными с векторами. В этой статье я расскажу, как на самом деле работает поиск внутри компании, поведаю о полнотекстовом поиске — его сильных сторонах и недостатках. Затем объясню специфику векторного поиска и разберу, какие именно проблемы старого подхода он решает и продемонстрирую, как обучить векторную модель на своих данных, чтобы она понимала специфику каталога. А в конце вас ждут реальные результаты из A/B тестов и небольшой панч о перспективах.
https://habr.com/ru/companies/kuper/articles/976068/
#ml #машинное_обучение #vector_search #векторный_поиск #гибридный_поиск #векторная_модель #elasticsearch
📊 #VictoriaLogs - Fast #opensource log database from #VictoriaMetrics using 30x less RAM & 15x less disk than #Elasticsearch and #Loki. Handles terabytes of logs efficiently with the powerful #LogsQL query language. Available in single-node and cluster mode. #observability #devops #logging
🧵 👇