Well i finally did it. I just released my test dataset for AI Evaluation. Its a simulated company, represented by 60,000 documents, the readme in the image explains it all ... If you are interested, its at https://codeberg.org/Lorenz_Systems/Company_Sim.git
#EUAIAct #DigitalSovereignty #SovereignCloud #FOSS #FLOSS #Codeberg #Forgejo #OpenSource #DataGovernance #Auditability #ForensicAI #EUTech #PrivacyByDesign #InformationRetrieval #KnowledgeManagement #DeterministicAI #EUPL
@marlinz #Informationretrieval is depending on the current task and situation.
Sometimes #navigation is the most efficient one, sometimes it's #search. (my #TagTrees are a combination of both) And then there is teleporting, bookmarks/favorites, ...
Unfortunately, most people don't have the knowledge and experience to use multiple methods and decide which method to choose in a specific situation. 😞
👥 Justus-Jonas Erker (UKP Lab/Technische Universität Darmstadt), Nils Reimers (Cohere), Iryna Gurevych (UKP Lab/Technische Universität Darmstadt)
See you at Hashtag#EACL2026 in Rabat 🕌!
#UKPLab #NLP #NLProc #InformationRetrieval #DenseRetrieval #MultiHop #FactChecking #QuestionAnswering #RAG
ITmedia AI+ (@itm_aiplus)
'SoftMatcha 2'라는 '애매함(曖昧)' 검색 시스템이 도쿄대, 교토대, Sakana AI 등 공동으로 개발되었으며, 급증하는 AI 학습 데이터에서 유사성 기반 고속 검색을 가능하게 해 학습 데이터 관리·검색 효율을 크게 개선할 수 있다고 보도되었습니다.
Big congratulations to all authors! 🚀
#ICLR2026 #MachineLearning #AIResearch #RepresentationLearning #InformationRetrieval #DenseRetrieval #SelfSupervisedLearning #LanguageModels #NLP #UKPLab #ICLR
RAG-системы: что это такое, принципы работы, архитектура и ограничения
Retrieval-Augmented Generation (RAG) всё чаще упоминается в контексте LLM и всё чаще фигурирует в требованиях к разработчикам, но за этим термином обычно скрывается довольно размытое представление о том, как такие системы реально устроены. В этой статье я разбираю RAG как архитектурный подход: зачем он вообще появился, какие задачи решает, как выглядит базовый пайплайн от данных до ответа модели и где на практике чаще всего возникают проблемы.
https://habr.com/ru/articles/989000/
#rag #llm #retrieval #nlp #embeddings #semanticsearch #informationretrieval