Нечёткий поиск при пересечении множеств, или Как выжать все соки из Хэширования по сигнатуре
На просторах интернета легко можно найти материалы по реализации нечёткого поиска, в которых предполагается поиск одной строки в множестве строк M . Но что если возникнет необходимость реализовать нечёткое сравнение множества M₁ с множеством M₂ ? При классическом подходе нам придется выполнить сравнений - при линейном росте этих множеств, сложность задачи будет расти экспоненциально , в плане производительности это решение никуда не годиться! В этой статье предложен вариант реализации ускоренного алгоритма для решения этой задачи. Теоретической новизны в проекте практически нет. Цели: 1 - Ознакомить с концепцией 2 - Дать конкретный пример интеграции в БД SQL(MSSQL) 3 - Ознакомить с возможностями на базе практической реализации
https://habr.com/ru/articles/965934/
#нечёткое_сравнение_строк #расстояние_хэмминга #расстояние_левенштейна #hengine #хэширование_по_сигнатуре #sql #интеграция_стороннего_кода_в_SQL #mssql #sqlclr #c#net

