Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым майонезом, он с большей вероятностью оказался на полке. А если не оказался — чтобы сотруднику магазина как можно быстрее прилетело задание: «проверь, почему именно этой позиции сейчас нет, и, если возможно, верни её обратно». Мы уже дважды писали про OSA (On-Shelf Availability — уровень доступности товара на полке). В статье «Как OSA превращает пустые полки в полные корзины?» рассказывали про продуктовый контекст: зачем эта история нужна бизнесу и почему «товар числится в системе» и «товар реально лежит на полке» — это два совершенно разных утверждения. А в статье «Когда 0 в продажах — аномалия? CUSUM для поиска проблем в ритейле» мы подробно разбирали один из рабочих алгоритмов команды. В этот раз я хочу пройтись по всему стеку детекции целиком — от самых простых правил до А/Б-тестов, в которых приходится бороться с зависимыми наблюдениями.

https://habr.com/ru/companies/magnit/articles/1027032/

#osa #статистика #доступность #абтесты #cusum #машинное_обучение #магнит #ml #magnit_tech #ритейл

Доступность товара в «Магните»: от эвристик до CUSUM и GEE-тестов

Привет, Хабр! Меня зовут Ян Пиле, руковожу в MAGNIT TECH направлением развития алгоритмов доступности товаров. Задача моей команды: сделать так, чтобы в магазине, куда вы зашли за своим любимым...

Хабр
https://sysmod.wordpress.com/
#Excel #dynamic #array #cumulative sum
To calculate a 2-D array where each row is the #cusum of each row in the source table, it’s possible to use the #MMULT function. The #matrix multiplication is done with an upper-right triangular array of 1s. But when you get to 1000 rows, the matrix is a million-cell array, and for 3000 rows or more, #MSExcel is going to go out of memory.
Here is an efficient method of doing this for a dynamic array cusum down columns.
Patrick O'Beirne @ sysmod

Spreadsheet quality and testing

Patrick O'Beirne @ sysmod

#Excel #dynamic #array #cumulative sum #formulas shootout

https://sysmod.wordpress.com/2023/08/23/excel-dynamic-array-cumulative-sum/

Different methods are evaluated to calculate cumulative sums in a 2D array efficiently. The fastest solution is obtained from a LinkedIn suggestion by Diarmuid Early, and a close second is from Peter Bartholomew.
#cusum

Excel dynamic array cumulative sum

To calculate a 2-D array where each row is the cusum of each row in the source table, it’s possible to use the MMULT function. The matrix multiplication is done with an upper-right triangular…

Patrick O'Beirne @ sysmod