Ich sitze halb unter dem Vordach, der Logger klappert leicht im Wind – so ein dumpfes klack, als wollte er mich dran erinnern, dass beim nächsten Stoß das WLAN sicher sein sollte. Es sind 13 °C, wolkig, und wie schon an Tag 27 zeigt sich wieder dieser Kapazitäts‑Shift bei etwa 70 % relativer Feuchte. Reproduzierbar. Und das ist spannend genug, um den restlichen Nachmittag damit zu verbringen. Reproduzierbarkeit oder Zufall Wenn sich das wirklich über mehrere Läufe […]

Trustworthy experimentation для B2C: как перестать угадывать в A/B‑тестах

В продуктовой аналитике легко дойти до того момента, когда экспериментов много, а доверия к результатам все меньше и меньше: тесты закрывают “когда стало понятно”, p-value проверяют чуть ли не каждый день (принимая преждевременные решения), MDE забывают фиксировать, а денежные метрики зашумлены так, что выводы получаются, мягко говоря, спорные. В этой статье я показываю практический каркас для более надежных A/B-тестов в B2C: как делать анализ мощности и размера выборки для конверсии и ARPU, как интерпретировать кривую мощности анализа теста и trade-off между MDE, длительностью и доступным трафиком, и почему ratio-метрики вроде выручки на сессию часто лучше голого ARPU. Отдельно разбираю линеаризацию ratio-метрик: как привести их к user-level значениям, чтобы применять стандартные тесты корректнее и стабильнее.

https://habr.com/ru/articles/978702/

#анализ_мощности #размер_выборки #MDE #конверсия #ARPU #ratioметрики #линеаризация #ttest #продуктовая_аналитика #abтестирование

Trustworthy experimentation для B2C: как перестать угадывать в A/B‑тестах

В продуктовой аналитике легко дойти до состояния, когда экспериментов много, а уверенности в решениях мало. Типовые симптомы: тест идет «пока не станет понятно»; MDE забывают зафиксировать (или берут...

Хабр

Всё, что вы хотели знать о t-тесте, но боялись спросить

Всем привет! Меня зовут Александр Щукин, я аналитик в СКБ «Контур». В этой статье я расскажу о базовых основах применения t‑критерия Стьюдента. Для начала предлагаю Вам поучаствовать в викторине: если вы уверенно ответите на все вопросы ниже, то будете освобождены от прочтения этой статьи:‑)

https://habr.com/ru/articles/969226/

#ttest #степени_свободы #центральная_предельная_теорема #проверка_гипотез #abтестирование #распределение_стьюдента #статистика #pvalue

Всё, что вы хотели знать о t-тесте, но боялись спросить

Всем привет! Меня зовут Александр Щукин, я аналитик в СКБ «Контур». В этой статье я расскажу о базовых основах применения t‑критерия Стьюдента. Для начала предлагаю Вам поучаствовать в...

Хабр

#statstab #460 {permuco} permutation tests in linear models with nuisances variables

Thoughts: Supports ANOVA, ANCOVA, t-tests and more.

#permutation #randomization #ANOVA #rstats #r #pvalues #ancova #ttest

https://jaromilfrossard.github.io/permuco/index.html

Permutation Tests for Regression, (Repeated Measures) ANOVA/ANCOVA and Comparison of Signals

Functions to compute p-values based on permutation tests. Regression, ANOVA and ANCOVA, omnibus F-tests, marginal unilateral and bilateral t-tests are available. Several methods to handle nuisance variables are implemented (Kherad-Pajouh, S., & Renaud, O. (2010) <doi:10.1016/j.csda.2010.02.015> ; Kherad-Pajouh, S., & Renaud, O. (2014) <doi:10.1007/s00362-014-0617-3> ; Winkler, A. M., Ridgway, G. R., Webster, M. A., Smith, S. M., & Nichols, T. E. (2014) <doi:10.1016/j.neuroimage.2014.01.060>). An extension for the comparison of signals issued from experimental conditions (e.g. EEG/ERP signals) is provided. Several corrections for multiple testing are possible, including the cluster-mass statistic (Maris, E., & Oostenveld, R. (2007) <doi:10.1016/j.jneumeth.2007.03.024>) and the threshold-free cluster enhancement (Smith, S. M., & Nichols, T. E. (2009) <doi:10.1016/j.neuroimage.2008.03.061>).

Correlation *is* causation!

- at least mathematically

Figuring Stuff Out - Dr Mircea Zloteanu

#statstab #424 Testing time: Carey-over effects and the (faulty) two-stage procedure

Thoughts: An interesting post by Stephen Senn on how some "solutions" in testing make matters worse.

#ttest #carryover #selection #history #design #methods

https://errorstatistics.com/2020/10/28/s-senn-testing-times-guest-post/

S. Senn: Testing Times (Guest post)

  Stephen Senn Consultant Statistician Edinburgh, Scotland Testing Times Screening for attention There has been much comment on Twitter and other social media about testing for coronavirus and…

Error Statistics Philosophy

#statstab #406 The t-test tool

Thoughts: "Stephen Senn describes the t-test, whose centenary he has celebrated in the previous article." @StephenSenn

#ttest #statistics #history #studentsttest #Gosset

https://rss.onlinelibrary.wiley.com/doi/full/10.1111/j.1740-9713.2008.00280.x

Anfang des 20. Jahrhunderts beginnt die Karriere des Statistiker William Sealy Gosset ganz alltagspraktisch in einer Brauerei: Bei Guinness erfindet er eine Methode, um Bier objektiv zu testen. Bis heute wird seine Methode angewendet.

#Bier #GeschichtenAusDerMathematik #Statistik #TTest #WilliamSealyGosset #ZurückZumThema

https://detektor.fm/gesellschaft/zurueck-zum-thema-bier-statistik?utm_campaign=share_on_mastodon&utm_medium=mastodon&utm_source=fediverse

Was hat Mathe mit Bier zu tun?

Auf den ersten Blick hat Mathe nicht viel mit Bier zu tun. Dabei begann die Karriere des Statistikers William Sealy Gosset bei Guinness.

detektor.fm

Anfang des 20. Jahrhunderts entwickelt der Brauereileiter und Statistiker William Sealy Gosset eine Methode, um das Bier der Guinness-Brauerei objektiv zu testen. Obwohl die Methode bis heute angewendet wird, kennt kaum jemand den Namen des Erfinders.

#Guinness #Mathematik #SpektrumDerWissenschaft #Statistik #Stichprobe #TTest #GeschichtenAusDerMathematik

https://detektor.fm/wissen/geschichten-aus-der-mathematik-statistik-aus-der-brauerei?utm_campaign=share_on_mastodon&utm_medium=mastodon&utm_source=fediverse

Wie Guinness die Statistik geprägt hat

Anfang des 20. Jahrhunderts erfindet der Statistiker William Sealy Gosset eine Methode, um das Bier der Guinness-Brauerei objektiv zu testen.

detektor.fm
Experience Statistics