#statstab #469 Significance tests, p-values, and falsificationism

Thoughts: An "interesting" thread of philosophy of science and debating.

#discussion #debate #pvalue #falsification #nhst

https://discourse.datamethods.org/t/significance-tests-p-values-and-falsificationism/

Significance tests, p-values, and falsificationism

This thread takes its inspiration from the recent discussions in social science and statistics about significance tests, what they’re good for, whether p-values should be banned, and what all of that has to do with general scientific methodology, particularly the Popperian one called falsificationism. See this Twitter thread for a random place to jump into the discussion. That place, however, was where @f2harrell suggested we create a thread over here. I’ll start this thread off, if I may, with...

Datamethods Discussion Forum

Время выполнения заданий в немодерируемых UX тестах: как измерить и проверить?

Всем привет! Меня зовут Ульяна Айкович и я исследователь БКС Мир Инвестиций. Сегодня я расскажу, как мы можем глубже анализировать время выполнения заданий, а также как измерить группы респондентов в немодерируемых UX тестах. В данной статье я разберу не только медиану и процентили для оценки времени, но и критерий Манна–Уитни — простой способ статистически сравнить две группы респондентов. Приятного прочтения и погружения в мир статистики! Перейти к статье

https://habr.com/ru/articles/970348/

#статистика_в_it #анализ_данных #визуализация_данных #статистический_тест #uxисследования #дизайн #проектирование_интерфейсов #количественные_методы #pvalue #опросы

Время выполнения заданий в немодерируемых UX тестах: как измерить и проверить?

Каждый исследователь на старте, когда впервые сталкивается со статистикой Всем привет! Меня зовут Ульяна Айкович и я исследователь БКС Мир Инвестиций. Сегодня я расскажу, как мы можем глубже...

Хабр

Всё, что вы хотели знать о t-тесте, но боялись спросить

Всем привет! Меня зовут Александр Щукин, я аналитик в СКБ «Контур». В этой статье я расскажу о базовых основах применения t‑критерия Стьюдента. Для начала предлагаю Вам поучаствовать в викторине: если вы уверенно ответите на все вопросы ниже, то будете освобождены от прочтения этой статьи:‑)

https://habr.com/ru/articles/969226/

#ttest #степени_свободы #центральная_предельная_теорема #проверка_гипотез #abтестирование #распределение_стьюдента #статистика #pvalue

Всё, что вы хотели знать о t-тесте, но боялись спросить

Всем привет! Меня зовут Александр Щукин, я аналитик в СКБ «Контур». В этой статье я расскажу о базовых основах применения t‑критерия Стьюдента. Для начала предлагаю Вам поучаствовать в...

Хабр

#statstab #429 A Vast Graveyard of Undead Theories: Publication Bias and Psychological Science’s Aversion to the Null

Thoughts: Ignoring null findings keeps bad theories alive.

#nulleffects #nhst #falsification #theory #critique #reproducibility #pvalue

https://journals.sagepub.com/doi/full/10.1177/1745691612459059

#statstab #423 Second-generation p-values: Improved rigor, reproducibility, & transparency in statistical analyses

Thoughts: I appreciated the thought behind sgpv but I've not seen them used anywhere.

#sgpv #pvalue #error #bias #inference

https://journals.plos.org/plosone/article?id=10.1371%2Fjournal.pone.0188299

Second-generation p-values: Improved rigor, reproducibility, & transparency in statistical analyses

Verifying that a statistically significant result is scientifically meaningful is not only good scientific practice, it is a natural way to control the Type I error rate. Here we introduce a novel extension of the p-value—a second-generation p-value (pδ)–that formally accounts for scientific relevance and leverages this natural Type I Error control. The approach relies on a pre-specified interval null hypothesis that represents the collection of effect sizes that are scientifically uninteresting or are practically null. The second-generation p-value is the proportion of data-supported hypotheses that are also null hypotheses. As such, second-generation p-values indicate when the data are compatible with null hypotheses (pδ = 1), or with alternative hypotheses (pδ = 0), or when the data are inconclusive (0 < pδ < 1). Moreover, second-generation p-values provide a proper scientific adjustment for multiple comparisons and reduce false discovery rates. This is an advance for environments rich in data, where traditional p-value adjustments are needlessly punitive. Second-generation p-values promote transparency, rigor and reproducibility of scientific results by a priori specifying which candidate hypotheses are practically meaningful and by providing a more reliable statistical summary of when the data are compatible with alternative or null hypotheses.

#statstab #413 Counternull Sets in Randomized Experiments

Thoughts: The counternull is a lost statistic, that is woefully underused when teaching stats.

#counternull #nhst #pvalue #effectsize #teaching #randomization #rosenthal

https://www.tandfonline.com/doi/pdf/10.1080/00031305.2024.2432884?download=true

#statstab #378 Selective Inference: The Silent Killer of Replicability

Thoughts: Benjamin overviews the replicability crisis, alternatives to p-values (and their issues), and suggests selective reporting is a large issue itself.

#replication #crisis #pvalue #nhst #selectivereporting #replicability #reproducibility

https://hdsr.mitpress.mit.edu/pub/l39rpgyc/release/3

Selective Inference: The Silent Killer of Replicability

Harvard Data Science Review
Experience Statistics

#statstab #363 p-checker The one-for-all p-value analyzer

Thoughts: Easy way to check for publication bias using some current tools.

#shiny #pvalue #phacking #QRPs #zcurve #bias #pcurve #rindex

https://shinyapps.org/apps/p-checker/

Experience Statistics

Experience Statistics