Иллюзия 95%: гайд по самой частой элементарной ошибке в Data Science

Что, если я скажу тебе, что у параметра нет вероятности? Это самая распространенная и устойчивая когнитивная ошибка в Data Science. Она встречается в курсовых, в учебниках и даже в документациях библиотек. Здесь мы напишем симуляцию на Python, увидим, как «прыгают» интервалы, поймем, как тут могут помочь пластмассовые игрушки советских детей, и узнаем, как же тогда математически точно отвечать менеджерам на их вопросы, чтобы они навсегда перестали с вами разговаривать. Добро пожаловать в кроличью нору частотной статистики.

https://habr.com/ru/articles/974186/

#статистика #доверительный_интервал #математическая_статистика #анализ_данных #теория_вероятностей #python #визуализация_данных #ab_тестирование #ошибки_мышления #статистическая_значимость

Иллюзия 95%: гайд по самой частой элементарной ошибке в Data Science

Представьте классическую ситуацию. Вы — аналитик. Вы только что провели A/B-тест или оценили средний чек. Ваш скрипт на Python выдал результат: 95% Confidence Interval: [100, 120] . Вы приходите к...

Хабр

Вероятностные методы в биржевой торговле

Современная биржевая торговля эволюционировала от интуитивных решений к строгим математическим моделям. В эпоху доминирования алгоритмических систем глубокое понимание стохастических основ рыночной динамики становится критически важным конкурентным преимуществом. На протяжении пяти лет мы исследуем применение сложных вероятностных моделей для анализа, прогнозирования финансовых инструментов и готов представить наиболее значимые аспекты этой методологии. Финансовые площадки функционируют как сложные адаптивные механизмы, где множество участников действуют в условиях фундаментальной неопределенности. Математический аппарат теории вероятностей позволяет формализовать эту неопределенность и создавать аналитические конструкции, способные выявлять скрытые паттерны в хаотичных ценовых колебаниях.

https://habr.com/ru/articles/957232/

#теория_вероятностей #математическое_моделирование #математическая_статистика #крипта #биткойн #алготрейдинг #трейдинг #рискменеджмент #криптовалюта

Вероятностные методы в биржевой торговле

Современная биржевая торговля эволюционировала от интуитивных решений к строгим математическим моделям. В эпоху доминирования алгоритмических систем глубокое понимание стохастических основ рыночной...

Хабр

Простой кейс, про простой A/B-тест, чтобы брать и пользоваться (чутка математики + код)

Без воды и лишней теории (хотя я так не считаю, что она лишняя), на примере конкретного кейса разберем, как быстро и без боли запустить A/B-тест через Яндекс.Метрику и куки. Прочитать и пойти всех оттестировать...

https://habr.com/ru/articles/928562/

#абтесты #abтестирование #abtest #abtesting #abtests #абтестирование #абтест #математическая_статистика #js #javascript

Простой кейс, про простой A/B-тест, чтобы брать и пользоваться (чутка математики + код)

Про A/B-тесты уже не просто слышали, их вам, скорее всего, успели прописать как панацею от всех маркетинговых бед. В каждом втором блоге, на каждом третьем вебинаре и в каждом первом чек-листе:...

Хабр

Применение языка Python в инженерной практике. Точность измерений и вычислений. Погрешности и неопределённости

В предыдущем туториале "Единицы измерения физических величин" было сказано, что результат любых инженерных измерений и расчётов не имеет никакого смысла, если не указаны две его основные характеристики: единица измерения и точность . Как использовать единицы измерения при вычислениях на Питоне мы уже обсудили - теперь перейдём к точности и связанным ней понятиям погрешности и неопределённости Погрешность измерения — это отклонение измеренного значения величины от её истинного (действительного) значения. Погрешность измерения является характеристикой точности измерения. Выяснить с абсолютной точностью истинное значение измеряемой величины, как правило, невозможно, поэтому невозможно и указать величину отклонения измеренного значения от истинного. Это отклонение принято называть ошибкой измерения . Возможно лишь оценить величину этого отклонения, например, при помощи статистических методов. На практике вместо истинного значения используют действительное значение величины , то есть значение физической величины, полученное экспериментальным путём и настолько близкое к истинному значению, что в поставленной измерительной задаче может быть использовано вместо него. Такое значение обычно вычисляется как среднестатистическое значение, полученное при статистической обработке результатов серии измерений. Это полученное значение не является точным, а лишь наиболее вероятным. Поэтому при записи результатов измерений необходимо указывать их точность . Например, запись означает, что истинное значение величины лежит в интервале от 2.7 s до 2.9 s с доверительной вероятностью 95%. Количественная оценка величины погрешности измерения — мера сомнения в измеряемой величине — приводит к такому понятию, как неопределённость измерения. Синонимом термина "погрешность измерения" (англ. measurement error ) является "неопределённость измерения" (англ. measurement uncertainty ). Таким образом мы плавно и ненавязчиво подошли к названию модуля языка Питон, которому посвящён настоящий туториал - uncertainties (неопределённости).

https://habr.com/ru/articles/927224/

#погрешность #неопределённость #стандартное_отклонение #математическая_статистика

Применение языка Python в инженерной практике. Точность измерений и вычислений. Погрешности и неопределённости

Обзор модуля Uncertainties. Введение В предыдущем туториале Применение языка Python в инженерной практике. Обзор модуля Pint / Хабр было сказано, что результат любых инженерных измерений и расчётов не...

Хабр

Узнаём какое аниме будет самым рейтинговым еще до выхода

Когда встал вопрос "о чем писать диплом", я точно знала, что не хочу писать о чем-то скучном или не интересным для меня. Было много идеи (не только про аниме) и даже в сфере аниме - не только про задачу прогнозирования. Когда уже надо было утверждать тему, на одной из лекции как раз рассказывали про задачи классификации и прогнозирования. Я знала, что уже есть вагон и маленькая тележка статей про прогнозирование в области фильмов, но в аниме? Критически мало. И я решила это исправить)

https://habr.com/ru/articles/898856/

#андроид_приложения #математическое_моделирование #математическая_статистика #mlp #аниме #прогнозирование #манга #нейронные_сети

Узнаём какое аниме будет самым рейтинговым еще до выхода

Когда встал вопрос "о чем писать диплом", я точно знала, что не хочу писать о чем-то скучном или неинтересным для меня. Было много идеи (не только про аниме) и даже в сфере аниме - не только про...

Хабр

[Перевод] Как Джон Нэш изменил теорию игр и вдохновил экономику, биологию и технологии

Джон Нэш, гений, чьи идеи перевернули математику и экономику, стал символом новой эры анализа взаимодействий. От знаменитого равновесия Нэша до эволюционных стратегий в биологии — его концепции продолжают находить применение в бизнесе, политике, ИИ и даже соцсетях. Узнайте, как работы Нэша вдохновили развитие науки и технологий, и почему его наследие остаётся актуальным и сегодня.

https://habr.com/ru/articles/872090/

#теория_игр #экономика #нобелевка #искусственный_интеллект #математическая_статистика #алгоритмы #равновесие #эволюционная_биология #история #обзор

Как Джон Нэш изменил теорию игр и вдохновил экономику, биологию и технологии

Документ, лежащий в основе статьи, представляет собой стенограмму семинара, посвящённого вкладу Джона Нэша в теорию игр. Основные участники — выдающиеся учёные в области математики, экономики и...

Хабр

Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Метод CUPED уже давно завоевал популярность в анализе A/B-тестов, предоставляя возможность выявлять эффекты меньших размеров. В этой статье мы подробно рассмотрим применение данного подхода на этапе дизайна эксперимента. Мы исследуем, как можно сократить размеры выборок, не теряя при этом в статистической мощности теста.

https://habr.com/ru/articles/860050/

#проверка_гипотез #анализ_данных #аналитика #математическая_статистика #ab_testing #a/b_test #a/bтестирование

Размер имеет значение: как исторические данные помогают на этапе дизайна A/B-теста

Я не знал с чего начать статью, поэтому попросил ChatGPT сгенерировать анекдот: Продуктовый аналитик говорит менеджеру: «Если не рассчитаем размер выборки перед экспериментом, это...

Хабр

[Перевод] Точность спортивных прогнозов на основе коэффициентов ставок

Существует множество эмпирических свидетельств того, что коэффициенты ставок являются наиболее точным общедоступным источником прогнозов вероятности в спорте. С ростом онлайн-ставок, коэффициенты ставок стали легко доступны для все большего числа и разнообразия спортивных соревнований. Разберём на примерах баскетбола, гандбола, хоккея с шайбой, футбола и волейбола как использовать коэффициенты букмекеров в стратегиях ставок и в качестве переменных в статистических моделях: (а) Какой метод следует использовать для определения вероятностных прогнозов на основе необработанных коэффициентов ставок? (b) Имеет ли значение, какую букмекерскую контору или биржу ставок мы выберем, если доступны две или более?

https://habr.com/ru/articles/836286/

#математика #python #букме #ставки_на_спорт #статистический_анализ #анализ_данных #математическая_статистика #математическое_моделирование #математическая_модель

Точность спортивных прогнозов на основе коэффициентов ставок

Предисловие В продолжении "Оценки инсайда в ставках на спорт" , раскроем что вероятности, определенные на основе коэффициентов букмекеров с использованием модели Shin'а, являются более точными...

Хабр

Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез

Одной из самых распространённых задач современной аналитики является формирование суждений о большой совокупности (например, о миллионах пользователей приложения), опираясь на данные лишь о небольшой части этой совокупности - выборке. Можно ли сделать вывод о миллионной аудитории крупного мобильного приложения, собрав данные об использовании лишь для 100 пользователей? Или стоит собрать данные для 1000 пользователей? Ответ интуитивно прост и понятен: чем больше данных есть в наличии, тем более точными будут прогнозируемые результаты для всей совокупности. Какую вероятность ошибиться при анализе мы можем допустить: 5% или 1%? Относятся ли две выборки к одной совокупности, или между ними есть ощутимая значимая разница и они относятся к разным совокупностям? Точность прогноза и вероятность ошибки при ответе на эти и другие вопросы поддаются вполне конкретным расчётам и могут корректироваться в зависимости от потребностей продукта и бизнеса на этапе планирования и подготовки эксперимента. Рассмотрим подробнее, как параметры эксперимента и статистические критерии оказывают влияние на результаты анализа и выводы обо всей совокупности, а для этого смоделируем тысячу A/A , A/B и A/B/C/D тестов .

https://habr.com/ru/articles/807051/

#математика #математическая_статистика #анализ_данных #статистический_анализ #ab_тесты #statsmodels #scipy #python #matplotlib #проверка_гипотез

Индуктивная статистика: доверительные интервалы, предельные ошибки, размер выборки и проверка гипотез

Одной из самых распространённых задач современной аналитики является формирование суждений о большой совокупности (например, о миллионах пользователей приложения), опираясь на данные лишь о небольшой...

Хабр

Основные типы распределений вероятностей в примерах

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения на сайте, нажатий на целевые кнопки, покупок товаров является обычным и необходимым явлением. Любые изменения в пользовательском опыте на сайте компании (внешний вид, структура, контент) приводят к изменениям в работе пользователя и, как результат, изменения наблюдаются в собираемых данных. Важным элементом анализа изменений данных и его фундаментом является использование основных типов распределений случайных величин, от понимания которых напрямую зависит качество оценки значимости наблюдаемого изменения. Рассмотрим их подробнее на наглядных примерах.

https://habr.com/ru/articles/801101/

#математика #математическая_статистика #теория_вероятностей #плотность_вероятности #распределения_вероятностей #анализ_данных #статистический_анализ #python #matplotlib

Основные типы распределений вероятностей в примерах

Статистические исследования и эксперименты являются краеугольным камнем развития любой компании. Особенно это касается интернет-проектов, где учёт количества пользователей в день, времени нахождения...

Хабр