NVIDIA (@nvidia)
Snap์ ์์ง๋์ด๋ง ํ๋ซํผ ์ฑ ์์๊ฐ ๊ฑฐ์ 10์ต ์ฌ์ฉ์ ๊ท๋ชจ์ A/B ํ ์คํธ๋ฅผ ์ด์ํ๊ธฐ ์ํด, ํ๋ฃจ 10PB ์ด์์ ๋ฐ์ดํฐ ์ฒ๋ฆฌ ํ์ดํ๋ผ์ธ์ GPU ๊ฐ์ ๋ฐฉ์์ผ๋ก Google Cloud๋ก ๋ง์ด๊ทธ๋ ์ด์ ํ ์ฌ๋ก๋ฅผ ์๊ฐํ๋ค. ์ด๋ฅผ ํตํด ์์ ๋น์ฉ์ 76% ์ ๊ฐํ๋ค๋ ์ ์ด ํต์ฌ์ด๋ค.

What does it actually take to run A/B testing at nearly a billion-user scale? Prudhvi Vatala, Head of Engineering Platforms at @Snap, explains how his team migrated 10+ petabytes of daily data processing to GPU-accelerated pipelines on @GoogleCloud โ cutting job costs by 76% and
A/B testing helps you stop guessing and start improving what matters: conversions. Learn how to compare page variations, optimize website performance, and turn more traffic into leads.
Read the full guide:
https://www.outsourcing-eg.com/ab-testing-guide/
#ABTesting #ConversionOptimization #CRO #WebsitePerformance #LandingPages #DigitalMarketing #5DOutsourcing
Show HN: I built CRO analysis tool that finds conversion issues
์ด ๋๊ตฌ๋ AI๋ฅผ ํ์ฉํด ์น์ฌ์ดํธ์ ์ ํ์จ ๋ฌธ์ ๋ฅผ ๋ถ์ํ๊ณ , A/B ํ ์คํธ ์ ์, ์์ธก ํํธ๋งต, ์ฑ๋ฅ ๋ฐ์ดํฐ๋ฅผ ์ ๊ณตํ์ฌ ์ ํ์จ ๊ฐ์ ์ ์ค์ง์ ์ธ ์ธ์ฌ์ดํธ๋ฅผ ์ ๊ณตํฉ๋๋ค. ์ฌ์ฉ์๋ ํ์ด์ง ์ ํ, ์ ํ ๋ชฉํ, ํธ๋ํฝ ์์ค, ๋์ ๊ณ ๊ฐ ๋ฑ์ ์ ํํด ๋ง์ถคํ ๋ถ์์ ๋ฐ์ ์ ์์ผ๋ฉฐ, ๋ฐ์คํฌํฑ๊ณผ ๋ชจ๋ฐ์ผ ํ๊ฒฝ ๋ชจ๋ ์ง์ํฉ๋๋ค. ๋ฌด๋ฃ๋ก ์ ๊ณต๋์ด CRO(์ ํ์จ ์ต์ ํ) ์์ ์ ์ฆ์ ํ์ฉ ๊ฐ๋ฅํ๋ค๋ ์ ์์ ์ค๋ฌด์ ์ ์ฉํฉ๋๋ค.
#cro #conversionrateoptimization #aianalysis #abtesting #heatmaps
Show HN: I built a playground of interative A/B testing for RAG
RAG ์ฑ๋ฅ์ ๋ฐ๋ณต์ ์ผ๋ก ๊ฐ์ ํ๊ธฐ ์ํด AI ์์ง๋์ด์ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ ๊ฐ ํ์ ์ ์ํํ๊ฒ ํ๋ ์ธํฐ๋ํฐ๋ธ A/B ํ ์คํธ ํ๋ ์ด๊ทธ๋ผ์ด๋๋ฅผ ๊ฐ๋ฐํ๋ค. ์ด ๋๊ตฌ๋ RAG ์คํ๊ณผ ํ๊ฐ ๊ฒฐ๊ณผ๋ฅผ ๋น ๋ฅด๊ฒ ์ ๊ณตํ๋ฉฐ, ๊ธฐ์ ์์ ๋น๊ธฐ์ ์ ๋ชจ๋ ์ดํดํ ์ ์๋ ์ธ์ฌ์ดํธ๋ฅผ ์์ฑํ๋ค. ๋ํ ๋๋ฉ์ธ ์ ๋ฌธ๊ฐ๊ฐ ํ๋๊ทธ๋ ํญ๋ชฉ์ ์ฝ๊ฒ ๊ฒํ ํ๊ณ ์ ๋ฐ์ดํธํ ์ ์๋ UI๋ฅผ ์ ๊ณตํด RAG ๊ฐ์ ์์ ์ ํจ์จ์ฑ์ ๋์ธ๋ค.
A/B Testing for Alien Life
์ด ๋
ผ๋ฌธ์ ์ธ๊ณ ์๋ช
์ฒด ํ์์์ ๋ฐ์ํ๋ ์ธ์๋ก ์ ์ฅ๋ฒฝ, ํนํ ๊ฑฐ์ง ์์ฑ ๋ฌธ์ ๋ฅผ ๋ค๋ฃฌ๋ค. ์ ์๋ ํ์ฐ์ (๋น์ ๋ณด์ ) ์ฌ์ ํ๋ฅ ์ ์ฌ์ฉํ๋ ๊ธฐ์กด ๋ฐฉ๋ฒ์ด ์๋ช
์ฒด ํ์ง์ ๋งค์ฐ ๋น๊ด์ ์ธ ๊ฒฐ๊ณผ๋ฅผ ์ด๋ํจ์ ๋ณด์ด๋ฉฐ, ์ด๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํ ์๋ก์ด ๋ฐฉ๋ฒ์ผ๋ก ๋ ๊ทธ๋ฃน์ ๋๋์ด AB ํ
์คํธ๋ฅผ ์ํํ๋ ์ ๋ต์ ์ ์ํ๋ค. ์ด ๋ฐฉ๋ฒ์ ์๋ช
์ฒด ์กด์ฌ์จ์ด ๋ค๋ฅธ ๋ ๊ทธ๋ฃน์ ๋น๊ตํ๋ฉด์ ๊ณตํต๋ ํผ๋ ๋ณ์์จ์ ์ ์งํ์ฌ, ์๋์ ์ผ๋ก ์ ์ ํ๋ณธ ์๋ก๋ ๊ฐ๋ ฅํ ์๋ช
์ฒด ํ์ง ์ฆ๊ฑฐ๋ฅผ ์ป์ ์ ์์์ ์์ฌํ๋ค. ๋ค๋ง, ์ด AB ํ
์คํธ ๋ฐฉ์์ ์ค๊ณ์ ๋
ํนํ ๋์ ๊ณผ์ ๋ฅผ ๋๋ฐํ๋ค.
https://arxiv.org/abs/2605.02969
#astrobiology #bayesianstatistics #abtesting #lifedetection #epistemology

Planned and ongoing searches for life, both biological and technological, confront an epistemic barrier concerning false positives - namely, that we don't know what we don't know. The most defensible and agnostic approach is to adopt diffuse (uninformative) priors, not only for the prevalence of life, but also for the prevalence of confounders. We evaluate the resulting Bayes factors between the null and life hypotheses for an idealized experiment with $N_{pos}$ positive labels (biosignature detections) among $N_{tot}$ targets with various priors. Using diffuse priors, the consequences are catastrophic for life detection, requiring at least ${\sim}10^4$ (for some priors ${\sim}10^{13}$) surveyed targets to ever obtain "strong evidence" for life. Accordingly, an HWO-scale survey with $N_{tot}{\sim}25$ would have no prospect of achieving this goal. A previously suggested workaround is to forgo the agnostic confounder prior, by asserting some upper limit on it for example, but we find that the results can be highly sensitive to this choice - as well as difficult to justify. Instead, we suggest a novel solution that retains agnosticism: by dividing the sample into two groups for which the prevalence of life differs, but the confounder rate is global. We show that a $N_{tot}=24$ survey could expect 24% of possible outcomes to produce strong life detections with this strategy, rising to $\geq50$% for $N_{tot}\geq76$. However, AB-testing introduces its own unique challenges to survey design, requiring two groups with differing life prevalence rates (ideally greatly so) but a global confounder rate.
A/B testing splits traffic, showing half your visitors version A, half version B. ๐งช
This simple mechanism avoids common beginner mistakes by isolating variables and measuring impact.
Ryan J. Shaw (@RyanJamesShaw)
Claude Code๊ฐ ๊ฐ๊ฒฉ ํ์ด์ง์ 2% A/B ํ ์คํธ์ ์ค์ ์ ๊ณต ๋ฒ์๊ฐ ๋ฌ๋ผ ๋ณด์ธ๋ค๋ ๋ ผ์์ ๋ค๋ฃจ๋ ํธ์์ ๋๋ค. ์ฌ์ฉ์๊ฐ ์ฝ๊ด์ ํฌํจ๋์ง ์์ ๊ธฐ๋ฅ์ ๋ฐ์์ ๋ ๋ฒ์ /๊ณ์ฝ์ ์๋ฏธ๊ฐ ๋ฌด์์ธ์ง ๋ฌธ์ ์ ๊ธฐํ๋ฉฐ, Claude Code์ ๋ ธ์ถ ๋ฐฉ์๊ณผ ๊ฐ๊ฒฉ ์ ์ฑ ํผ์ ์ ์ง์ ํฉ๋๋ค.

@simonw @TheAmolAvasare And if the latter what does it even mean? If I hit the 2% and donโt get Claude Code on the pricing page but I get Claude Code anyway (โitโs just an A/B test broโ), am I entitled to Code given that it wasnโt included in the offer I accepted? You canโt A/B test a different legal