Derya Unutmaz, MD (@DeryaTR_)
BioAI 모델과 생물의학 데이터 규모에 대한 코멘트. GI 내시경 데이터만 해도 토큰 기준 27TB에 이르며, 향후 BioAI 파운데이션 모델을 페타바이트급 데이터로 학습하려면 훨씬 더 많은 컴퓨트가 필요하다는 점을 강조한다.

Derya Unutmaz, MD (@DeryaTR_) on X
This is a great BioAI model! It also demonstrates how vast biological data is: 27 terabytes of tokens just for GI endoscopy data! Eventually, we will need to train BioAI foundation models with petabytes of data, thus we need much more compute! This will save so many lives!







