金のニワトリ (@gosrum)
Qwen3-TTS의 UV 관리용으로 만든 pyproject.toml을 공유한다는 게시물입니다. flash-attn을 재컴파일해 설치하는 명령은 첨부 이미지 참조로 안내하며, 관련 GitHub 링크(robustonian 리포지토리)를 포함해 개발 환경 설정을 공유합니다.
金のニワトリ (@gosrum)
Qwen3-TTS의 UV 관리용으로 만든 pyproject.toml을 공유한다는 게시물입니다. flash-attn을 재컴파일해 설치하는 명령은 첨부 이미지 참조로 안내하며, 관련 GitHub 링크(robustonian 리포지토리)를 포함해 개발 환경 설정을 공유합니다.
金のニワトリ (@gosrum)
RTX5090에서 llama-bench로 GLM-4.7-flash의 추론 속도를 측정했더니, 의외로 flash-attn을 켜면 성능이 극도로 느려지는 현상이 확인되었다는 성능 이슈 보고입니다.
https://x.com/gosrum/status/2013415527675306048
#glm4.7flash #llamabench #rtx5090 #flashattn