金のニワトリ (@gosrum)

Qwen3-TTS의 UV 관리용으로 만든 pyproject.toml을 공유한다는 게시물입니다. flash-attn을 재컴파일해 설치하는 명령은 첨부 이미지 참조로 안내하며, 관련 GitHub 링크(robustonian 리포지토리)를 포함해 개발 환경 설정을 공유합니다.

https://x.com/gosrum/status/2014473888626004206

#qwen3tts #flashattn #pyproject #github

金のニワトリ (@gosrum) on X

Qwen3-TTSのuv管理用に作ったpyproject.tomlを共有します flash-attnを再コンパイルしてインストールするコマンドは添付画像参照 https://t.co/i0n2dejRyn

X (formerly Twitter)

金のニワトリ (@gosrum)

RTX5090에서 llama-bench로 GLM-4.7-flash의 추론 속도를 측정했더니, 의외로 flash-attn을 켜면 성능이 극도로 느려지는 현상이 확인되었다는 성능 이슈 보고입니다.

https://x.com/gosrum/status/2013415527675306048

#glm4.7flash #llamabench #rtx5090 #flashattn

金のニワトリ (@gosrum) on X

GLM-4.7-flashの推論速度をllama-benchで測定 @ RTX5090 なぜかflash-attnをonにするとめちゃくちゃ遅くなることが判明

X (formerly Twitter)