Mastodawn

📰 国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える (👍 48)

🇬🇧 Examines RakutenAI 3.0 controversy revealing it was based on DeepSeek V3, questioning viability of domestic LLM development
🇰🇷 RakutenAI 3.0이 DeepSeek V3 기반임이 밝혀진 논란을 통해 국산 LLM 개발 가능성 고찰

🔗 https://zenn.dev/jun1013/articles/e2e331dea0c616

#LLM #RakutenAI #Zenn

国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える

Zenn

Show thread

Zenn Trends 13h ago

📰 国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える (👍 41)

🇬🇧 RakutenAI 3.0 controversy: 700B MoE model claimed as Japan's largest LLM, but config revealed DeepSeek V3 base. Can Japan build its own?
🇰🇷 RakutenAI 3.0 논란: 7000억 파라미터 일본 최대 LLM이라 주장했으나 DeepSeek V3 기반으로 드러남. 일본이 자체 LLM을 만들 수 있을까?

🔗 https://zenn.dev/jun1013/articles/e2e331dea0c616

#LLM #RakutenAI #Zenn

国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える

Zenn

Show thread

Zenn Trends 19h ago

📰 国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える (👍 30)

🇬🇧 RakutenAI 3.0 controversy reveals it's based on DeepSeek V3. Examines whether Japan can truly create domestic LLMs or just fine-tune existing ones.
🇰🇷 RakutenAI 3.0가 DeepSeek V3 기반으로 드러난 논란. 일본의 독자 LLM 개발 가능성을 고찰.

🔗 https://zenn.dev/jun1013/articles/e2e331dea0c616

#LLM #RakutenAI #Zenn

国産LLMは作れるのか？ - RakutenAI 3.0の炎上から考える

Zenn

sayzard Mar 19

Aratako (@Aratako_LM)

AWM 논문 기반 분석으로 RakutenAI 3.0이 DeepSeek V3에서 스크래치로 새로 학습된 모델인지 검토했으며, 결과적으로 추가 학습에 가까운 것으로 보인다는 내용이다. 또한 DeepSeek-V3와 RakutenAI-3.0, Meta-Llama-3-8B와 Tanuki-8B-dpo-v1.0의 아키텍처 및 학습 방식 비교가 포함된다.

https://x.com/Aratako_LM/status/2034564701150195858

#llm #deepseek #rakutenai #metallama #training

Aratako (@Aratako_LM) on X

AWMという論文（https://t.co/Y2YECKmOZv）の手法をベースにRakutenAI 3.0がDeepSeek V3由来かどうかを調べてみましたが、スクラッチ学習ではなく追加学習っぽいですね 1枚目：DeepSeek-V3 vs RakutenAI-3.0 2枚目：Meta-Llama-3-8B vs Tanuki-8B-dpo-v1.0（同アーキテクチャで別途スクラッチ学習）

X (formerly Twitter)

sayzard Mar 19

AISatoshi (@AiXsatoshi)

RakutenAI 3.0이 DeepSeek V3의 LoRA 기반처럼 보인다는 의견과 함께, 프론티어 모델이 점점 클로즈드화되는 상황에서 국산 모델의 분발이 필요하다고 언급한다. 모델 구조와 개발 역량에 대한 시사점이 있는 내용이다.

https://x.com/AiXsatoshi/status/2034765230807687198

#rakutenai #deepseek #lora #llm #opensource

AI✖️Satoshi⏩️ (@AiXsatoshi) on X

RakutenAI 3.0は、DeepSeek V3のLoRA スクラッチ〜開発できる体制にはみえんねフロンティアモデルがクローズドになりつつあるから国産にも頑張ってもらいたい

X (formerly Twitter)

sayzard Mar 18

AISatoshi (@AiXsatoshi)

RakutenAI에 대한 소셜 코멘트: Deepseek 스타일 학습 노하우를 익히면 RakutenAI가 'kimi'와 유사한 아키텍처로 초기부터 LLM을 학습시켜 경쟁을 걸 수 있으며, 이번 결과가 만족스럽지 않아도 향후 일본 내 LLM 경쟁에서 우위를 점할 가능성이 있다는 전망. 일본어 지식 획득과 응용·일반화 강조.

https://x.com/AiXsatoshi/status/2034135794978570602

#rakutenai #llm #japan #aicompetition