
サイバーエージェントは1月27日、中国のスタートアップDeepSeekが開発した大規模言語モデル(LLM)「DeepSeek-R1」の日本語追加学習モデルを無償で公開しました。
【モデル公開のお知らせ】
— サイバーエージェント 広報&IR (@CyberAgent_PR) January 27, 2025
DeepSeek-R1-Distill-Qwen-14B/32Bをベースに日本語データで追加学習を行ったLLMを公開いたしました。今後もモデル公開や産学連携を通じて国内の自然言語処理技術の発展に貢献してまいります。 https://t.co/Oi0l2ITzhh
このモデルは、「DeepSeek-R1-Distill-Qwen-14B/32B」をベースに日本語能力を強化したもので、Hugging Face上で公開されています。

DeepSeek-R1は、一部の分野において米OpenAIの言語モデルに匹敵する性能を持つとされ、無料で利用できる高性能なAIモデルとして世界中の開発者から注目を集めています。
あわせて読みたい


中国発「DeepSeek-R1」、OpenAIに匹敵するAIモデルが商用利用可能で登場
中国のAIラボ「DeepSeek」は、新しい推論型AIモデル「DeepSeek-R1」を発表しました。
このモデルは、OpenAIの「o1」と同等の性能を持ち、MITライセンスのもとで提供されるため、商用利用や再配布が自由に行えます。
R1は、最先端の技術を活用した大規模AIモデルで、物理学、科学、数学などの分野で高い信頼性を示しています。
今回公開された日本語版は、MITライセンスの下で提供され、商用利用も可能となっています。
今回の日本語版の公開により、日本の開発者やビジネス利用者が、高性能な言語モデルをより容易に活用できるようになることが期待されます。
サイバーエージェントは以前にも、MetaのLlama 3.1の日本語追加学習モデルを公開するなど、AIモデルの日本語対応を積極的に進めています。
このような取り組みは、日本におけるAI技術の普及と発展に大きく寄与すると期待されています。