Perplexity、検閲のない公正なDeepSeek「R1 1776」を公開

出典:Open-sourcing R1 1776

AI企業のPerplexityは、大規模言語モデル「DeepSeek R1」の新バージョン「R1 1776」をオープンソース化したと発表しました。

従来のR1は強力な推論能力を持ちながらも、一部の話題に対する回答を拒否する制限がありましたが、今回のモデルは「検閲のない」「事実に基づいた」情報提供を実現するためにポストトレーニングが施されています。

Perplexityは、R1 1776のオープンソース化により、より公正で偏りのない情報を提供することを目指しています。同モデルはHuggingFaceのリポジトリでダウンロード可能で、Sonar API経由での利用も可能です。

従来のDeepSeek R1は、中国共産党(CCP)の検閲により、特定の話題についての回答を制限されていました。

例えば、台湾の独立がNVIDIAの株価に与える影響を問う質問に対し、R1は「台湾は古くから中国の一部であり、独立という問題は存在しない」といったCCPの公式見解に沿った回答をしていました。

一方、R1 1776では、より中立的で事実に基づいた回答が可能となり、例えば「台湾の独立は地政学的および経済的な影響を引き起こし、NVIDIAの株価にも影響を与える可能性がある」といった分析が提供されます。

ポストトレーニングの過程では、約300の検閲対象トピックを特定し、多言語対応の検閲分類器を開発しました。

その上で、4万件以上のプロンプトを収集し、個人情報を排除したデータセットを作成。NvidiaのNeMo 2.0フレームワークを活用し、モデルを再訓練することで、検閲を解除しながら高い精度を維持することに成功しました。

性能評価では、1000以上の多言語データセットを用いて、検閲がどの程度回避されているかを測定しました。

また、数学や推論能力のベンチマークテストも実施され、その結果、R1 1776は従来のR1と同等の性能を維持していることが確認されました。

出典:Open-sourcing R1 1776

Perplexityは「正確で公正な情報を提供することがAIの役割であり、検閲のない環境で利用されるべきだ」と述べており、今後も公平な情報提供を目指したモデル開発を続ける方針です。


出典:Open-sourcing R1 1776

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!
目次