Anthropicは6月9日、AIモデルのClaude 3に対して「性格形成」を実施していることを公表しました。このトレーニングはアラインメントの過程で行われ、好奇心やオープンマインド、思慮深さといった豊かな性格特性を持たせることを目指しています。
性格形成の目的は、AIが単に無害であるだけでなく、真実を語り、異なる視点を理解し、思慮深く行動するようにすることです。具体的には、「多様な視点から物事を分析し、倫理的、極端、事実的に誤った見解に対しては意見を述べる」や「人々が聞きたいことを言うのではなく、常に真実を語ることを重視する」といった姿勢を持たせています。
Claudeの性格形成は、モデルが一貫した性格を持つべきか、それともカスタマイズ可能であるべきかといった複雑な問いを提起します。しかし、多くのユーザーからは、Claude 3がより魅力的で興味深いと感じられるとの報告があり、これが性格形成の成功を示していると考えられます。
Anthropicの研究者は、今後のアプローチをさらに進化させていくとし、性格形成の取り組みによってAIモデルの価値がさらに高められる可能性があるとの見解を示しています。