Anthropicが、最新の言語モデルであるClaude 3ファミリーの発表を機に、人工知能の可能性と責任ある開発についての考えを表明しました。本記事では、その記事を和訳して読み解説を行いながらChatGPTと何が違うのかについても書いていきたいと思います。
Claudeとは?
まず、記事を読む前に、Claudeについてご紹介します。ClaudeとはAnthropic社が開発した大規模言語モデルです。
Claude3として3つのモデルのリリースを発表
様々な認知タスクにおいて新たな業界基準を設けるClaude 3モデルファミリーを発表します。このファミリーには、能力順に並んだ3つの最先端モデル、Claude 3 Haiku、Claude 3 Sonnet、Claude 3 Opusが含まれています。それぞれの次のモデルが、より高い能力を発揮し、ユーザーは特定の用途に合わせて、知能、速度、コストのバランスを最適化できます。
知能レベル
最も知能の高いOpusは、AI システムの一般的な評価ベンチマーク、学士レベルの専門知識(MMLU)、大学院レベルの専門的な推論(GPQA)、基本的な数学(GSM8K)など、ほとんどのベンチマークで同種のモデルを上回る性能を発揮します。複雑なタスクにおいて、ほぼ人間レベルの理解力と流暢さを示し、一般知能の最先端を行くモデルです。
また、その他のすべてのClaude 3モデルで、分析と予測、ニュアンスに富んだコンテンツ作成、コード生成、スペイン語、日本語、フランス語などの非英語での対話能力も向上しています。
レスポンス速度
Claude 3モデルは、即時の応答が求められるライブチャット、自動補完、データ抽出タスクなどに利用できます。特に、Haikuは最速で最もコスト効率が良いモデルです。arXiv上の情報と密度の高い研究論文(約1万トークン、チャートやグラフ付き)を3秒以内で読むことができます。リリース後も、さらなる性能向上を見込んでいます。
ほとんどのワークロードにおいて、SonnetはClaude 2や2.1の2倍の速度で、より高い知能を発揮します。知識検索や営業自動化などの即応性を要するタスクに適しています。OpusはClaude 2やClaude 2.1と同等の速度ですが、遥かに高い知能レベルを持っています。
視覚認識能力
Claude 3モデルは、他の主要モデルと同等の優れた視覚認識能力を備えています。写真、図表、グラフ、技術図面など、様々な視覚フォーマットを処理できます。PDFや資料、プレゼンスライドなど、さまざまなフォーマットに対応できるようになっています。
答えられない質問の減少
以前のClaudeモデルは、文脈の理解が不十分だったことを示すような、不必要な拒否応答を行うことがありました。この点では大幅な進歩があり、OpusやSonnet、Haikuは、下の図のように、Claude 3モデルは要求を適切に理解し、実害を認識し、無害な質問に対して拒否する頻度が格段に下がっています。
正確性の向上
複雑で事実に基づく質問の大規模セットを使って評価したところ、他モデルで問題視された既知の弱点に対して、有意な精度向上が見られました。Opusは、Claude 2.1に比べて、正解数が2倍に改善したほか、不正解(ハルシネーション)も減少しています。
さらに信頼できる出力を提供すべく、近く参照資料の特定の文章を引用して回答を裏付ける機能も導入予定です。
Claude2から向上した点
- 強化された倫理性と安全性 Claude 3には、自身の出力を常に監視し、有害なコンテンツを生成しないよう自己制御する機能が組み込まれています。ヘイトスピーチや児童虐待コンテンツなどの非倫理的なコンテンツを自動で検知し、出力を遮断する仕組みが備わっています。
- 高度な自然言語処理能力 Claude 3は優れた自然言語理解と生成能力を持ち、ユーザーとの自然な対話を通じた問題解決やタスク遂行が可能です。幅広い分野の知識を活用しながら、知的で建設的な対話ができます。
- 多様な分野への対応力
科学、テクノロジー、ビジネス、クリエイティブ活動など、様々な領域の知識をカバーしています。マルチタスク対応が可能なので、文書作成、データ解析、コーディングなど、さまざまな用途で役立てられます。 - 倫理的行動の追求 Anthropicは、AIが人間の価値観や倫理観を反映した望ましい振る舞いをすることを重視しています。Claude 3はその理念に基づき開発され、倫理性と有用性を両立することを目指しています。
ChatGPTとの違い
ChatGPTと比較する場合、以下の点が違いとなります。
- 倫理性と安全性への取り組み Anthropicは設立時からAIの倫理性と安全性を最重要課題と位置付けており、Claude 3はその理念の下に開発されています。出力の自己監視や有害コンテンツの遮断など、倫理面での強化が大きな特徴です。一方のChatGPTは、開発の初期段階から倫理的側面への配慮は不明確でした。
- 対話とタスク実行能力
Claude 3は高度な自然言語処理能力を備え、ユーザーとの自然な対話を通じた問題解決が可能です。一方のChatGPTは文章生成は優れていますが、双方向の対話やタスク実行能力は未知数です。 - 扱える分野の広さ Claude 3は科学、テクノロジー、ビジネス、創作活動など、幅広い知識領域をカバーし、様々な用途に対応できます。一方のChatGPTはどの程度の知識ドメインを包含しているかは不明です。
- 継続的な学習能力 Claude 3は継続的な学習を前提に設計されており、新しい情報や知識を取り入れて更新できる余地があります。ChatGPTは固定された知識ベースなので、更新が難しい可能性があります。
- 運用コストとスケーラビリティ Claude 3は企業によって開発されたAIなので、コストとスケーラビリティの面で優れている可能性があります。一方のChatGPTは個人の研究者によって開発され、大規模運用への対応は不明です。
このように、倫理性と安全性、対話能力、知識の広さ、学習能力、運用性などの点で、Claude 3にはChatGPTにはない特長があります。ただし、実際の機能については不明な点も多く、今後の動向を注視する必要がありそうです。
乗り換えは妥当か?
ChatGPTのサブスクリプションを契約しておりますが、月の価格は同じなので倫理性と安全性への取り組みの面を見てみるとこちらに乗り換えるのはありかなと思っています。少しの間両方とも契約して同じ質問を行って返答のいい方を残したいと思っています。進展あれば記事を追記いたします。
コメント