PR

Phi-3: マイクロソフトが提案する次世代の小型言語モデル

AI/MachineLearning

マイクロソフトは、オープンAIモデルの新しいファミリーであるPhi-3を発表しました。Phi-3モデルは、現在利用可能な小型言語モデル(SLM)の中で最も高性能かつコスト効率の高いモデルであり、言語、推論、コーディング、数学のベンチマークにおいて、同じサイズや1つ上のサイズのモデルを上回るパフォーマンスを示しています。この発表により、顧客は高品質なモデルをより多く選択できるようになり、生成AI応用を構築する際により実用的な選択肢が提供されます。

スポンサーリンク

Phi-3-miniの特徴と利用可能なプラットフォーム

Phi-3ファミリーの第1弾として、3.8Bの言語モデルであるPhi-3-miniが、Microsoft Azure AI Studio、Hugging Face、Ollamaで利用可能になりました。Phi-3-miniは、4Kと128Kの2つのコンテキスト長バリアントがあり、128Kトークンまでのコンテキストウィンドウをサポートする初のモデルです。また、Phi-3-miniは指示調整されており、人々が通常コミュニケーションをとる方法を反映した様々なタイプの指示に従うようにトレーニングされているため、すぐに使用できる状態になっています。

Phi-3-miniは、デプロイ-評価-ファインチューニングのツールチェーンを活用するためにAzure AIで利用可能であり、開発者がラップトップ上でローカルに実行できるようにOllamaでも利用可能です。さらに、Phi-3-miniはONNX RuntimeでWindows DirectMLのサポートとともに最適化されており、GPU、CPU、モバイルハードウェアにわたるクロスプラットフォームサポートを提供しています。加えて、標準APIインターフェースを備えたNVIDIA NIMマイクロサービスとしても利用可能で、どこにでもデプロイできるようになっています。

スポンサーリンク

品質とコストのバランスを考慮したPhi-3ファミリーの拡充

今後数週間で、Phi-3ファミリーに追加のモデルが追加され、品質とコストの曲線に沿ってさらに柔軟性が提供される予定です。Phi-3-small(7B)とPhi-3-medium(14B)は、Azure AIモデルカタログやその他のモデルガーデンですぐに利用可能になります。マイクロソフトは、品質とコストの曲線全体で最高のモデルを提供し続けており、今回のPhi-3リリースにより、最先端の小型モデルの選択肢が拡大しました。

スポンサーリンク

小型サイズで画期的なパフォーマンスを実現

Phi-3モデルは、主要なベンチマークにおいて、同じサイズおよびより大きなサイズの言語モデルを大幅に上回るパフォーマンスを示しています。Phi-3-miniは、そのサイズの2倍のモデルよりも優れた性能を発揮し、Phi-3-smallとPhi-3-mediumは、GPT-3.5Tを含むはるかに大きなモデルを上回っています。ただし、小型モデルサイズでは事実を保持する容量が少ないため、Phi-3モデルは事実知識ベンチマーク(TriviaQAなど)ではそれほど良い性能を発揮しません。

スポンサーリンク

安全性を第一に考えたモデル設計

Phi-3モデルは、マイクロソフトの責任あるAI標準に従って開発されました。この標準は、説明責任、透明性、公平性、信頼性と安全性、プライバシーとセキュリティ、包括性の6つの原則に基づく全社的な要件です。Phi-3モデルは、厳格な安全性測定と評価、レッドチーミング、機密性の高い使用レビュー、セキュリティガイダンスの遵守を経て、マイクロソフトの標準とベストプラクティスに沿って責任を持って開発、テスト、デプロイされるようになっています。

また、Phi-3モデルは高品質のデータを使用してトレーニングされており、人間のフィードバックからの強化学習(RLHF)、数十のカテゴリにわたる自動テストと評価、手動のレッドチーミングなど、広範な安全性ポストトレーニングによってさらに改善されています。

スポンサーリンク

新しい機能の解放

小型言語モデルであるPhi-3は、特に以下のようなシナリオに適しています:

  • オンデバイスやオフラインの推論シナリオなど、リソースに制約のある環境
  • 高速な応答時間が重要な、レイテンシーに制約のあるシナリオ
  • 特にタスクがシンプルな、コストに制約のあるユースケース

小型サイズのおかげで、Phi-3モデルは計算能力に制限のある推論環境で使用できます。特にPhi-3-miniは、ONNX Runtimeでさらに最適化することで、クロスプラットフォームで利用可能なオンデバイスで使用できます。また、Phi-3モデルの小型サイズにより、ファインチューニングやカスタマイズがより簡単かつ手頃な価格で行えます。さらに、計算ニーズが低いため、レイテンシーを大幅に改善しながらコストを抑えることができます。長いコンテキストウィンドウにより、ドキュメント、ウェブページ、コードなどの大きなテキストコンテンツを取り込んで推論することができます。Phi-3-miniは強力な推論と論理能力を示しており、分析タスクに適しています。

スポンサーリンク

農業分野での活用事例

Phi-3がすでに価値を発揮している一例として、インターネットがすぐに利用できない農業分野があります。Phi-3のような強力な小型モデルとマイクロソフトのコパイロットテンプレートは、必要な時に農家が利用でき、コストを抑えて実行できるため、AIテクノロジーをさらに身近なものにするという追加の利点があります。

インドを拠点とする大手ビジネスコングロマリットであるITCは、マイクロソフトとの継続的なコラボレーションの一環として、100万人以上の農家に利用されている農家向けアプリ「Krishi Mitra」のコパイロットにPhi-3を活用しています。

スポンサーリンク

今すぐ始められるPhi-3

Phi-3を体験するには、Azure AI Playgroundでモデルを試すことから始めましょう。Hugging ChatのPlaygroundでもモデルを見つけることができます。Azure AI Studioを使って、Phi-3の構築とカスタマイズを開始してください。AI Showの特別ライブストリームで、Phi-3についてさらに詳しく学ぶことができます。

マイクロソフトリサーチで生まれたPhiモデルは、Phi-2が200万回以上ダウンロードされるなど、広く使用されてきました。Phiシリーズのモデルは、戦略的なデータキュレーションと革新的なスケーリングにより、驚異的なパフォーマンスを達成しています。Pythonコーディングに使用されるPhi-1から、推論と理解を強化したPhi-1.5、そして言語理解において自身の25倍のサイズのモデルを上回る27億パラメータのPhi-2まで、各イテレーションは高品質のトレーニングデータと知識転移テクニックを活用し、従来のスケーリング法則に挑戦してきました。

Phi-3は、マイクロソフトが提案する次世代の小型言語モデルであり、高度な言語理解と生成能力を実現します。生成AIアプリケーションの構築に向けて、Phi-3がどのように発展し、実世界の問題解決に貢献していくのか、今後の動向に注目が集まります。

コメント

タイトルとURLをコピーしました