NVIDIA NIM™ は、クラウド、データセンター、ワークステーション、エッジなど、あらゆる NVIDIA アクセラレーテッド インフラストラクチャに最新の AI モデルを迅速にデプロイできるように、最適化された事前構築済みの推論マイクロサービスを提供します。
NVIDIA NIM は、マネージド API の使いやすさと運用の簡素さと、お客様が好むインフラ上にあるセルフホスティング モデルの柔軟性とセキュリティを組み合わせたサービスです。NIM マイクロサービスには、最新の AI 基盤モデル、最適化された推論エンジン、業界標準の API、ランタイム依存関係など、AI チームが必要とするあらゆるものが含まれています。どこにでもデプロイと拡張が可能なエンタープライズ グレードのソフトウェア コンテナとして事前にパッケージ化されています。
高性能 AI 向けに構築された使いやすいエンタープライズ グレードのマイクロサービス。シームレスに連携し、手頃な価格で拡張できるように設計されています。推論、シミュレーション、音声など、最新の AI モデルを活用した AI エージェントやその他のエンタープライズ向け生成 AI アプリケーションで、最速で価値が創出されることをご体験ください。
最新の AI モデル向けに最適化された事前構築済みのマイクロサービスで、イノベーションを高速化し、市場投入までの時間を短縮します。標準 API を使用すれば、モデルを 5 分でデプロイして、アプリケーションに簡単に統合できます。
NVIDIA による厳格な検証プロセスと専用の機能ブランチを通じて継続的に管理されるエンタープライズ グレードのマイクロサービスをデプロイ。そのすべてが、NVIDIA エンタープライズ サポートによって支えられ、NVIDIA AI エキスパートにも直接アクセスして利用できます。
クラウドで拡張する、低レイテンシで高スループットの AI 推論で TCO を改善し、すぐに使用できるファインチューニング済みのモデルで最高の精度を実現します。
クラウド、データ センター、ワークステーションなど、あらゆる NVIDIA アクセラレーテッド インフラストラクチャで実行可能な事前構築済みのクラウド ネイティブなマイクロサービスで任意の場所にデプロイし、Kubernetes やクラウド サービス プロバイダーの環境にシームレスに拡張することができます。
NVIDIA NIM は、面倒な設定なしで最適化されたスループットとレイテンシを提供し、トークン生成の最大化、ピーク時の同時ユーザー サポート、そして応答性の向上を実現します。NIM マイクロサービスは最新の最適化された推論エンジンで継続的に更新され、同じインフラストラクチャでのパフォーマンスを長期にわたって向上させます。
構成: Llama 3.1 8B instruct、1x H100 SXM、同時リクエスト: 200。NIM ON: FP8、スループット 1201 トークン/秒、ITL 32 ミリ秒。NIM OFF: FP8、スループット 613 トークン/秒、ITL 37 ミリ秒。
推論、言語、検索、音声、画像などに対応するマルチモーダルのエージェント型 AI を強化する、最新の AI モデル向けに最適化された推論パフォーマンスを手に入れましょう。NIM には、NVIDIA および開発コミュニティが提供する高速推論エンジン、NVIDIA® TensorRT™ や TensorRT-LLM などが統合されており、NVIDIA アクセラレーテッド・インフラストラクチャ上で低レイテンシかつ高スループットな推論を実現するよう事前に最適化されています。
どこででも実行できるように設計された NIM 推論マイクロサービスでは、業界標準の API を公開しています。これにより企業システムやアプリケーションとの統合を容易にし、Kubernetes 上でシームレスに拡張できるため、クラウド規模で高スループットかつ低レイテンシの推論を実現できます。
1 つのコマンドでモデルに NIM をデプロイできます。 ファインチューニング済みモデルでも簡単に NIM が実行可能です。
貴社の NVIDIA アクセラレーテッド インフラストラクチャに基づいた最適なランタイム エンジンを使って、NIM を稼働させることができます。
数行のコードを書くだけで、セルフホストの NIM エンドポイントを統合できます。
NVIDIA NIM がどのように業界のユースケースをサポートし、厳選した例示で AI 開発を素早く開始できるのようにしているのかをご覧ください。
生成 AI で顧客体験を向上させ、ビジネス プロセスを改善します。
生成 AI を活用してドキュメント処理を高速化および自動化します。
AI の力で顧客満足度を向上させるカスタマイズされた体験を提供します。
OpenUSD と生成 AI を活用して、3D 製品コンフィギュレータ ツールおよび体験を開発し、ほぼすべてのデバイスにデプロイすることができます。