探索运用视觉语言模型为各个行业提供丰富交互式视觉感知能力的一系列参考工作流。
工作负载
计算机视觉/视频分析
行业
零售/快速消费品
制造业
智慧城市/空间
医疗健康和生命科学
业务目标
投资回报
创新
产品
NVIDIA Metropolis
NVIDIA AI Enterprise
传统的视频分析应用及其开发工作流通常建立在固定功能的有限模型之上,仅能检测和识别一组精选的预定义对象。借助生成式 AI 和基础模型,用户现可以用更少的模型构建应用,这些模型具有难以置信的复杂性、广泛的感知能力和丰富的上下文理解能力。这种新一代的视觉语言模型 (VLM) 正在让强大的智能视频分析 AI 智能体体成为可能。
视频分析 AI 智能体可以结合视觉和语言模式来理解自然语言提示并执行视觉问答。例如,用自然语言回答各种问题,并将回答应用于录制或实时视频流。更深入地理解视频内容,可以实现更准确和有意义的解读,改善视频分析应用的功能和真实场景的解读。智能体前景广阔,将开启全新的工业应用可能性。
我们将在工厂、仓库、零售店、机场、交通路口等地部署高感知、高精度和高交互性的视频分析 AI 智能体。这将对运营团队产生巨大影响,他们希望利用自然交互产生的更丰富的见解来做出更好的决策。管理人员和运营团队将使用自然语言与智能体进行沟通,这些智能体将由生成式 AI 和大视觉语言模型提供支持,其核心是 NVIDIA NIM™ 微服务。
探索技术运用。
快速链接
NVIDIA NIM 是一组推理微服务,包括行业标准 API、特定领域代码、优化的推理引擎和企业运行时间。提供多个 VLM 用于构建视频 AI 智能体,可以处理实时或存档的视频,以使用自然语言提取可行见解。我们创建了一个视频分析 AI 智能体的参考工作流,用户可以尝试使用该工作流加速开发过程。
快速链接
用于搜索和汇总视频的 NVIDIA AI Blueprint 可帮助您构建视频分析 AI 智能体,以便工业运营专业人员通过搜索和汇总实时的或归档的视频传感器数据,与其基础设施进行通信。它集成了视觉语言模型 (VLM) 例如 NVIDIA Cosmos Nemotron VLMs、大语言模型 (LLM) 例如 NVIDIA Llama Nemotron LLMs,以及 NVIDIA NIM,以实现全新的协作水平。
申请参与抢先体验
快速链接
开发者可以构建由 NVIDIA Jetson™ 边缘 AI 平台提供支持的视频分析 AI 智能体,主要是利用 NVIDIA JetPack™的新功能—Jetson 平台服务。生成式 AI 应用完全在 NVIDIA Jetson Orin™ 设备上运行,能检测活动,以生成警报并促进交互式问答会话。
探索常见问题。
快速链接
NVIDIA NIM™ 是 NVIDIA AI Enterprise 的一部分,是一套易于使用的预构建容器工具,目的是帮助企业客户在云、,数据中心和工作站上安全、,可靠地的部署高性能的 AI 模型推理。它支持各种 AI 模型,包括开源社区模型和 NVIDIA AI 模型,可确保利用行业标准 API 在本地或云端进行无缝、可扩展的 AI 推理。 可在 www.nvidia.cn/ai 上详细了解 NVIDIA NIM。
要开始使用 NIM 微服务和 NVIDIA AI Blueprint,请访问 www.nvidia.cn/ai/ 以创建帐户并探索可用的 NIM 微服务。您可以在此处查看可用的 VLM NIM。
所有用户都可以在 www.nvidia.cn/ai/ 上免费使用预览 API。每个新帐户最多可获得 5000 个积分来试用 API。要在积分用完后继续开发,您可以在本地将可下载的 NIM 微服务部署到硬件或云实例。开发者还可以通过 NVIDIA 开发者计划访问 NIM。详情请参阅此常见问题解答。
可下载的 NIM 微服务需要 NVIDIA AI Enterprise 许可证。如需了解详情并免费试用,请访问此页面。
NIM 开发者论坛是您提出问题以及与我们的开发者社区互动的最佳平台。您可以在此处访问论坛。
探索由多个视觉语言模型提供支持的参考工作流,轻松构建您的视频分析 AI 智能体。