研究tldr-ai2026-05-28
NVIDIA、画像内の物特定を高速化
NVIDIA's LocateAnything for Faster Grounding

NVIDIAが、画像内の物体の位置を高速に特定する新しいAI技術を発表しました。これにより、AIが画像の内容をより速く理解できるようになります。
NVIDIAのLocateAnythingは、vision-language grounding frameworkであり、bounding boxをトークンごとにではなく並行してデコードします。