どんなものか: 「S-Seg」は、画像の各ピクセルに意味的なラベルを割り当てるためのモデルで、任意の開放型語彙テキストセットから学習します。このモデルは、手動でアノテートされたセグメンテーションマスクや大規模な事前トレーニングを必要としません ...