Googleは10日(米国時間)、マルチモーダル対応の埋め込みモデル「Gemini Embedding 2」を発表し、Gemini APIおよびVertex AIを通じてパブリックプレビューで提供開始した。テキスト、画像、動画、音声、ドキュメントを単一の埋め込み空間にマッピングし、異なる種類のメディアを横断した検索や分類に対応する。
Google has launched Gemini Embedding 2, its first natively multimodal embedding model supporting text, images, video, audio, ...
Google has launched Gemini Embedding 2, its first fully multimodal embedding model based on the Gemini system. This model ...
Google Gemini Embedding 2 unifies text, images, audio, PDFs, and video; it supports 3,072-dimension vectors, simplifying retrieval stacks.