Googleは7日(米国時間)、Gemini APIを通じてコンピューターを操作できる「Gemini 2.5 Computer Use model」を開発者向けに提供開始した。Gemini 2.5 Proのビジュアル理解・推論能力を基盤とし、コンピューターのユーザーインターフェース(UI)との対話が可能なエージェント ...
Google’s Gemini 2.5 Computer Use model is a new AI agent that can autonomously browse the web and interact with UIs—clicking, typing, and scrolling based on text prompts. Built on Gemini 2.5 Pro, this ...
19のAIモデルをオーケストレーションし、ワークフロー全体を自律実行 AI回答エンジン「Perplexity」を展開するPerplexity AI, Inc.(本社:米国サンフランシスコ、共同創業者兼CEO:Aravind Srinivas、アジア代表:森田俊、以下Perplexity)は、複数の最先端AIモデルを統合 ...