アメリカに拠点を置くAI企業のアレン人工知能研究所(Ai2)が、ブラウザを操作・制御するように設計されたAIエージェント「MolmoWeb」を発表しました。 MolmoWebは大規模言語モデルのマルチモーダル能力を応用したツールで、画像を読み取って推論し、タスクを実行することができます。Ai2は「人間が見るのと同じインターフェースを解釈することで、次のステップを予測し、クリック、入力、スクロールと ...