Vision-Language Models Struggle to Align Entities across Modalities

Egileak: 
Iñigo Alonso, Ander Salaberria, Gorka Azkune, Jeremy Barnes, Oier Lopez de Lacalle
Urtea: 
2025
Artikuluaren erreferentzia: 
Findings of the Association for Computational Linguistics: ACL 2025

Argitalpen mota fina (argitalpen_sailkapen_ohia):

Kongresuaren balorazioa: