Enhancing Multimodal Compositional Reasoning of Visual Language Models with Generative Negative Mining

Ugur Sahin, Hang Li, Qadeer Khan, Daniel Cremers, Volker Tresp

Publikation: Beitrag in Buch/Bericht/KonferenzbandKonferenzbeitragBegutachtung

Fingerprint

Untersuchen Sie die Forschungsthemen von „Enhancing Multimodal Compositional Reasoning of Visual Language Models with Generative Negative Mining“. Zusammen bilden sie einen einzigartigen Fingerprint.

Keyphrases

Arts and Humanities

Computer Science

Earth and Planetary Sciences