NLPExplorer

EvalMG - 2025

Total Papers:- 8

Total Papers accross all years:- 8

Total Citations :- 0

1

TaiwanVQA: A Benchmark for Visual Question Answering for Taiwanese Daily Life

Hsin-Yi Hsieh | Shang Wei Liu | Chang Chih Meng | Shuo-Yueh Lin | Chen Chien-Hua | Hung-Ju Lin | Hen-Hsen Huang | I-Chen Wu |

Guiding Vision-Language Model Selection for Visual Question-Answering Across Tasks, Domains, and Knowledge Types

Neelabh Sinha | Vinija Jain | Aman Chadha |

A Dataset for Programming-based Instructional Video Classification and Question Answering

Sana Javaid Raja | Adeel Zafar | Aqsa Shoaib |

CVT5: Using Compressed Video Encoder and UMT5 for Dense Video Captioning

Mohammad Javad Pirhadi | Motahhare Mirzaei | Sauleh Eetemadi |

If I feel smart, I will do the right thing: Combining Complementary Multimodal Information in Visual Language Models

Yuyu Bai | Sandro Pezzelle |

Persian in a Court: Benchmarking VLMs In Persian Multi-Modal Tasks

Farhan Farsi | Shahriar Shariati Motlagh | Shayan Bali | Sadra Sabouri | Saeedeh Momtazi |

LLaVA-RE: Binary Image-Text Relevancy Evaluation with Multimodal Large Language Model

Tao Sun | Oliver Liu | JinJin Li | Lan Ma |

Proceedings of the First Workshop of Evaluation of Multi-Modal Generation

Wei Emma Zhang | Xiang Dai | Desmond Elliot | Byron Fang | Mongyuan Sim | Haojie Zhuang | Weitong Chen |

Conference Topic Distribution

Conference Citation Distribution

Conference Papers have no Citations yet

Topics