大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的 GPT-4V 也会有「挫败感」。
论文地址:https://arxiv.org/abs/2310.02255 项目地址:https://mathvista.github.io/ HF 数据集:https://huggingface.co/datasets/AI4Math/MathVista 数据可视化:https://mathvista.github.io/#visualization Leaderboard:https://mathvista.github.io/#leaderboard