TF-ID @hu_yifei
用于提取论文中表格和图形 (Table/Figure IDentifier) 的模型,基于 Microsoft Florence-2 模型微调实现。
开源微调模型:
TF-ID 模型系列共包含 4 个模型:
> TF-ID-base
0.23B 参数,带标题提取,准确率 97.29%
> TF-ID-base-no-caption
0.23B 参数,不带标题提取,准确率 96.93%
> TF-ID-large
0.77B 参数,带标题提取,准确率 98.06%
> TF-ID-large-no-caption
0.77B 参数,不带标题提取,准确率 97.32%
HuggingFace Models
https://t.co/sEFIaQR0dL
开源微调数据库:
来自 HuggingFace Daily Papers @_akhaliq ,共提取了约 4600 张图像,作者同时也开源了数据库。
HuggingFace Datasets
https://t.co/axCZzRIOjM
开源微调代码:
作者开源了完整的微调代码,默认基于 Florence-2-large-ft, BATCH_SIZE=4 微调需要至少 40GB VRAM GPU。
基于 Florence-2-base-ft 可以减少 GPU VRAM 要求。
Github repo
https://t.co/mxQviWHTHW
点击图片查看原图