主要是做文档类图像的版面分析。具体来说,就是分析给定的文档类别图像(论文截图、研报等),定位其中类别和位置,如标题、段落、表格和图片等各个部分。
项目提供了不同的模型,例如 pp_layout_table、pp_layout_publaynet、pp_layout_cdla 等,分别对应不同的版面类型和支持的类别。
体验地址1:https://huggingface.co/spaces/SWHL/RapidLayout
体验地址2:https://www.modelscope.cn/studios/liekkas/RapidLayout
开源地址:https://github.com/RapidAI/RapidLayout