网站建设最重要的环节,vi包括哪些内容,建站视频网站,wordpress产品发布插件1、版面分析
使用轻量模型PP-PicoDet检测模型实现版面各种类别的检测。
数据集#xff1a;
英文#xff1a;publaynet数据集的训练集合中包含35万张图像#xff0c;验证集合中包含1.1万张图像。总共包含5个类别。
中文#xff1a;CDLA据集的训练集合中包含5000张图像
英文publaynet数据集的训练集合中包含35万张图像验证集合中包含1.1万张图像。总共包含5个类别。
中文CDLA据集的训练集合中包含5000张图像验证集合中包含1000张图像
2、文本分析
文本检测改进了基于分割的DBNet (Differentiable Binarization)
数据集ICDAR 2015 数据集包含1000张训练图像和500张测试图像。 文本识别SVTR_LCNet将基于Transformer的SVTR网络和轻量级CNN网络PP-LCNet 融合的一种轻量级文本识别网络
数据集 3、表格
1. 文字检测模型用于检测表格里的文本
2. 文字识别模型用于对检测到的文本进行识别
3. SLANet模型用于预测表格结构的HTML信息和表格单元格坐标 数据集
PubTabNet数据集的训练集合中包含50万张图像验证集合中包含0.9万张图像
好未来表格识别竞赛数据集的训练集合中包含1.6万张图像。验证集未给出可训练的标注。 参考来源 GitHub - PaddlePaddle/PaddleOCRhttps://github.com/PaddlePaddle/PaddleOCR