首页

当前位置: 首页 > 新闻中心 > 正文

太阳成集团122ccvip古籍数智化平台建设多模态大模型“春秋”研发完成并进入内测阶段

发布日期:2025-10-21    编辑:文学与传播         点击:

10月19日,太阳成集团122ccvip自主研发的多模态大模型“春秋”完成全部训练并进入内部测试阶段, 不久将作为学院古籍数智化平台的核心引擎投入使用。该模型是国内高校率先面向古籍版面整理的大模型,为后续大规模古籍端到端的数字化、智能化研究提供了关键工具支撑。

“春秋”模型采用ViT-MLP-LLM三阶段架构,在预训练阶段引入自回归语言建模、图像掩码、图文细粒度对齐及图像块排序四类损失函数,实现跨模态对齐学习;下游任务阶段,通过版面元素分析、文本行检测、文字识别、视觉问答、遮掩补全等八类指令微调,显著提升了古籍复杂版面的解析与识别精度。实验结果显示,该模型在SCUT-CAB、MTHv2、M5HisDoc、AncientDOC等公开数据集上的版面分割、文字识别、阅读顺序判定等任务中,主要指标均达到现有最优方法,字符识别准确率最高达98.98%。

学院古籍数智化平台以“春秋”模型为内核,规划“九大模块”并行推进:古籍数字化服务、古文基础服务、知识库建设、知识图谱构建、多模态大模型调用、智能体生成、数字人制作、虚拟古籍馆、地方特色系统。平台贯通“采集—标注—训练—服务—众包”全链路,形成教学、科研、地方文化传扬、知识共建共享闭环。据项目组测算,平台全面运行后,可减少教师传统备课时间70%,长期运维成本为商业方案的10%。

依托“春秋”模型,学院将完成德州方志、董仲舒文献、黄河运河文化、非遗技艺、方言语音等五类地方特色资源的结构化存储与可视化展示。并将进一步联合校内外科研机构,继续扩充甲骨、金文、地方志等特色语料,完善知识图谱与版本校勘功能,面向学界开放API接口与标注工具,推动古籍数字人文研究范式升级。

友情链接: tyc122cc太阳成集团

太阳成集团tyc122cc(SunCity Group·china)官方网站 版权所有 咨询电话:0534-8985817 电子邮箱:dzxyzwx@126.com

地址:德州市德城区大学西路566号 邮编:253023