文库 服务类投标方案 电子商务

图书馆体系建设项目古籍数字化整理加工技术方案120页.docx

建设 技术方案 DOCX   117页   下载112   2024-09-06   浏览45152   收藏33   点赞623   评分-   34109字   23积分
还在等文档吃灰吗!快上传文档躺赚收益
温馨提示:当前文档最多只能预览 15 页,若文档总页数超出了 15 页,请下载原文档以浏览全部内容。
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第1页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第2页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第3页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第4页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第5页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第6页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第7页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第8页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第9页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第10页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第11页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第12页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第13页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第14页
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx 第15页
剩余102页未读, 下载浏览全部
图书馆体系建设项目古籍数字化整理 加工 技术 方案 目录 一、 项目建设方案 1 (一) 项目建设要求响应 1 1. 项目实施策划 11 2. 实施难点应对方案 17 3. 服务技术方案 19 4. 进度控制措施 57 5. 服务质量保障措施 60 6. 软硬件配置 78 7. 人员配置 84 二、 项目管理方案 87 (一) 项目管理组织 87 (二) 人员管理 89 (三) 风险及应对措施 91 (四) 沟通协调机制 93 (五) 售后服务 96 1. 售后服务方案 96 2. 售后服务理念 96 3. 售后服务承诺 98 4. 售后服务原则 99 5. 售后服务标准 101 6. 售后服务体系 103 7. 售后服务方式 105 8. 售后服务响应时间 107 9. 售后服务资源配置 108 (六) 培训计划方案 111 1. 培训计划 111 2. 培训讲师 113 3. 培训内容 114 4. 培训 目标 116 项目建设方案 项目建设要求响应 我公司承诺完全满足如下需求内容,若中标,保质保量完成项目建设: 项目内容: 项目名称: 内容简述:本次建设内容主要包括三个方向:一是重点支持列入《国家珍贵古籍名录》的古籍资源的数字化加工;二是支持列入《省级珍贵古籍名录》的古籍资源的数字化加工;三是《中国古籍善本书目》或古籍专题数字化加工。古籍图像数据化和知识化处理工作包括文献前整理和登记、图像采集与处理,符合长期保存级和发布服务级数据技术要求、书目数据著录、古籍结构数据和卷目篇目数据标引,制作XML封装文件。文字错误处理率不超过万分之三;古籍全文文本化处理,制作 txt 文本格式,非结构化处理,文字错误处理率不超过千分之一。 建设数量:9027叶。 建设清单 序号 题名卷数 册数(册) 筒子叶(叶) 1 2 3 4 5 6 7 合计 我公司承诺完全满足项目建设要求: (一)古籍文献数字化加工项目建设要求 ( 1 ) 扫描加工要求 扫描设备:扫描设备选择零边距或非接触式扫描仪。设备光学分辨率不低于 600dpi,CCD感光元件不低于 5000 像素点,色彩位数 24bit,扫描设备使用无紫外线的同步冷光源,避免纸张褶皱、撕裂、破损等情况的发生。 扫描流程须科学合理,注重文献保护。扫描过程中 我公司 不损坏文献原件、打乱文献原始存放顺序、破坏文献完整性。 ( 2 ) 图像采集要求 文献扫描前根据相关标准,做加工设备的基本色彩校正,及针对各类型文献进行色彩校正。 我公司 确保古籍安全及古籍受环境影响在合理范围内。 善本古籍扫描避免透光,扫描图像清晰,不透字,能清楚显示文献水渍、霉斑等污迹。 扫描 我公司 按文献装订的实际顺序进行,不重叶、缺叶,错叶、折叶等情况发生(原书缺叶、错叶除外)。补扫缺叶图像与同册图像文件的大小一致,颜色接近。按 1:1 比例扫描,叶面外围要求留白,宽度不超过 1-2 厘米;书叶间距不超过 0.1 厘米。 我公司 以原书的上边沿为基准,以中缝为中心线,保持原文献的天头、地脚的尺寸不变,左右两边的尺寸基本不变。 扫描或拍照时不损坏原始文献,原则上不进行拆卷处理,如遇特殊情况(夹字、粘连等),经古籍数字化管理人员与古籍修复人员会商核定后,由古籍修复人员进行拆卷、修整与还原。古籍修复人员由 我公司 派遣。 原件表面有其他粘贴物件时,先将原件与粘贴物(即粘贴物覆盖于文献)一起扫描,然后将粘贴物掀开(不允许拆装),再次扫描原件。 原件透背叶字迹,有虫蛀、漏洞时,垫上古籍适用的衬纸后扫描。 分画幅扫描时,各扫描区域边缘有 2 厘米(含)以上的重复扫描区。 数字图像文件用图形图像类软件检查图像不失真(图像放大至实际尺寸 100%),检查清晰度。 (3) 数字图像制作规格 存档文件须包含全部原始数据,提供档案典藏级、复制加工级、发布服务及相关数据,交付TIFF 文件,按需求同时提供 JPEG、PDF等输出格式。 ( 3.1 ) 古籍典藏级 位深:24 位 扫描分辨率: 文献小于 10×12.5cm,用 600DPI 以上 文献大于 10×12.5cm ,小于 A3,用 600 DPI 以上 拍照像素:2100~3300 万像素 文件格式:TIFF(LZW):单页和多页的区分、RAW(SRAW)封装格式 色标卡:处理方式 首页加载 我公司 提供“含彩页的印刷型文献,600dpi,32 位以上深度、无损压缩”和“印刷型文献,全彩,600dpi,8 位以上深度、无损压缩”两种 TIFF 格式扫描方式,由采购方确定每种文献的扫描方式; ( 3.2 ) 发布服务级 数据发布与图书馆现有的古籍发布平台进行无缝对接,并且与图书馆正在使用的移动图书馆和微信公众号无缝对接,通过微信等第三方扫描工具二维码扫描,可直接在线阅读原版文本全文,无需下载客户端,并能将古籍资源分享至朋友圈等社交网络。色彩位深 8bit 灰度;分辨率不低于 200DPI;像素不低于 1000 万;文件保存格式为 JPG 或 PDF。 ( 3.3 ) 复制加工级 档案典藏级图像经技术手段转换而成,是用于加工复制各种精度、大小的屏幕浏览图像的母本文件。色彩位深 24bit;分辨率不低于 600DPI;文件保存格式为 JPG 或 JPEG;色调再现使用 ICC配置文件。 (4) 数字图像文件处理要求 扫描后的原始图像 我公司 逐页检查,进行相应的图像优化处理,确保图像清晰、端正、完整,还原与确保文献原件能辨识的信息,不出现原件没有的颜色变形、明显皱纹等破坏图像质量的现象。包括:纠偏、裁边、去污、调色、拼接等优化处理。 纠偏处理。 我公司 对出现偏斜的图像进行纠偏处理,对方向不正确的图像进行旋转还原,使其符合阅读习惯。图像偏斜不超过 1°。 图像剪裁。拍摄原件外边缘裁至 0.5~0.75 厘米。 图像拼接。 我公司 对大幅面文献进行分区扫描形成的多幅图像,服务级文件进行拼接处理,合并为一个完整的图像,以保证数字文件的整体性。 我公司 不进行锐化或者图像增强处理,不能更改图像的颜色,尽量减少对图像文件的后期处理。 (5) 数字图像检查要求 图像文件(各种格式)放大到 1:1 状态,逐叶检查。检查文件是否有透光、透字、有彩点、彩线、太淡、太浓、黑边、污点、歪斜、模糊(马赛克等)或图像内容不完整等现象。若不符合图像质量要求应进行图像校正或重新扫描(拍照)。 发现文件漏扫时,应及时补扫并正确插入图像。 检查扫描(拍照)图像的规格要求和技术参数。 检查图像页码是否连续,不得跳页。 文献以册/件为单位检查标引(登记、描述、管理)数据是否完整、准确。 所有文件保存位置正确,可以有效打开和显示。 按照命名规则,检查目录、文件、数据库、文档、介质等名称是否正确。 检查各类说明、统计、验收等文档是否齐全。 (6) 图像命名要求 ( 6.1 ) 根据招标方提供的标记项目,对创建的图像资源逐个进行内容标识,并生成图像内容标记清单。 ( 6.2 ) 扫描后的图像须按照招标方要求逐页进行排序整理,图像须与文献原件编号顺序一致。无损或无压缩的图像资源,与应发布需求产生的压缩图像分开存储。 ( 6.3 ) 古籍扫描的图片按照国家图书馆下发的文献加工规则命名,命名规则如下: 每种古籍文件夹命名: 数据保存目录由两个层级结构组成: 第一级目录名称为加工记录标识号 加工记录标识号共 15 位数字,由 4 段组成:机构代码—资源类型—项目建设年—品种加工流水号,记录标识号各段之间不加任何连接符。 第二级目录名称为古籍册次。每部古籍有多册实体,每一册命名为 4 位数字,从 0001 开始,依次按流水号命名。 每张外观图像命名: 古籍原件,以册为单位进行数字化,从古籍封面、前护、正文、后护、封底等依次加工。古籍原件的扫描或拍照,页面类型可选择筒子叶、双半叶方式,也可选择半叶方式。选择不同的页面类型,文件命名规则不同。 双半叶或筒子叶 古籍每一叶 (TIFF格式) 文件名由 4 位数字组成,文件命名从 0001 开始后以流水号递加顺序命名文件。 例如:古籍有30叶分别命名为0001.tif、0002.tif-0030.tif。 半叶 图像 (TIFF 格式)文件名为 4 位数字 + 1位大写字母 其中 4 位数字,从 0001 开始,古籍封面命名为 0001,后以流水号方式以递加顺序命名文件:大写字母,古籍书脊右侧的半叶命名为 A,书脊左侧的半叶命名为 B。 例如:古籍第6叶A面: 命名为0006A.tif、古籍第6叶B面: 0006B.tif。 ( 6.4 ) 特殊处理 原件有粘贴物的命名规则 不带粘贴物的图像文件名为:4 位数字 带粘贴物的图像文件命名为:4 位数字+小写字母。 其中,4 位数字为原件内容的顺序流水号;小写字母,从 a 开始,顺序命名。 例如:原件第 8 叶有 2 个重叠粘贴的簽條,先将粘贴物掀开扫描,然后逐一复原粘贴物与原书一起扫描。三个图像文件分别命名为:0008.tif、0008a.tif、0008b.tif。 一页普通古籍过大,分多画幅拍摄保存级文件名为:4 位数字_2 位数字(4 位数字为原件内容的顺序流水号,2 位数字为该图多画幅顺序号,从 01 开始连续命名。) 例如:0002_01.tif 0002_02.tif 服务级文件需将多画幅进行拼接,拼接生成一个文件,命名规则为:4 位数字(4 位数字为原件内容的顺序流水号)例如:附加:0002.jpg (6.5)特殊情况说明 有拼接、分多画幅采集等特殊情况需在当前文件夹下,建立 readme.txt 进行说明。 (7)元数据著录标引要求 元数据制作,分别按文献整理登记、描述元数据、管理元数据等三部分工作,制作5张库表,包括古籍文献整理登记表、古籍基本元数据表、古籍结构数据表、古籍卷目和篇名数据表、外字表。表格要求必须满足国家图书馆 2024 年发布的《全国智慧图书馆体系建设:古籍数字化和知识标引规范手册》。 我公司保证数据库文件的规范性。 著录信息应严格按照文献实际内容进行描述,标引词与标引对象文件应正确链接。 不同人员和机位录入数据后应合并为一个数据库文件。系统具有导入功能。应确认合并数据库文件字段和属性一致性。 表名称和字段内容逐项检查,覆盖面 100% 。 文字处理错误率不超过 1‰。 (8)OCR 识别要求 我公司对需要全文识别的古籍图像文件进行处理,并采用古籍文献 OCR 识别软件进行 OCR 识别,对识别结果进行校对,修改,文字阴影需与图像基本一致。需支持 Unicode-15 字符集,支持展示基本的异体字,需提供 TXT 及双层 PDF 格式文件。 字符编码处理符合 GB 18030 的规定。 全文 OCR 自动识别,文字正确率为 95%以上(含)。 全文 OCR 人工校对,文字处理错误率不超过 1‰(含)。 校对后的文本文件盒原始图像文件进行属性标注,实现图文关联。 (9)数据提交要求 我公司严格按照双方商定的工作机制准时将每批次的数字化成品数据及时上传至招标方规定的服务器里,并用移动硬盘备份移交给招标方。 数字化成果内容 XML文件:(包含:古籍基本元数据、结构数据、卷目篇名); 对象数据:长期保存级、发布服务级(包含TIFF格式文件、PDF格式文件、TXT格式文件); 文献整理登记表和外字表; 数据说明文件。 《古籍数字资源提交单》 一式两份,国家图书馆(国家古籍保护中心)作为资源接收单位,各省市级古籍保护中心以及各级古籍保护收藏单位作为资源提交单位,双方各存留一份。 注:建设要求详见国家图书馆下发的《全国智慧图书馆体系古籍数字化和知识标识引规范手册》。 (二) 验收 依据本项目特点根据国家或行业现有执行标准进行验收。 采购人应当及时对采购项目进行验收。采购人可以邀请参加本项目的其他供应商或者 资质验收小组 参与验收。 (三)交货期 我公司承诺合同签订后180天内完成交货 。 (四) 付款办法 我公司承诺 合同签署后的5个工作日内支付合同总额的50% , 剩余50%于甲方验收合格后的5个工作日内支付完毕。 项目实施策划 按照公司策划实施过程规范, 我公司 的项目实施过程分为五个步骤: 项目策划期 需求调研分析期 数据建设、 系统实现期 系统测试联调期 项目上线验收期 1 ) 项目策划期 本阶段目标 本阶段主要工作目标: 进入角色:了解项目相关情况,进入角色 确立规则:明确项目组织结构和相关职责,就项目目标、实施计划、实施管理过程达成一致 本周期内项目过程 本阶段主要活动,需要多个部门配合完成下列的内容: 2 ) 需求调研分析期 本阶段主要目标: 数据 需求调研 需求调研:完成, 数据、 软件需求确认 在 用户 的组织下,我方积极进行需求调研。通过需求调研,准确掌握用户对系统的信息管理在功能、特性、系统运行方面的要求,主要包括:信息需求、功能要求、性能要求、可靠性要求、安全和保密要求。 通过需求调研,最终应形成需求报告。系统验收以最终的需求报告为准。 本阶段内项目过程 3 ) 数据建设 、 系统实现期 本阶段目标 本阶段主要工作目标: 数据建设 搭建系统平台 完成平台的安装、配置 完成软件编码 项目组完成软件需求的研发,单元测试 从这个阶段起,需要特别注意版本、进度等控制 4 ) 项目测试联调期 本阶段目标 本阶段主要目标:通过通用性测试和性能测试对平台系统进行压力测试。 通用性测试:用户界面测试;各种按钮功功能键测试。 性能测试:根据软件的特别性能和效率目标,进行压力测试。测试其在一定工作负荷条件下,响应时间和处理速度是否符合设计要求。 系统联调测试 完成内部测试 完成确认测试 生产环境就绪 所有设备均按照生产环境的要求进行安装调试 审核是否具备上线环境,提交正式上线申请 本阶段内项目过程 5 ) 项目上线测试期 本阶段计划 本阶段主要目标: 上线验收 项目上线前后 相关 人员的培训 完成对接工作,以及对接之后的优化等工作 完成初验 有效维护 长期的维护支持:日常维护、系统巡检、故障维护 本阶段内项目过程 实施难点应对方案 ( 1 )技术挑战与选型 难点:古籍数字化涉及大量的图像识别、文字识别、自然语言处理等复杂技术,技术难度大,选型不当可能导致项目效率低下或数据质量不佳。 应对 措施 :对现有技术进行深入研究,选择成熟度高、稳定性好的技术框架。结合项目需求,定制技术实施方案,注重技术可行性与成本控制。建立技术评估与反馈机制,及时调整技术方案,确保项目顺利进行。 ( 2 )古籍保存状况差 难点:古籍往往存在纸张老化、字迹模糊、破损严重等问题,给数字化工作带来很大困难。 应对 措施 :针对古籍的不同保存状况,制定个性化的数字化方案。引入专业修复人员参与前期整理工作,对古籍进行必要的修复与保护。在数字化过程中采用高清扫描仪等设备,尽可能保留古籍的原貌。 ( 3 )标准不统一 难点:目前古籍数字化尚缺乏统一的标准规范,导致数据格式、命名规则等不一致,影响数据的整合与利用。 应对 措施 :参与或借鉴国内外相关标准,制定适合本项目的数字化标准。在项目过程中严格执行标准,确保数据的一致性与规范性。加强与其他数字化项目的交流与合作,推动标准化进程。 ( 4 )合作与资源整合难 难点:古籍数字化涉及多个部门、机构及专家学者的合作,资源整合难度大,协调成本高。 应对 措施 :建立项目协作平台,明确各方职责与分工,促进信息共享与资源整合。加强与图书馆、博物馆等机构的合作,共同推进古籍数字化进程。举办学术交流活动,邀请专家学者共同探讨古籍数字化问题,推动技术创新与知识共享。 ( 5 )资金投入不足 难点:古籍数字化项目需要大量资金投入,包括设备购置、技术研发、人员培训等方面,资金短缺可能导致项目进展缓慢。 应对 措施 :积极争取政府、企业等多元主体的资金支持,形成多元化投入机制。合理规划项目预算,注重成本控制与效益评估。探索创新盈利模式,如开发衍生品、提供在线服务等,为项目提供持续的资金支持。 ( 6 )人才培养与引进 难点:古籍数字化项目需要既懂古籍又懂数字化技术的专业人才,但目前此类人才匮乏,培养与引进难度较大。 应对 措施 :加强与高校、研究机构的合作,培养具有跨学科背景的专业人才。建立激励机制,吸引国内外优秀人才参与项目。加强内部培训,提升项目团队的专业素质与技能水平。 ( 7 )法律法规与版权问题 难点:古籍数字化涉及版权、知识产权等法律问题,如处理不当可能引发法律纠纷。 应对 措施 :严格遵守相关法律法规,确保项目合法合规。加强与版权所有者的沟通与合作,获得合法授权或许可。建立完善的知识产权保护机制,防止数据泄露或非法使用。 服务技术方案 我公司拥有多年的数据加工经验,按照项目实施要求,逐点攻破,最终以拿到图书馆的结项证明为准。 (1)自主开发数据加工软件简介 《图片处理系统》、《文献数字化加工系统》是我公司在承接图书馆项目过程中不断总结经验的基础上自主研发的软件系统。我公司软件系统加工的数据完全符合国家图书馆验收标准。 《文献数字化图片处理系统》: 软件加工界面截图 程序开发界面: 我公司具有自主研发的数字化加工系统,所研发设备能够扫描不同厚度、不同尺寸古籍、现代图书、卷宗、文献等: 自主研发的文献校验软件 自主研发的图片处理软件 自主研发的书籍校验软件 最大光学分辨率 600dpi*600dpi (真实光学分辨率) 输出模式﹤36-bit(彩色) 12-bit(灰度)1-bit(黑白) 嵌入式图像增强处理,包括纠偏,曲线修正,指印消除,等色彩平衡、白平 衡、曝光修正图像格式:JPEG,非压缩 TIFF,TIFF LZW,PNG,TIFF G4(黑白)、PDF、 BMP 等等 数据图像基本要求:扫描输出模式为 24 位彩色;扫描分辨率必须满足真实 光学分辨率 600*600DPI;文件保存格式为 TIFF(LZW);文件发布格式为 JPG 格式。 该扫描仪支持扫描不同厚度、不同尺寸古籍、现代图书、卷宗、文献 拥有最大扫描幅面达到870×592MM、最大扫描厚度可达130mm,不拆订即可扫描: 扫描驱动台长度 2620MM,满足870 ×592MM扫描、不拆订扫描要求 软件功能详细截图 : 系统支持自动边界扑捉、自动倾斜校正、自动黑边去除、自动文字查找 : 下图所示为图片加载时自动纠正歪斜: 软件的黑边去除功能: 上述功能均可以使用软件一键处理功能实现以上功能的自动化操作 下图所示为校验软件带有的文字查找功能: 系统具有实时预览功能,可以根据预览区域裁剪需要的数据进行扫描 。 下图左侧所示为图片扫描实时预览,虚线框范围即预览区域裁剪地方,并可实时调整: 系统采用文档管理模式,每册图书、卷宗或每份档案集中存放在一个文档中,方便管理;同时支持扫描过程中插入、替换、删除等功能;使用这些功能的时候文件名会自动改变 。 下图所示为扫描图片集中存储,支持批量命名、插入、替换、删除功能: 系统同时支持ICC图像校正模式、无限增强图像品质 : 下图所示为软件支持 图像校正模式、无限增强图像品质 扫描100-600DPI彩色、灰度或者黑白图像 : 下图所示为扫描支持 100-600DPI 彩色、灰度选项操作 系统支持批量扫描单页、多页图书、卷宗及 文献 ,文件输出格式支持PDF,JPG,RAW,JPG2000,TIFF,BMP,Djvu : 下图所示为扫描仪扫描参数设置界面,支持单页、多页、文献扫描。文件输出格式 支持JPG TIFF BMP PDF等 系统支持扫描条码并自动建立文档 : 系统支持扫描完的数据自动生成XML元数据,方便图书归档、搜索 : 系统支持单页、双页、自由模式扫描,所扫描的图档能够自由移动,移动后文件名自动修改 : 该图为扫描参数设置,支持 单页、双页、自由模式扫描 所有图片集中管理,可实现自由移动 具有自主研发的图像加工系统,图像处理模块支持单个、批量、奇数、偶数批量操作,同时支持批量回复功能 下图所示为自主研发的图像加工系统, 支持单个、批量、奇数、偶数批量操作,同时支持批量回复功能 : 支持批量转换输出符合数图推广工程数字资源联合建设地方图书数字化项目功能的多页TIFF、多页PDF功能,同时平台自带批量OCR识别输出可检索的双层PDF功能 : 下图所示为软件完成工作后自动生成 PDF、TIFF、XML功能 下图为软件 OCR识别以及检查PDF覆盖功能: 具有在任意位置添加图像或者文字水印,保护版权 : 下图 软件支持 任意位置 给图像添加文字水印以及图片水印 ,保护版权 : 支持单个、批量图像去背景、噪点 、 自动去除 : 下图所示,可支持单个、批量图像自动去 背景、噪点 等功能: 支持图像文件单个、批量修改文件物理尺寸,分辨率 。 下图所示为软件单个、批量修改文件属性选项窗口: (2)文献校验软件 工作界面各功能块详解 浏览文献原图所在位置,打开后即显示在下方页码栏内。 当前版校对完后进行的存盘操作,会自动在文件保存位置生成对应文件夹 即PDF、TIFF、XML三个文件夹 文献信息功能即填写文献元数据内容 语言功能,可进行简繁切换进行文件校验工作 选择指针 应对文献文章内容排版差异而开发的四种内容框选模式。框体带有吸附功能,即框体吸附在文字边缘。分别为矩形模式、复选框模式、多边形模式以及圆形模式。 介绍两种常用模式: 矩形框模式 复选框模式 前为框选界面 后为文字识别界面 文献原图缩放功能 分别为XML校对界面、刷新、文字覆盖界面 XML校对界面 该界面即为文献校验工作主要方面,在这里会对原图识别出来的文字进行校对,文字覆盖位置的调整,以及DPF、TIFF、XML三个文件的保存生成。 文字快速校对功能 软件对识别出来的文字,首先会通过软件字词逻辑进行筛选,如下图所示 篇目001标题“ 自治区部署新一轮禁毒人民战争 ”正确,在右侧XML页面显示为黑色 篇目002标题“新年加辞”逻辑判定异常,显示为红色,这样就方便校验人员快速对识别出的文字进行校对。 点击红色字体,即可在下方快捷修改栏内进行文字改正。左侧文字识别界面也会同步进行文字更新。如下图所示 当所有文字校对完后,查看文字覆盖位置,点击查看文字覆盖功能 如下图所示 蓝色区域即为识别后文字对应文献原图覆盖位置 当文字校对以及覆盖无误后,就可以进行保存,完成本版文献的校验工作。 文字检查功能 该功能在保存后或者作为终检工具使用,查找疑似有错误的地方,进一步降低错误率,提高成品质量。 第一个为内容遗漏查看功能 查看本版文献是否有遗漏内容没有进行框选,如下图所示 蓝色为已框选,反之则没有蓝色覆盖。 为 语句排序功能 为 原图显示开关 功能如下图所示 在识别的文字上方显示文献原图对应内容,便于校对。 文章内容框选栏 该菜单栏对应文章各个内容部位,都带有不同颜色加以区分。如下图所示 以上就是我司文献校验软件功能详细介绍。 (3)制图软件 工作界面各功能块详解 打开、存盘功能跟文献校验软件原理相同。 在框选范围内把原图进行一次灰度转换,示意图如下 清除框选范围外部分并填充白边,示意图如下 去除原图底色,强度跟右侧参数设置相关,示意图如下 自动纠正原图倾斜度 自动框选需要处理的部分,带吸附功能。 加深文字颜色深度,可单词或多次点击,也可以直接在右侧参数面板设置字体加深数值。 以框选范围居中并填充四周 在框选范围内使用一键处理功能,软件会自动进行图片处理。 擦除功能 可供操作人员返回初始状态 以上图片处理功能都套用软件基本参数,参数设置好后,可以直接使用一键处理功能,优化工序,提升效能。 如下图所示 做两组图片进行对比,以便更直观的了解到软件处理功能。 彩色原图 一键处理后 灰色原图 一键处理后 以上就是我司图片处理软件功能详细介绍。 (4)书籍校验软件 工作界面各功能块详解 该功能原理与其他两款软件一样。 对已框选的书籍内容部分进行文字识别,如下图所示蓝色框部分,就是需要识别的地方。 对已识别的文字进行校对,如下图所示 文字识别部分,与文献校验软件一样,首先会套用字词逻辑筛选一次,图中右侧显示疑似文字错误:0处,如有错误会在这里显示出来,并标红显示。 文字的修改,只需要点选错误的文字,在快捷修改栏中找到正确的字选择即可进行文字修改操作。 软件带有简体、目录、英文三种识别方式 高度、宽度是缩放页面功能;TXT为文字修改界面;PDF为查看文字覆盖界面(与文献校验软件功能一致);横栏、竖栏分别对应书籍中横、竖文字方向框选的功能;旋转为旋转图片方向。 三款软件的开发,最大程度上优化工序,提高效率、质量,简单易学,容易上手。 资源采集: 扫描设备:古籍专用非接触扫描仪:A2幅非接触扫描仪具有高保真全彩色CCD镜头,点对点一次成像技术非接触冷光源扫描仪,以保证纸质档案不受二次损坏及还原成像的电子影像色彩零失真),典藏级:TIFF,600DPI,无压缩彩色扫描。按照图书馆的要求执行。 数据图像基本要求:扫描输出模式为24位彩色;扫描分辨率必须满足真实 光学分辨率600*600DPI;文件保存格式为TIFF(LZW);文件发布格式为JPG格式。 扫描流程工作图: 图片处理流程工作图: 进度控制措施 (一)工作进度时间安排 我公司实际项目的进度时间安排根据项目的具体情况、资源投入、技术难度等因素进行详细的规划和调整。同时,在项目执行过程中,我公司将密切关注进度情况,及时进行调整和优化,确保项目能够按时按质完成。 (1)项目启动与准备阶段(第1周至第2周) 第1周:确定项目目标、范围及预期成果。组建项目团队,明确团队成员职责。召开项目启动会议,进行项目介绍和动员。 第2周:制定详细的项目实施计划,包括各阶段任务、时间节点等。完成所需设备、软件及硬件的采购或租赁工作。确定古籍扫描、识别、转换等技术路线和方案。 (2)古籍扫描与图像处理阶段(第3周至第10周) 对9027筒子叶古籍进行扫描,确保扫描质量和分辨率符合要求。对扫描后的图像进行预处理,包括去噪、去水印、校正等操作。对图像进行分割、识别,提取古籍中的文字信息。 (3)文本识别与校对阶段(第1
图书馆体系建设项目古籍数字化整理加工技术方案120页.docx
下载提示

1.本文档仅提供部分内容试读;

2.支付并下载文件,享受无限制查看;

3.本网站所提供的标准文本仅供个人学习、研究之用,未经授权,严禁复制、发行、汇编、翻译或网络传播等,侵权必究;

4.左侧添加客服微信获取帮助;

5.本文为word版本,可以直接复制编辑使用。


公众号
微信客服