书籍数字化系统

书籍数字化系统是鹑火的核心产品。我们自研了全球领先的AI OCR引擎,使用计算机视觉、神经网络、机器学习等全新AI技术,实现对各类书籍文献的高精度OCR。
  • 支持多种书籍版式,包括各种贝叶经、木刻版和手写本古籍(包括梵箧装、缝缋装、经折装、蝴蝶装、卷轴装等版式)及各种现代书籍版式
  • 支持多种语言文字,包括中文(简体、繁体)、拉丁字母文字(英文、法文、德文、西班牙文、意大利文、越南文、马来文、印尼文、巴利文等)、婆罗米系文字(藏文和高棉文等)
  • 支持多种文字字体(藏文:包括各种楷书、草书、行书字体,例如乌金体、白徂体、朱匝体、徂仁体、徂同体、徂玛遒体等。高棉文:包括Khmer OS、Moul、Metal Chrieng等多种字体)
  • 支持婆罗米系文字(例如藏文、高棉文)中的多层堆叠单字(通过对单字的所有组成部件进行拆分和独立识别,将识别结果的Unicode编码进行重组和合并,进而得到单字的完整编码)
  • 计划支持满文(新旧满文及其阿礼嘎礼)、蒙古文(传统回鹘体胡都木文及其阿礼嘎礼、卡尔梅克-卫拉特托忒文及其阿礼嘎礼)、梵文(天城体、悉昙体、兰札体及西藏兰札体)和其它婆罗米系文字(孟加拉文、缅甸文、僧伽罗文、泰米尔文、泰文、老挝文、傣泐-兰纳文等)

数字图书馆系统

数字图书馆系统的主要功能包括:
  • 数字化书籍的编目、OCR(对接AI OCR平台)、校对、上下架管理
  • 文字校对,支持词法规则检测、单词拼写错误检测、藏文音节检测、藏文缩写合成字检测
  • 多版本对勘,针对同一部书的多种版本,程序自动进行全文逐字比对,生成对勘本
  • 用户分组和阅读权限管理,可以为每部书籍设置各用户分组的阅读权限
  • 用户端提供局域网内版本和云平台版本两种使用模式
  • 支持网站、客户端软件(支持Mac OS和Windows系统)两种访问模式
  • 图书阅览器精准视觉还原原书页面版式、字体样式风格,完美实现图文混排
  • 四种阅览方式:书籍原图(鼠标点击可以复制单句文本)、数字文本(视觉还原显示和按句显示)、拉丁转写(支持多种转写系统)、在线翻译(支持多种翻译平台)
  • 支持按标题、摘要、关键字等进行全库书籍信息检索和内容全文搜索
  • 支持海量词库(超过四十万个藏文词汇和一万个藏文音节)、智能分词和关键词输入联想
  • 硬件灵活配置,可以选择本地电脑、内网服务器或云服务器,按需求配置显卡和CPU、高拍仪或扫描仪

证件OCR系统

采用先进的图像处理算法,结合实际运用场景,针对拍摄距离、角度、光照等引起的图像变形做优化处理,系统识别速度快、精度高。支持多个国家的多种证件,包括:身份证、驾照、护照等。

在线OCR服务

基于计算机视觉、神经网络、机器学习等AI核心技术,针对书籍图片做高精度的文字识别。目前系统开放语言:藏文、高棉文。

在线咨询

扫码联系企业微信客服

或 Email咨询

info@chunhuo.net