科技让文物“活”起来

保护历史文化遗产就是记录和传承文明发展史

基于OCR技术的古籍数字化是保护文化遗产最佳措施之一

鹑火对各种婆罗米系文字、中国少数民族文字的人工智能OCR技术世界领先

鹑火使命

我们一直致力于“用科技及创新来传承和传播文化”
利用计算机视觉、神经网络和机器学习等AI技术,推动多种语言文字数字人文建设

行业领先

  • 全球首家柬埔寨高棉文识别

    高棉文是东南亚最古老最复杂的文字,鹑火与北京外国语大学深度合作,在全球首先实现高棉文OCR

  • 全球首家梵音藏文、藏文缩写合成字识别

    支持GB/T标准字符集、扩充集A、扩充集B三种标准收录的全部单字,额外支持了梵音藏文各种多层堆叠字和藏文缩写合成字

  • 全球首家藏文草体字识别

    基于66种藏文字体训练,支持楷书、草书、行书字体:乌金体、白徂体、朱匝体、徂仁体、徂同体、徂玛遒体等藏文字体。基于42种高棉文字体训练,支持Khmer OS、Moul、Metal Chrieng等高棉文字体

  • 多种书籍版式识别

    支持多种书籍版式的高精度识别,包括各种贝叶经、木刻版和手写本古籍(包括梵箧装、缝缋装、经折装、蝴蝶装、卷轴装等版式)及各种现代书籍。支持文字字体颜色识别和页眉页脚识别。支持页面倾斜校正、多合一排版自动拆页

  • 全球领先的数字
    图书馆系统

    提供视觉还原数字图书阅览器,支持全库书籍信息检索及内容全文搜索,多版本自动对勘,多种拉丁转写系统,智能校对系统,海量词库(超过四十万个藏文词汇和一万个藏文音节),智能分词系统,在线翻译系统

核心技术

  • 全球领先的多语言文字AI OCR引擎

    基于计算机视觉、神经网络、机器学习等AI核心技术,针对各种语言文字做高精度的OCR,包括中文、拉丁字母文字、婆罗米系文字(藏文、高棉文等),婆罗米系文字OCR技术已获得发明专利,专利号:ZL202210262353.3。

  • 强大丰富的OCR技术实现

    支持客户端识别和服务端识别,提供Server、SDK和命令行工具,支持Windows、Linux、Mac OS,支持CPU计算和GPU计算,基于36层神经网络,识别速度高达每页1秒,版式清晰、字体标准的书籍识别率接近100%

  • 全球领先的多层堆叠单字智能拆合字技术

    基于对藏文、高棉文的深度研究,通过将多层堆栈单字的所有组成部件进行智能拆分和独立识别,将其Unicode编码进行重组和合并得到单字完整编码,最终实现OCR支持所有藏文和高棉文的复杂单字

  • 国内外证件OCR及
    MRZ识别

    基于计算机视觉技术和MRZ规则智能分析,支持多国身份证件OCR及MRZ识别、支持多国护照OCR及MRZ识别、多国驾照OCR识别

  • 计算机视觉技术
    深度应用

    基于计算机视觉、神经网络和机器学习等AI技术实现的车牌识别、车辆照片的品牌型号识别、人脸识别、交通信号灯识别、交通指示牌识别、道路标识识别

合作伙伴