产品介绍

Product introduction

DataExa-Kamala 语义挖掘平台是渊亭科技自主研发的新一代文本处理和语义挖掘工具集。平台基于成熟自然语言处理算法、深度学习算法等打造, 并融合渊亭科技多年来在该领域的研究和积累。平台从对语料的资源管理、标注与出发,结合自然语言处理、深度学习等类型的模型、算法,挖掘出文本、 图像和视频等内容中有价值的语义信息,为客户供全栈的语义挖掘能力支持。

核心技术

Product technology

  • 成熟的语义挖掘能力持续升级工具(AIops)

  • 具有主动学习能力的数据标注工具

  • 内置大量自然语言处理预训练模型

  • 语义模型一键发布

  • 支持丰富的深度学习算法模型

  • 前沿优秀技术方案的无缝集成能力

产品优势

Product advantage

  • 全栈式语义处理

    提供一整套实现行业文本处理和语义挖掘的方法论和工具集,涵盖可视化数据标注、算法选择、模型训练全部环节
  • 深度学习与语言学深度结合

    基于最新深度学习技术和神经网络,提取海量文本数据的潜在语义特征,同时结合语言学进行句法语义、篇章文档等分析
  • 全面整合前沿优秀技术方案和数据集

    产品全面整合了各个应用场景下的优秀技术方案和数据集,包括BERT、PCNN+ATT、ULMFiT 等
  • 大规模降低人工标注工作

    运用自学习技术,在少量标注样本的情况下,进行 Fine Tune提升模型训练效果
  • 强大的自学习引擎

    产品内置了反馈系统收集使用信息,并自动转存标注数据并进行模型重新训练,达到“使用越久,精度越高”的自学习效果

客户案例

Customer case

某银行自然语言处理与智能问答系统
  • 客户名称:

    某四大行之一

  • 所属行业:

    金融

  • 客户痛点:

    客服问答只能解决高频问题(依赖人工标注关键词QA对),而非结构化数据搜索结果范围较大,无法实现精准问答

  • 应用成效:

    应用语义挖掘、知识图谱等技术为客户提供一个集日常问答、知识点抽取、知识图谱生成、语义挖掘、语音分析等功能为一体的智能问答机器人系统。精确定位用户所需要的提问知识,通过与系统用户进行交互,为系统用户提供个性化的信息服务

合作

文档