语义挖掘

DataExa-Kamala 语义挖掘平台是渊亭科技自主研发的新一代文本处理和语义挖掘工具集。平台基于成熟的自然语言处理算法、深度学习算法等打造，充分融合渊亭科技多年来在该领域的研究和积累。平台从对语料的资源管理、标注出发，结合自然语言处理、深度学习等类型的模型、算法，挖掘出文本、图像和视频等内容中有价值的语义信息，为客户供全栈的语义挖掘能力支持，进而支持复杂上层业务的开展。

申请试用

核心技术

Technology

成熟的语义挖掘能力持续升级工具

具有主动学习能力的数据标注工具

丰富的内置自然语言处理预训练模型

丰富的内置深度学习算法模型

语义模型一键发布

灵活的基础能力集成框架

产品优势

Advantage

全栈式语义处理

提供一整套实现行业文本处理和语义挖掘的方法论和工具集，涵盖可视化数据标注、算法选择、模型训练全部环节

PRODUCT ADVANTAGE

全栈式语义处理

提供一整套实现行业文本处理和语义挖掘的方法论和工具集，涵盖可视化数据标注、算法选择、模型训练全部环节

PRODUCT ADVANTAGE

深度学习与语言学深度结合

基于最新深度学习技术和神经网络，提取海量文本数据的潜在语义特征，同时结合语言学进行句法语义、篇章文档等分析

PRODUCT ADVANTAGE

深度学习与语言学深度结合

基于最新深度学习技术和神经网络，提取海量文本数据的潜在语义特征，同时结合语言学进行句法语义、篇章文档等分析

PRODUCT ADVANTAGE

全面整合前沿优秀技术方案和数据集

产品全面整合了各个应用场景下的优秀技术方案和数据集，包括BERT、PCNN+ATT、ULMFiT 等

PRODUCT ADVANTAGE

全面整合前沿优秀技术方案和数据集

产品全面整合了各个应用场景下的优秀技术方案和数据集，包括BERT、PCNN+ATT、ULMFiT 等

PRODUCT ADVANTAGE

小样本数据下的模型能力

运用自学习技术，在少量标注样本的情况下，仍然能够进行模型训练和应用

PRODUCT ADVANTAGE

小样本数据下的模型能力

运用自学习技术，在少量标注样本的情况下，仍然能够进行模型训练和应用

PRODUCT ADVANTAGE

功能完备的自学习引擎

内置反馈系统收集使用信息，并自动转存标注数据并进行模型重新训练，达到“使用越久，精度越高”的自学习效果

PRODUCT ADVANTAGE

功能完备的自学习引擎

内置反馈系统收集使用信息，并自动转存标注数据并进行模型重新训练，达到“使用越久，精度越高”的自学习效果

PRODUCT ADVANTAGE

客户案例

CASES

某银行自然语言处理与智能问答系统

客户名称：
某四大行之一
所属行业：
金融
客户痛点：
客服问答只能解决高频结构化问题（依赖人工标注关键词QA对），对于开放性非结构化问题处理困难，问答准确率难以提升。
应用成效：
应用语义挖掘、知识图谱等技术，为客户提供一个集日常问答、知识点抽取、知识图谱生成、语义挖掘、语音分析等功能为一体的智能问答机器人系统。精确定位用户所需要的实际知识，并围绕其进行扩展，提供个性化的信息服务。
推荐产品：
知识图谱
智能搜索
智能问答