Trace Id is missing
Microsoft
Azure
主页
主页
产品/服务
实在Agent(智能体)
实在Agent(智能体)
产品介绍
RPA应用安心交付
TRS拓天大模型
TRS拓天大模型
产品介绍
大模型应用工程化服务
TRS海贝向量数据库
TRS海贝向量数据库
产品介绍
轻量化数据服务
政企案例
政企案例
审批数字员工
AI智能问答
舆情管理与决策优化
智慧警务
统计数字员工
知识产权大数据应用
更多案例
行业资讯
联系我们
搜索
显示搜索输入
无结果
取消
TRS海贝搜索(向量)数据库
“海贝”是一款从内核到系统完全国产自研的搜索型数据库,其定位为大数据应用支撑软件,为大数据应用提供高效的数据存储、信息检索、统计分析等数据管理服务,支持几乎所有类型的数据,包括文本、数字、地理空间、图片等各种结构化、半结构化和非结构化数据。该系统吸收了TRS在信息检索和NLP领域多年的技术积累,不仅安全、高效、专业,还集成了众多开源检索系统不具备的企业级功能,能够有效降低用户的系统建设成本、开发成本和运维成本。
产品功能
全语种分词器
海贝自带TRS分词器,不仅支持中日韩等方块文字,也能处理英法德等拉丁语系,还可处理藏文、蒙文、维文等少数民族语言,真正做到单一分词器处理全部语种,大大简化系统开发和运维工作。
用户隔离
海贝具有其他同类产品不具备的用户隔离安全特性,支持用户数据的物理隔离和逻辑隔离,既可以解决多租户之间的访问安全,又可以防止用户之间的相互影响,提高系统的可用性。
冷热分区
海贝自带分时归档视图,不仅可实现冷热数据自动分区,同时支持多种存储混合使用以提供高效的检索服务。
镜像数据库
用户可通过简单配置实现读写分离、大小库以及访问隔离等,大大降低数据加工和查询之间的CPU、内存、IO等冲突,避免数据入库导致的检索卡顿。
深度检索
集成深度学习引擎,支持以文搜图、以图搜图、图文融合搜索,可对图像中的文字进行OCR识别,也可提取图像或者文本特征数据,通过基因编码存储到海贝数据库,实现图像相似性检索,配合拼音检索、同音词检索等功能,让不法分子无处遁形。
向量搜索
引入最小世界导航图(Hierarchical Navigable Small World,HNSW),实现向量数据高效检索。在单机可以支持亿级向量,达到毫秒级响应。
检索增强生成
检索增强生成(Retrieval-Augmented Generation,RAG)是解决大模型幻觉的有效手段之一。基于海聚数据整合系统(TRS ETL)、拓天大模型及TRS海贝搜索(向量)数据库构建的检索增强生成解决方案,具有集成度高,生成效果好等特点。
产品优势
自主可控
从底层分词算法到核心引擎以及上层系统都完全自研的纯国产搜索引擎数据库,完成与国产芯片、国产操作系统的适配。
数据安全
多副本、数据校验、WAL技术、加密存储、黑白名单、用户隔离、删除保护等技术和机制多重保障数据安全,支持数据与索引完全加密。
高性能检索
引入内存索引、列存储、索引分片等技术,提高数据存储、检索和分析效率。
易用性
全中文可视化系统管理台,支持自动化部署和自动化更新。
聚焦生态链
可以与TRS各款产品深度应用集成,打造强大的数据服务能力。
兼容性
完成ElasticSearch绝大部分功能的支持,API访问做兼容性处理,为国产替代扫清最后障碍。
应用行业
公共安全:数据量大、实时更新,提供一键搜索、数据分析等功能。
政务公开:利用单一分词器处理全语种数据,简化系统构建,提供跨语种检索。
媒体融合:面向媒体网站支撑高并发检索。
客户案例
信用中国
“信用中国”网站由国家发展改革委、人民银行指导,国家信息中心主办,提供全国企业信用信息、信用代码、以及相关站内文章的公开查询服务。2018年网站将原由ElasticSearch提供得搜索服务迁到海贝搜索(向量)数据库。系统采用12台高配PC服务器搭建检索集群,平均每秒提供约1.2W次检索服务,日均检索量突破10亿。
中国知识产权大数据与智慧服务系统
中国知识产权大数据与智慧服务系统(DIlnspiro™)由知识产权出版社有限责任公司开发建设的国内第一个知识产权大数据应用服务系统,整合国内外专利、商标、法律文书、标准和科技期刊等知识产权数据资源,实现数据检索、分析、关联、预警和项目管理等。系统利用海贝搜索(向量)数据库在多语言处理方面的优势,实现中、英、日多语种无差别、无障碍智能扩展检索和及时统计分析。
<
>