Trace Id is missing
Azure

TRS海贝搜索(向量)数据库

“海贝”是一款从内核到系统完全国产自研的搜索型数据库,其定位为大数据应用支撑软件,为大数据应用提供高效的数据存储、信息检索、统计分析等数据管理服务,支持几乎所有类型的数据,包括文本、数字、地理空间、图片等各种结构化、半结构化和非结构化数据。该系统吸收了TRS在信息检索和NLP领域多年的技术积累,不仅安全、高效、专业,还集成了众多开源检索系统不具备的企业级功能,能够有效降低用户的系统建设成本、开发成本和运维成本。

产品功能

  • 海贝自带TRS分词器,不仅支持中日韩等方块文字,也能处理英法德等拉丁语系,还可处理藏文、蒙文、维文等少数民族语言,真正做到单一分词器处理全部语种,大大简化系统开发和运维工作。
  • 海贝具有其他同类产品不具备的用户隔离安全特性,支持用户数据的物理隔离和逻辑隔离,既可以解决多租户之间的访问安全,又可以防止用户之间的相互影响,提高系统的可用性。
    一个人穿着鞋子在滑滑板,进行街头特技表演,在户外靠墙保持平衡
  • 海贝自带分时归档视图,不仅可实现冷热数据自动分区,同时支持多种存储混合使用以提供高效的检索服务。
    一家店铺的内部景象,前景中叠加有“空间分析”字样。
  • 用户可通过简单配置实现读写分离、大小库以及访问隔离等,大大降低数据加工和查询之间的CPU、内存、IO等冲突,避免数据入库导致的检索卡顿。
    文件上传选项、营养成分标签、每份食用量、热量、总脂肪、胆固醇、钠含量列表
  • 集成深度学习引擎,支持以文搜图、以图搜图、图文融合搜索,可对图像中的文字进行OCR识别,也可提取图像或者文本特征数据,通过基因编码存储到海贝数据库,实现图像相似性检索,配合拼音检索、同音词检索等功能,让不法分子无处遁形。
    一位棕色头发的女性拿着平板电脑。
  • 引入最小世界导航图(Hierarchical Navigable Small World,HNSW),实现向量数据高效检索。在单机可以支持亿级向量,达到毫秒级响应。
    显示模型训练详细信息、状态“成功”以及评估性能指标的 Azure Vision Studio 屏幕截图
  • 检索增强生成(Retrieval-Augmented Generation,RAG)是解决大模型幻觉的有效手段之一。基于海聚数据整合系统(TRS ETL)、拓天大模型及TRS海贝搜索(向量)数据库构建的检索增强生成解决方案,具有集成度高,生成效果好等特点。
    带有桌椅的玻璃穹顶室

产品优势

自主可控

从底层分词算法到核心引擎以及上层系统都完全自研的纯国产搜索引擎数据库,完成与国产芯片、国产操作系统的适配。

数据安全

多副本、数据校验、WAL技术、加密存储、黑白名单、用户隔离、删除保护等技术和机制多重保障数据安全,支持数据与索引完全加密。

高性能检索

引入内存索引、列存储、索引分片等技术,提高数据存储、检索和分析效率。

易用性

全中文可视化系统管理台,支持自动化部署和自动化更新。

聚焦生态链

可以与TRS各款产品深度应用集成,打造强大的数据服务能力。

兼容性

完成ElasticSearch绝大部分功能的支持,API访问做兼容性处理,为国产替代扫清最后障碍。

应用行业

公共安全:数据量大、实时更新,提供一键搜索、数据分析等功能。 
政务公开:利用单一分词器处理全语种数据,简化系统构建,提供跨语种检索。
媒体融合:面向媒体网站支撑高并发检索。

客户案例