在配置表时索引结构部分可以对向量索引进行高级配置,以下将详细说明这些高级版配置的参数含义。
在创建表时,第四步配置索引结构中,有关于向量索引的通用配置:
高级配置展开如下:
各配置说明如下:
配置 | 可选值 | 含义 |
向量维度 | - | 向量维度是指向量所具有的特征或属性的数量。向量维度的大小决定了向量所能表达的信息和特征的复杂程度。向量维度的配置需要根据用户的向量模型生成的向量进行配置。 |
距离类型 |
| 欧式距离向量得分越小越相关 内积距离向量得分越大越相关 |
向量索引算法 |
| 详情可参考:向量介绍 |
实时索引 |
| 选择true则表示开启实时索引,用户通过API推送的实时数据,实例可实时构建向量,以供实时查询 |
实时索引参数 | {"proxima.oswg.streamer.segment_size":2048} | 建议保持默认值 |
实时检索参数 | - | 不同的向量索引算法该参数的配置方式不同,详情可参考: |
向量分隔符 | 可自定义 | 向量检索时各维度使用的分隔符(如vector:'1.05066,0.15610,0.156145...' 其中分隔符为逗号) |
线性构建的阈值 | 默认为5000 | 表示数据量在5000以内用线性 |
忽略有问题的向量数据 |
| 当向量维度不正常,向量数据为空时,该参数配置为true,则不影响全量/批次增量数据的构建 |