elasticsearch - ElasticSearch 中字符串数组与串联字符串的内部结构-6ren

elasticsearch - ElasticSearch 中字符串数组与串联字符串的内部结构

In lại 作者：行者123 更新时间：2023-12-04 08:25:46

32

4

我试图更好地理解 ElasticSearch 的内部结构，所以我想知道 ElasticSearch 在内部计算以下两种情况的术语统计信息的方式是否存在任何差异。

第一种情况是当我有这样的文件时:

{
  "foo": [
    {
      "bar": "long string"
    },
    {
      "bar": "another long string"
    }
  ]
}

或者像这样的文档:

{
  "foobar": "long string another long string"
}

我的理解是第一个文档被扁平化为:

{
  "foo.bar": ["long string", "another long string"]
}

所以看起来问题真的是，第二个和第三个文档索引相同吗？术语统计计算是否相同？

1 Câu trả lời

有趣的问题!如果您索引第一个和第二个文档，然后查看 term vectorsvì foo.bar 字段，您会注意到频率和偏移量完全相同，但是位置不同。

原因与 position_increment_gap 有关。设置，其默认值为 100。引入此假间隙的原因是为了防止短语查询跨值匹配。

所以在第一个文档中，foo.bar 字段有多个值，正如您正确注意到的那样，这就是为什么术语位置与只有一个字符串的第二个文档不同的原因。

["long string", "another long string"]

这意味着如果您尝试使用 match_phrase 查询来匹配 string another，那么它不会匹配第一个文档，只会匹配第二个文档。

您仍然可以决定在第一个文档的映射中更改 position_increment_gap 的值并将其设置为 0，在这种情况下，两个文档的索引方式将完全相同。

关于elasticsearch - ElasticSearch 中字符串数组与串联字符串的内部结构，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/65271653/

32

4

0

Bài viết được đề xuất: javascript - 按年份过滤json数据

Bài viết được đề xuất: list - F# 整数列表中的排序子列表

Bài viết được đề xuất: firebase - Firebase 身份验证中被视为 API 限制的内容

Bài viết được đề xuất: generics - DryIoC 将参数传递给基于泛型类型参数的开放泛型服务的构造函数

PowerShell 串联
我正在尝试编写一行简单的代码，用于从各种服务器的 C 盘中删除各种用户文件。如何与 PowerShell 连接以获取到服务器的路径？例如，这就是我想要做的，但 PowerShell 没有将 + 符号
android - FFMPEG合并两个视频(串联)
我一直在尝试合并(连接)两个具有相同高度和宽度的 mp4 视频，但出现了一些错误。代码是: FFmpeg ffmpeg = FFmpeg.getInstance(EditVideoActivity.
postgresql - Postgres 串联
我正在尝试在 PostgreSQL 中进行简单的串联，但它不断抛出一条错误消息。我不明白我在这里做错了什么。 select concat('abcde', 'fgh'); No function ma
c - 串联/并联功能
我不知道如何从一个函数中获取两个变量，这是我的菜鸟尝试，这可能吗？如果可以，它是如何完成的？ #include float seriesParallel (float r1, float r2);/
c - 串联+ itoa的问题
我有以下代码: char stringHour[50], stringMinute[50], stringSecond[50]; // lots of code... itoa(hour, strin
java - 串联/不间断套接字编程
我是套接字编程的新手，我正在尝试使用 TCP 实现客户端服务器。客户端在 Windows 中用 Java 编写，服务器在 Tandem/Hp-NonStop 中用 C 编写。我能够连接并向服务器发送请
sql - 串联 - T-SQL
到目前为止，我有以下内容。 DECLARE @Table Table (ID int, Value1 varchar(50), Value2 varchar(50), Value3 varchar(5
elasticsearch - 字段的 Elasticsearch 串联
我是 Elasticsearch 的新手，想解决以下问题的用例我有一些格式如下的文件 { "member_id":"number" "e_id":"number", "c_id":"numbe
haskell - 批量(串联)延迟消耗日志文件行
我有这个功能来懒惰地观看日志文件... follow :: Handle -> IO [String] follow h = unsafeInterleaveIO $ do catch (do l
python - 为什么python多维列表乘法(串联)会出现这个错误？
这个问题已经有答案了: List of lists changes reflected across sublists unexpectedly (17 个回答) 已关闭 3 年前。我想创建一个没有
用于动态变量名称访问的字段名 + 参数值的 XSLT 串联
我们有一个 XML 文件，我们正试图找出一种动态使用的方法。基本知识是这样的: 100.00 110.00 120.00 130.00 对于我们拥有的每个零件，我们希望在其上使用 xslt 以
javascript - Vue.js - 串联
我有一个很奇怪的问题。下面的所有代码都工作正常: payload.modules.forEach(function(mod) { var modules_path = '..
C 预处理 Token 串联
如何使用 C 预处理自动生成以下代码模式(访问器)？ // Immutable accessor. const auto& member1 () const { return _member1;
javascript - 时间值的 Jquery 串联
我有时间值来自数据库:00:30:00 这是我的代码: var gdtesttime = ; // 00:30:00 console.log(gdtesttime); var a = gdt
mysql - 串联 ID 的串联值
数据库:MySQL 我有两张表，一张用于用户分配的角色，一张包含角色信息。我的问题是分配的角色存储在单个字段中，用逗号分隔。我需要构建一个按名称而非 ID 列出角色的报告，但仍位于由列分隔的单个字段中
audio - FFmpeg 串联，最终输出中没有音频
我在 ffmpeg 中使用以下命令，它会在视频开头添加 1 秒的黑帧。但是，我在输出视频中丢失了原始视频中的音频。我如何调整命令以确保原始音频与最终输出保持一致，或者更好的是，开头有 1 秒的“空白”
sql - 是否可以在一列上连接两个表 = 串联 2 列？
表 A 有 X 列，它是由表 B 中的 Y 列和 Z 列(均为 float )串联而成的 int。我想以类似于此的方式连接表 A 和 B: select * from tableA a inner j
python - fillna 与 None 串联
pd.Series([1,1,1,1, "something", 1]).astype(float).cumsum().fillna(None) 我想在上面的系列中用 None 填充 NaN，但它告诉
c# - FileDialog 过滤器 - LINQ 串联
在创建显示 OpenFileDialog/SaveFileDialog 的服务时，我正在考虑创建 LINQ 查询/清除 C# 代码到 Concatinate()/Join() 过滤表达式。根据这个调
ios - Swift 2 - 将字符串附加到字符串(串联)
我正在尝试从数组中提取值并将所有值连接到一个字符串中，如下所示 var ingredient: String for tag in tags { if let text = tag.titleL

trang đầu

đã học

Trí tuệ nhân tạo 6Ren

Trung tâm mua sắm

elasticsearch - ElasticSearch 中字符串数组与串联字符串的内部结构