Tìm hiểu hoạt động hàng loạt chuỗi Elaticsearch của Index-6ren

Tìm hiểu các hoạt động hàng loạt của các chỉ mục Elaticsearch

In lại Tác giả: Tôi là chú chim nhỏ Thời gian cập nhật: 2023-08-15 14:31:33

26

4

Bài viết này đã được đưa vào Github. Bạn nên đọc Ghi chú ngẫu nhiên về Java.

Tài khoản công khai WeChat: Java Capriccio.

Xem trước rồi thích, tạo thành thói quen. Hãy like và sưu tầm, cuộc sống sẽ rực rỡ.

Truy vấn hàng loạt dựa trên mget
Thêm, xóa và sửa đổi hàng loạt dựa trên số lượng lớn
- Tăng
- xóa bỏ
- Ôn lại
đường dẫn lọc

Elaticsearch cung cấp API _mget và _bulk để thực hiện các thao tác hàng loạt, cho phép bạn thực hiện nhiều thao tác lấy/xóa/cập nhật/tạo chỉ mục trong một yêu cầu HTTP. Cách tiếp cận này hiệu quả hơn việc gửi một số lượng lớn các yêu cầu riêng lẻ.

Truy vấn hàng loạt dựa trên mget

mget (truy xuất nhiều tài liệu) là một API được cung cấp trong Elaticsearch, được sử dụng để truy xuất nhiều tài liệu từ cùng một chỉ mục hoặc các chỉ mục khác nhau cùng một lúc.

Ví dụ 1:

Sau đây là một ví dụ về hoạt động mget (thu thập nhiều tài liệu) của Elaticsearch. Trong ví dụ này, chúng tôi sẽ nhận được nhiều tài liệu có ID cụ thể trong chỉ mục test-index.

                        
                          NHẬN /test-index/_mget { "id": ["1", "2"] }

Trong yêu cầu trên, chúng tôi nhận được tài liệu có ID "1" và "2".

Ví dụ 2:

Bạn cũng có thể lấy tài liệu ở các chỉ mục khác nhau bằng cách chỉ định _index và _id của từng tài liệu:

                        
                          NHẬN /_mget { "docs": [ { "_index": "chỉ mục kiểm tra", "_id": "1" }, { "_index": "chỉ mục khác", "_id": "2" } ] }

Trong yêu cầu này, chúng tôi nhận được tài liệu có ID "1" từ chỉ mục "chỉ mục kiểm tra" và tài liệu có ID "2" từ chỉ mục "chỉ mục khác".

Ví dụ ba:

Trong ví dụ về Elaticsearch mget (tìm nạp nhiều tài liệu) sau đây, chúng tôi sẽ tìm nạp tài liệu từ hai chỉ mục khác nhau và chỉ trả về các trường cụ thể:

                        
                          NHẬN /_mget { "docs": [ { "_index": "test-index-1", "_id": "1", "_source": ["field1", "field2"] }, { "_index": "test-index-2", "_id": "2", "_source": "field3" } ] }

Trong yêu cầu này, chúng tôi nhận được tài liệu có ID "1" từ chỉ mục "test-index-1" và chỉ trả về các trường "field1" và "field2". Đồng thời, chúng tôi lấy tài liệu có ID "2" từ chỉ mục "test-index-2" và chỉ trả về trường "field3".

Lọc nguồn (_source) có thể được sử dụng để giới hạn các trường được trả về. Bạn có thể cung cấp danh sách các trường hoặc một trường duy nhất. Lưu ý rằng nếu trường bạn yêu cầu không tồn tại, nó sẽ không xuất hiện trong phản hồi.

Thêm, xóa và sửa đổi hàng loạt dựa trên số lượng lớn

Định dạng cơ bản của số lượng lớn như sau:

                        
                          POST //_bulk {"hành động": {"siêu dữ liệu"}} {"dữ liệu"}

Api số lượng lớn có các yêu cầu nghiêm ngặt về cú pháp json. Ngoại trừ việc xóa, mỗi thao tác yêu cầu hai chuỗi json (siêu dữ liệu và dữ liệu doanh nghiệp) và mỗi chuỗi json không thể được ngắt dòng. một lỗi.

Trong các hoạt động hàng loạt, nếu bất kỳ hoạt động nào không thành công, nó sẽ không ảnh hưởng đến các hoạt động khác, nhưng nhật ký ngoại lệ sẽ được thông báo trong kết quả trả về.

Tăng

                        
                          POST /_bulk { "create" : { "_index" : "product2", "_id" : "2" } } { "field1" : "value1", "field2" : "value2" }

Trong yêu cầu này, chúng tôi tạo một tài liệu mới có ID "2" trong chỉ mục "product2" và chứa hai trường "field1" và "field2".

Lưu ý rằng thao tác này bao gồm hai hàng: hàng đầu tiên chứa loại thao tác ("tạo" trong ví dụ này) và hàng thứ hai chứa dữ liệu tài liệu thực tế sẽ được tạo hoặc lập chỉ mục.

xóa bỏ

Để xóa tài liệu, ES sử dụng cơ chế xóa lười để xóa tài liệu, tức là đánh dấu xóa (nguyên tắc xóa lười).

                        
                          POST /_bulk { "xóa" : { "_index" : "chỉ mục kiểm tra", "_id" : "1" } } { "xóa" : { "_index" : "chỉ mục kiểm tra", "_id" : "2" } }

Trong yêu cầu này, chúng tôi đã xóa hai tài liệu có ID "1" và "2" khỏi chỉ mục "test-index".

Lưu ý rằng mỗi thao tác xóa chỉ bao gồm một hàng, chứa loại thao tác ("xóa" trong ví dụ này) và siêu dữ liệu.

Ôn lại

                        
                          POST /_bulk { "cập nhật" : { "_index" : "test-index", "_id" : "1" } } { "doc" : { "field1" : "new_value1", "field2" : "new_value2" }} { "cập nhật" : { "_index" : "test-index", "_id" : "2" } } { "doc" : { "field1" : "new_value3", "field2" : "new_value4" }}

Trong yêu cầu này, chúng tôi đã cập nhật hai tài liệu trong chỉ mục "test-index":

Chúng tôi đã cập nhật tài liệu có ID "1" và đặt giá trị của trường "field1" và "field2" thành "new_value1" và "new_value2".
Chúng tôi cũng đã cập nhật tài liệu có ID "2", đặt giá trị của trường "field1" và "field2" thành "new_value3" và "new_value4".

đường dẫn lọc

Trong Elaticsearch, tham số filter_path được sử dụng để lọc nội dung phản hồi được trả về và có thể được sử dụng để giảm lượng dữ liệu được Elaticsearch trả về. Khi bạn chỉ định một hoặc nhiều đường dẫn, đối tượng JSON được trả về sẽ chỉ chứa các khóa trong các đường dẫn này. Nó chấp nhận một danh sách được phân tách bằng dấu phẩy chứa các đường dẫn trong đối tượng JSON mà bạn muốn trả về. Tham số này hỗ trợ khớp ký tự đại diện ( * ) và khớp phần tử mảng ( [] ). Ví dụ:

                        
                          POST /_bulk?filter_path=items.*.error

Filter_path=items.*.error trong yêu cầu trên sẽ khiến Elaticsearch chỉ trả về thông tin lỗi trong kết quả lệnh gọi API _bulk. items.*.error Đường dẫn này cho biết rằng trong phản hồi được trả về, tất cả các mục có trường lỗi đều được khớp.

Có hai lợi ích chính khi làm điều này:

Nó có thể cải thiện hiệu suất của Elaticsearch vì ít dữ liệu hơn đồng nghĩa với việc tuần tự hóa và giải tuần tự hóa nhanh hơn.
Nó giúp bạn tập trung vào những phần quan tâm mà không phải xử lý những dữ liệu không liên quan.

Lưu ý rằng * là ký tự đại diện và đại diện cho bất kỳ giá trị nào.

Dưới đây là một số ví dụ về filter_path khác:

filter_path=đã lấy : Yêu cầu này chỉ trả về thời gian (tính bằng mili giây) cần thiết để thực hiện yêu cầu.
filter_path=items._id,items._index : Yêu cầu này chỉ trả về _nhận dạng Và _chỉ mục cánh đồng.
filter_path=items.*.lỗi : Yêu cầu này sẽ trả về tất cả các mục có chứa lỗi Các mặt hàng của lĩnh vực này.
filter_path=lượt truy cập.lượt truy cập._nguồn : Yêu cầu này chỉ trả về nội dung tài liệu gốc từ kết quả tìm kiếm.
filter_path=_shards, hits.total : Yêu cầu này trả về thông tin về mảnh vỡ thông tin và tổng số lượt truy cập.
filter_path=tổng hợp.*.giá trị : Yêu cầu này chỉ trả về các giá trị cho mỗi tổng hợp.

Xin lưu ý rằng nếu bạn chỉ định nhiều trường trong filter_path, bạn cần phân tách chúng bằng dấu phẩy.

Đó là tất cả cho bài viết này. Cảm ơn bạn đã đọc. Nếu có bất kỳ sai sót hoặc đề xuất nào trong blog này, vui lòng để lại tin nhắn để tôi sửa chữa.

Có lợi ích gì không? Mong rằng Lão Thiết sẽ nghĩ ra bài viết này và để nhiều bạn sinh viên xem bài viết này và truyền cảm hứng cho mình nhé, hehe.

Các cựu chiến binh hãy theo dõi tài khoản công khai WeChat của tôi "Java Capriccio", tài khoản này tập trung vào công nghệ chia sẻ. Các bài viết được cập nhật liên tục. Bạn có thể theo dõi tài khoản công khai để đọc trong thời gian sớm nhất.

Một người có thể đi nhanh nhưng một nhóm người có thể đi xa hơn. Hãy theo dõi tôi, cùng học hỏi và cùng phát triển! .

Cuối cùng, bài viết này về việc tìm hiểu hoạt động hàng loạt của chỉ mục chuỗi Elaticsearch có ở đây. Nếu bạn muốn biết thêm về việc tìm hiểu hoạt động hàng loạt của chỉ mục chuỗi Elaticsearch, vui lòng tìm kiếm bài viết CFSDN hoặc tiếp tục duyệt qua các bài viết liên quan. tất cả các bạn hãy ủng hộ blog của tôi trong tương lai! .

26

4

0

Đề xuất bài viết: Thực hành chiến đấu: xử lý các vấn đề đồng thời trong công việc

Đề xuất bài viết: Hãy là người đầu tiên trải nghiệm nó! AnchorPositioning neo định vị siêu mạnh

Đề xuất bài viết: [opencv] Nhận dạng hình ảnh truyền thống: thực hành nhận dạng người đi bộ hog+svm

Đề xuất bài viết: Liên kết nền combobox

java - Hoạt động của Struts2 > JSP > Hoạt động
Tôi đang cố gắng thực hiện điều này Trong hành động của tôi, hãy lấy danh sách các đối tượng từ cơ sở dữ liệu (ok) In trên JSP (ok) Danh sách này xuất hiện dưới dạng bảng có thể chỉnh sửa trong JSP. Tôi muốn sửa đổi và sau đó gửi nó trở lại hoạt động tương tự để lưu nó vào cơ sở dữ liệu của tôi (không thành công. Khi tôi sử dụng
linq - Truy vấn lồng nhau không được hỗ trợ. Hoạt động 1 ='UnionAll' Hoạt động 2 ='MultiStreamNest'
Tôi có một truy vấn Linq to Entities có dạng: var x = from a in SomeData trong đó ... một số điều kiện ... chọn
c# - Truy vấn lồng nhau không được hỗ trợ. Hoạt động 1 ='UnionAll' Hoạt động 2 ='MultiStreamNest'
Tôi có truy vấn sau đây. var query = Repository.Query() .Where(p => !p.IsDeleted && p.Article.ArticleSections.Cou
Jtable ListSelectionListener không phản hồi với các hoạt động của jtable mà với một hoạt động jtable khác trong cùng một lớp
Tôi đang viết một gói ứng dụng chứa một lớp chính với phương thức chính tách biệt với lớp GUI, lớp GUI chứa một jframe với jtabbedpane, nó có hai tab, tab đầu tiên chứa một jtable có tên là jtable1, không.
c# - Mảng lồng nhau và toán tử ternary trong LINQ. Truy vấn lồng nhau không được hỗ trợ. Hoạt động 1 ='Trường hợp' Hoạt động 2 ='Thu thập'
Đoạn mã sau tạo ra lỗi Truy vấn lồng nhau không được hỗ trợ. Operation1='Case' Operation2='Collect' Câu hỏi là tôi đang làm gì sai? Làm thế nào tôi có thể giải quyết nó?
Hoạt động C# trong Redis Sentinel
Tôi đã thiết lập môi trường docker cục bộ cho cụm redis HA (2 bản sao, 1 bản chính, 3 điểm canh gác). Chỉ Sentinel hiển thị các cổng (10021, 10022, 10023). Tôi đang sử dụng stackexchange
Ngày toán/hoạt động trong bộ lọc mẫu chất lỏng
Tôi đang xây dựng "URL tích hợp" trong Desk.com sử dụng cú pháp bộ lọc mẫu Shopify Liquid. Đối với truy vấn có ngày bắt đầu 7 ngày trước và ngày kết thúc bây giờ, URL cần chứa "ngày bắt đầu" và "ngày kết thúc"
Tại sao Python không hỗ trợ các hoạt động i++/i--?
Chắc hẳn bạn đã nghĩ về điều đó. Tuy nhiên, tình huống này không lý tưởng. Trong python, chỉ có thể sử dụng các thao tác như i++/i--. Thao tác tăng tự động trong python Đoạn mã sau được hầu hết các lập trình viên sử dụng phổ biến để thực hiện các thao tác tăng (trừ) tự động trong python
Hành động GitHub - Hiển thị tên chi nhánh dưới dạng tên bản dựng
Tôi cần hiển thị các nhánh trong mọi bản dựng thủ công bằng hành động github. Ví dụ: https://gyazo.com/2131bf83b0df1e2157480e5be842d4fb Tôi nên hiển thị các nhánh thay vì một nhánh. câu trả lời hay nhất
Perl qr//hoạt động
Tôi có câu hỏi về toán tử Perl qr: #!/usr/bin/Perl -w &mysplit("a:b:c", /:/); sub mysplit { my($str, $patt
uml - Hoạt động ArgoUML
Tôi đã tạo ERD (Sơ đồ mối quan hệ thực thể) bằng ArgoUML và tôi muốn tạo hai thao tác trong một lớp, cả hai đều có kiểu trả về void. Tuy nhiên, tôi chỉ có thể tạo một thao tác trả về kiểu void. Ví dụ: Tôi có thể đặt cuốn sách
Hành động của Github về yêu cầu kéo và nhánh chính
Các hành động trên Github vẫn đang trong giai đoạn thử nghiệm và khá mới, nhưng tôi hy vọng ai đó có thể trợ giúp. Tôi nghĩ có thể chạy các hành động github trên nhánh chính và kéo các yêu cầu như thế này: on: pull_request push: b
Hành động Twilio để ghi âm
Tôi đang cố gắng tạo quy trình làm việc Twilio để thực hiện cuộc gọi điện thoại và ghi lại những gì người dùng nói. Tôi đang sử dụng Bản ghi cho việc này nhưng tôi không chắc nên đặt gì vào tham số hành động. Mặc dù tôi biết Twilio sẽ gửi thông tin về việc gọi tới UR
Bộ đệm stencil OpenGL HOẶC hoạt động?
Tôi không chắc liệu điều này có khả thi hay không, nhưng nó đáng để thử. Tôi đang sử dụng bộ đệm stencil để giảm lượng ánh sáng rút quá nhiều (khi máy ảnh ở ngoài âm lượng) trong trình kết xuất bị trì hoãn bằng thuật toán này: Sử dụng trình đổ bóng rẻ tiền, đặt bài kiểm tra độ sâu thành LEQUAL Vẽ mặt sau, đánh dấu chúng theo khuôn
Các hành động GitHub để sao chép và đổi tên tệp
Có cách thông minh nào để sao chép và đổi tên tệp qua GitHub không? Tôi muốn sao chép một số tệp readme vào thư mục /docs (:= cùng một kho lưu trữ, không phải từ xa!) và chúng sẽ được đổi tên theo nội dung chính của chúng
Hoạt động CSV của PowerShell
Tôi có tệp .csv trong đó cột đầu tiên chứa tên người dùng. Họ có dạng FirstName LastName. Tôi muốn lấy FirstName và thêm ký tự đầu tiên của LastName vào đó rồi xóa khoảng trắng. Chạy
Sitecore - URL hành động
Sitecore tạo URL dựa trên tên dự án được xác định trong cây Sitecore, http://samplewebsite/Pages/Sample Page nhưng khách hàng của chúng tôi quan tâm đến việc hạ thấp tất cả các URL (Trang/Trang mẫu
Hành động của Angularjs khi nhấp vào nút
Tôi đang cố gắng thực hiện một số phép tính nhưng khi tôi nhập số tiền thì nó sẽ hoàn thành. Tôi chỉ muốn điều này xảy ra bằng cách nhấp vào nút thay vì tự động. Những gì tôi đã làm cho đến nay: Angular JS - Programming-fr
thao tác github để sao chép tập tin từ kho này sang kho khác
Công ty của tôi đã tạo ra một cách phức tạp để di chuyển tệp giữa các môi trường và bây giờ chúng tôi muốn di chuyển một số tệp JS đã xây dựng (được chuyển đổi và rút gọn) từ kho lưu trữ github này sang kho lưu trữ github khác. Điều này có thể thực hiện được bằng cách sử dụng các hành động của github không? Câu trả lời hay nhất là đơn giản nhất
java - Hoạt động JSONArray
Trong mã của tôi, tôi tạo một đối tượng JSONArray. Và đã thêm hai JSONObject vào đối tượng JSONArray. Tôi đang sử dụng json-simple-1.1.jar. Mã của tôi là gói j

trang đầu

đã học

6Ren AI

Trung tâm mua sắm