python - Tìm kiếm nhị phân cho lần xuất hiện đầu tiên trong danh sách từ điển

python - 字典列表中第一次出现的二进制搜索

In lại Tác giả: Vũ trụ không gian 更新时间：2023-11-04 00:13:03

Vì vậy, tôi đang xử lý tập dữ liệu lớn, n>1000000. Dữ liệu chứa thông tin đặt hàng về các mặt hàng. Thứ tự ở định dạng JSON chứa một tệp có tên is_buy_order giá trị bool. Tôi muốn chia danh sách đơn hàng thành hai danh sách riêng biệt tùy thuộc vào giá trị bool có ĐÚNG VẬY 还是 SAI.

Tôi đã nghĩ ra một thuật toán có sai sót nhưng nhanh hơn việc lặp lại.

Thuật toán chia tập dữ liệu làm đôi bằng cách chọn một trục rồi kiểm tra một trong hai bên để xác định bên nào gần điểm chuyển tiếp hơn (SAI -> ĐÚNG VẬY) .Nó tiếp tục giảm một nửa cho đến khi các giá trị ở cả hai phía của trục quay khác nhau hoặc trục == 1 Cho biết không có thay đổi.

bắt đầu = thời gian.time()
order_file = open("resources/khu vực/"+x.replace(" ", "")[1:-1]+".json", 'r')
đơn hàng = order_file.readlines()
order_file.close()


item_buy, item_sell = [], []

Pivot_found = Sai
print(len(đơn hàng))

nếu len(đơn đặt hàng) > 1:
    trong khi không phải là Pivot_found:
        temp_orders = đơn hàng
        trục = len(temp_orders)//2

        nếu trục == 1:
            break

        if json.loads(orders[pivot].replace("\n", ""))["is_buy_order"]:
            đơn hàng = đơn hàng[:pivot]
            buy_sell_index -= trục
        khác:
            đơn hàng = đơn hàng[trục:]

        if json.loads(temp_orders[pivot].replace("\n", ""))["is_buy_order"] != json.loads(temp_orders[pivot-1].replace("\n", "")) ["is_buy_order"]:
            Pivot_found = Đúng


item_buy, item_sell = temp_orders[:pivot], temp_orders[pivot:]
buy_sell_index = order.index(item_sell[0])
print(x, time.time()-start, buy_sell_index)

Đây là nội dung của một tập dữ liệu bị giảm nghiêm trọng:

{"duration":90,"is_buy_order":false,"issued:"2018-06-09T01:52:42Z","location_id":1027547438558,"min_volume":1,"order_i d":5180297455,"giá":16000.0,"phạm vi":"40","system_id":30001811,"type_id":28362,"volume_remain":892,"volume_total":892}
{"duration":90,"is_buy_order":false,"issued:"2018-06-09T01:53:11Z","location_id":1027547438558,"min_volume":1,"order_i d":5180297673,"giá":100000.0,"phạm vi":"40","system_id":30001811,"type_id":28366,"volume_remain":907,"volume_total":907}
{"duration":90,"is_buy_order":false,"issued:"2018-06-09T01:53:42Z","location_id":1027547438558,"min_volume":1,"order_i d":5180297903,"giá":100000.0,"phạm vi":"40","system_id":30001811,"type_id":21815,"volume_remain":906,"volume_total":906}
{"duration":90,"is_buy_order":true,"issued:"2018-08-03T01:50:59Z","location_id":1027954902335,"min_volume":1,"order_id ":5191398100,"giá":4.0,"phạm vi":"5","system_id":30001780,"type_id":34,"volume_remain":10000000,"volume_total":10000000}
{"duration":90,"is_buy_order":true,"issued:"2018-08-05T07:30:18Z","location_id":1028168079013,"min_volume":1,"order_id ":5221892906,"giá":2250000.0,"phạm vi":"4","system_id":30001748,"type_id":25615,"volume_remain":100,"volume_total":100}
{"duration":90,"is_buy_order":true,"issued:"2018-07-21T05:23:37Z","location_id":1022958758740,"min_volume":1,"order_i d":5211030090,"giá":185.0,"phạm vi":5","system_id":30001786,"type_id":204,"volume_remain":40000,"volume_total":40000}
{"duration":90,"is_buy_order":true,"issued:"2018-08-05T07:31:23Z","location_id":1028168079013,"min_volume":1,"order_i d":5221893610,"giá":6000.0,"phạm vi":"4","system_id":30001748,"type_id":25616,"volume_remain":1000,"volume_total":1000}
{"duration":90,"is_buy_order":true,"issued:"2018-08-05T07:27:50Z","location_id":1028168079013,"min_volume":1,"order_id ":5221891669,"giá":1150000.0,"phạm vi":"4","system_id":30001748,"type_id":25619,"volume_remain":200,"volume_total":200}
{"duration":90,"is_buy_order":true,"issued:"2018-07-22T17:46:06Z","location_id":1022958758740,"min_volume":1,"order_id ":5212328909,"giá":12.0,"phạm vi":"5","system_id":30001786,"type_id":211,"volume_remain":1000000,"volume_total":1000000}
{"duration":30,"is_buy_order":true,"issued:"2018-07-19T22:18:58Z","location_id":1028168079013,"min_volume":1,"order_ id":5210158811,"giá":2000000.0,"phạm vi":"5","system_id":30001748,"type_id":16278,"volume_remain":3,"volume_total":3}
{"duration":90,"is_buy_order":true,"issued:"2018-08-05T07:32:18Z","location_id":1028168079013,"min_volume":1,"order_id ":5221894118,"giá":65000.0,"phạm vi":"4","system_id":30001748,"type_id":25606,"volume_remain":1000,"volume_total":1000}

Có thể thực hiện điều này nếu tập dữ liệu yêu cầu định dạng mới.

câu trả lời hay nhất

chia đôi Các mô-đun có cách để thực hiện việc này. Bản thân nó không hỗ trợ chức năng quan trọng nhưng bạn có thể thêm trình bao bọc xung quanh danh sách của mình:

từ bisect nhập bisect

danh sách của tôi = [
    {"is_buy_order": Sai},
    {"is_buy_order": Sai},
    {"is_buy_order": Sai},
    {"is_buy_order": Sai},
    {"is_buy_order": Đúng},
    {"is_buy_order": Đúng},
    {"is_buy_order": Đúng},
    {"is_buy_order": Đúng},
    {"is_buy_order": Đúng},
    {"is_buy_order": Đúng}
]


lớp KeyFuncWrapper(đối tượng):
    def __init__(self, iterable, key):
        self.it = có thể lặp lại
        self.key = key

    def __len__(self):
        trả về len(self.it)

    def __getitem__(self, i):
        trả về self.key(self.it[i])


# in 4
in(chia đôi(
    KeyFuncWrapper(my_list, lambda x: x["is_buy_order"]),
    Sai, # giá trị cho hình chia đôi cần tìm
))

Điều này hoạt động vì bisect sẽ nhìn vào KeyFuncWrapper Phần tử thứ i của , bản thân nó xem xét ứng dụng của hàm chính trên phần tử thứ i của danh sách.

Về python - Tìm kiếm nhị phân cho lần xuất hiện đầu tiên trong danh sách từ điển, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/51821908/

Bài viết khuyến nghị: Làm cách nào để sử dụng pyqt4 với các phiên bản python và spyder hiện tại?

Bài viết khuyến nghị: node.js - npm安装jdbc出错

Bài viết khuyến nghị: json - 将 IMAP + mailparser 返回对象解析为 JSON

Bài viết khuyến nghị: python - SDK doanh nghiệp của Facebook: không thể tạo quảng cáo

java - 多字段子集合中的 Hibernate 搜索/lucene 搜索
我在我的应用程序中使用 Hibernate Search。其中一个子集合被映射为 IndexedEmbedded。子对象有两个字段，一个是 id，另一个是日期(使用日期分辨率到毫秒)。当我搜索 id=
java - App Engine 搜索 api GeoPoint 搜索
The App Engine Search API有一个 GeoPoint 字段。可以用它来进行半径搜索吗？例如，给定一个 GeoPoint，查找位于特定半径内的所有文档。截至目前，它看起来像 Ge
mysql - Laravel MySQL 搜索。允许用户进行自定义 bool 搜索
客户对我正在做的员工管理项目提出了这个新要求，以允许他们的用户进行自定义 bool 搜索。基本上允许他们使用:AND、OR、NOT、括号和引号。实现它的最佳方法是什么？我检查了 mysql，它们使
php - 搜索 PHP 数组比从 MySQL 搜索/检索更快
很想知道哪个更快 - 如果我有一个包含 25000 个键值对的数组和一个包含相同信息的 MySQL 数据库，搜索哪个会更快？非常感谢大家! 最佳答案回答这个问题的最好方法是执行基准测试。关于ph
Vim - 如何使用 smartcase 进行/搜索，而使用 noic 进行 * 搜索？
我喜欢 smartcase，也喜欢 * 和 # 搜索命令。但我更希望 * 和 # 搜索命令区分大小写，而/和 ?搜索命令遵循 smartcase 启发式。是否有隐藏在某个地方我还没有找到的设置？我宁
java - 使用 Marklogic 的 Java 搜索 API 与 XQuery/XSLT API 进行文档 XPath 搜索
我有以下 Marklogic 查询，当在查询控制台中运行时，它允许我检索具有管理员权限的系统用户: xquery version "1.0-ml"; import schema namespace b
PHP:搜索 "a.."
我希望当您搜索例如“A”时，所有以“A”开头的全名都会出现。因此，如果名为“Andreas blabla”的用户将显示我现在有这个: $query = "SELECT full_name, id,
Javascript 搜索
我想在我的网站上添加对人名的搜索。好友列表已经显示在页面上。我喜欢 Facebook 这样做的方式，您开始输入姓名，Facebook 只会显示与查询匹配的好友。 http://cl.ly/2t2V0
PHP错误问题(搜索)
您好，我在我的网站上进行搜索时遇到此错误。 Fatal error: Uncaught Error: Call to undefined function mysql_connect() in /ho
算法总结--搜索
声明( 叠甲 )：鄙人水平有限，本文为作者的学习总结，仅供参考。 1. 搜索介绍搜索算法包括深度优先搜索（DFS）和广度优先搜索（BFS）这两种，从起点开始，逐渐扩大
Flutter - FutureBuilder - 搜索
我正在为用户列表使用 FuturBuilder。我通过 futur: fetchpost() 通过 API 获取用户。在专栏的开头，我实现了一个搜索栏。那么我该如何实现我的搜索栏正在搜索呢？ Cont
搜索 mvc 保持同一页面
我正在使用 MVC5，我想搜索结果并停留在同一页面，这是我在 Controller (LiaisonsProjetsPPController) 中执行搜索操作的方法: public ActionRes
Azure 搜索 - 上传与合并或上传之间的区别
Azure 搜索中的两种方法 Upload 与 MergeOrUpload 之间有什么区别。他们都做完全相同的事情。即，如果文档不存在，它们都会上传文档；如果文档已经存在，则替换该文档。由于这两种
audio - 声音匹配/搜索
实际上，声音匹配/搜索的当前状态是什么？我目前正在远程参与规划一个 Web 应用程序，该应用程序将包含和公开记录的短音频剪辑(最多 3-5 秒，人名)的数据库。已经提出了一个问题，是否可以实现基于用户
azure 搜索。如果我有很多面怎么办
在商业应用程序中，具有数百个面并不罕见。当然，并非所有产品都带有所有这些标记。但是在搜索时，我需要添加一个方面查询字符串参数，其中列出了我想要返回的所有方面。由于我事先不知道相关列表，因此我必须在查
cuda - 搜索-lcudart时跳过不兼容的libcudart.so
当我使用nvcc 5.0编译.cu文件时，编译器会为我提供以下信息。 /usr/bin/ld: skipping incompatible /usr/local/cuda-5.0/lib/libcud
Azure 搜索 - 作为第一个或单个结果完全匹配
我正在使用基于丰富的 Lucene 查询解析器语法的 Azure 搜索。我将“~1”定义为距离符号的附加参数)。但我面临的问题是，即使存在完全匹配，实体也没有排序。 (例如，“blue~1”将返回“b
java - 搜索 ArrayList
我目前有 3 个类，一个包含 GUI 的主类，我在其中调用此方法，一个包含数据的客户类，以及一个从客户类收集数据并将其放入数组列表的 customerList 类，以及还包含搜索数组列表方法。我正在
部分列的 SQL 搜索
假设我有多个 6 字符的字母数字字符串。 abc123、abc231、abc456、cba123、bac231 和 bac123 。基本上我想要一个可以搜索和列出所有 abc 实例的选择语句。我只
SQL 不区分大小写的 IN 搜索
我有这个表 "Table"内容: +--------+ | Serial | +--------+ | d100m | <- expected result | D100M | <- expect

không gian vũ trụ

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

python - 字典列表中第一次出现的二进制搜索