r - 子集 ffdf 对象(子集 vs ffwhich)-6ren

Phân tập các đối tượng ffdf (subset vs ffwhich)

In lại 作者：行者123 更新时间：2023-12-04 12:17:53

30

4

我正在执行大型 ffdf 对象的子集，我注意到当我使用 subset.ff 时，它会生成大量 NA。我通过使用 ffwhich 尝试了另一种方法，结果要快得多，并且没有生成 NA。这是我的测试:

library(ffbase)
# deals is the ffdf I would like to subset
unique(deals$COMMODITY)
ff (open) integer length=7 (7) levels: CASH CO2 COAL ELEC GAS GCERT OIL
  [1] [2] [3] [4] [5] [6] [7] 
CASH CO2 COAL ELEC GAS GCERT OIL   

# Using subset.ff
started.at=proc.time()
deals0 <- subset.ff(deals,deals$COMMODITY %in% c("CASH","COAL","CO2","ELEC","GCERT"))
cat("Finished in",timetaken(started.at),"\n")
Finished in 12.640sec
# NAs are generated
unique(deals0$COMMODITY)
ff (open) integer length=8 (8) levels: CASH CO2 COAL ELEC GAS GCERT OIL 
  [1] [2] [3] [4] [5] [6] [7] [8] 
CASH CO2 COAL ELEC GAS GCERT OIL NA    

# Subset using ffwhich
started.at=proc.time()
idx <- ffwhich(deals,COMMODITY %in% c("CASH","COAL","CO2","ELEC","GCERT"))
deals1 <- deals[idx,]
cat("Finished in",timetaken(started.at),"\n")
Finished in 3.130sec
# No NAs are generated
unique(deals1$COMMODITY)
ff (open) integer length=7 (7) levels: CASH CO2 COAL ELEC GAS GCERT OIL
  [1] [2] [3] [4] [5] [6] [7] 
CASH CO2 COAL ELEC GAS GCERT OIL

知道为什么会这样吗？

1 Câu trả lời

subset.ff可能正在使用 [和您的标准，但不包括 !is.na(.)条款。 “[”的默认值是返回标准向量的 TRUE 或 NA 项。正则子集函数添加一个 !is.na(.)条款，但也许 ffbase 的作者没有解决这个问题。

关于r - 子集 ffdf 对象(子集 vs ffwhich)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/13531265/

30

4

0

Bài viết được đề xuất: r - 如何根据聚集的人口找到指数

Bài viết được đề xuất: julia - 无法在VS Code中启动Julia语言服务器

Bài viết được đề xuất: api - 如何使用 Rest Assured 在 GET url 中传递查询字符串参数？

Bài viết được đề xuất: r - 如何在 R 中的函数内操作全局环境？

Phân tập các đối tượng ffdf (subset vs ffwhich)
Tôi đang thực hiện việc chia nhỏ một đối tượng ffdf lớn và tôi nhận thấy rằng khi sử dụng subset.ff, nó tạo ra rất nhiều NA. Tôi đã thử một cách tiếp cận khác bằng cách sử dụng ffwhich và nó nhanh hơn nhiều và không tạo ra NA nào. Đây là bài kiểm tra của tôi:
Prolog - Các tập hợp con
Tôi còn khá mới với Prolog. Tôi đang cố viết một hàm subset(Set, Subset) để xác định xem Subset có phải là tập hợp con của Set hay không (điều hiển nhiên). Ngoài ra, nếu đối số thứ hai không được khởi tạo, nó sẽ xuất ra mọi tập hợp con có thể
Câu hỏi thực hành Leetcode (Câu hỏi 78) - Tập hợp con
1. Câu hỏi đưa cho bạn một mảng số nguyên nums và các phần tử trong mảng này là khác nhau. Trả về tất cả các tập hợp con có thể có (tập hợp lũy thừa) của mảng. Bộ giải pháp không thể chứa các tập hợp con lặp lại. Bạn có thể trả lại các giải pháp theo bất kỳ thứ tự nào. 2. Ví dụ đầu vào: nums = [1,2
R: Tập hợp con: sử dụng toàn bộ khung dữ liệu ngoại trừ một cột
Tôi muốn loại trừ một cột khỏi một hoạt động trên một khung dữ liệu. Tất nhiên tôi có thể sao chép khung dữ liệu mà không cần loại trừ các cột, nhưng điều này có vẻ như là một giải pháp tạm thời. Tôi nghĩ phải có cách nào đó dễ hơn để thực hiện phép chia con. Vì vậy, đoạn mã ví dụ này sẽ cho thấy những gì tôi đang làm. df cộtMe
Tập hợp con SpatialPolygonsDataFrame
Tôi có một SpatialPolygonsDataFrame mà tôi đã tạo bằng cách đọc shapefile bằng readOGR trong gói rgdal. Tôi đang cố gắng sử dụng điều này để tạo lưới lấy mẫu bằng spsample
Làm thế nào để có được tất cả các danh sách con/tập hợp con liên tiếp trong Prolog?
Tôi đang cố gắng giải quyết một vấn đề đơn giản nhưng không tìm ra giải pháp mặc dù đã thử nhiều cách khác nhau. Tôi đang sử dụng SICStus Prolog (nếu điều đó quan trọng) và tôi muốn lấy tất cả các danh sách con/tập hợp con (tôi không biết thuật ngữ nào là đúng) của một danh sách, trong đó
Tập hợp con shinyTable
Hiện tại tôi đang sử dụng shinyTable, đây là một triển khai tương thích với shiny của HandsonTable (https://github.com/trestletech/shinyTable). Thật tình cờ, tôi nhận ra
Delphi - Các tập con ADODataSet
Tôi đang xây dựng một biểu mẫu trong Delphi có danh sách thả xuống các dịch vụ và một lưới thành phần bổ sung để chọn dịch vụ. Dữ liệu tôi nhận được đến từ API và tôi lưu trữ dữ liệu của dịch vụ trong ADODataSet như thế này: ID (số nguyên
Subset() số lượng quan sát của một yếu tố
Có vấn đề với hàm subset(). Làm thế nào tôi có thể phân chia một hệ số trong khung dữ liệu của mình theo số lượng quan sát? TÊN LỚP MÀU GIÁ TRỊ antonio
perl, so sánh băm, tập hợp con
Tôi tự hỏi liệu có thuật toán đơn giản nào để so sánh xem một hàm băm có phải là tập hợp con của một hàm băm khác hay không. Ví dụ, nếu $HASH{A} = B; $HASH{B} = C; $HASH{C} = D; $HASH2{A} = B; $HA
Làm thế nào để tìm tất cả các kết hợp (tập hợp con) của một mảng có kích thước tùy ý trong postgresql
Câu hỏi này đã có câu trả lời tại đây: Kết hợp mảng không lặp lại (1 câu trả lời) Đã đóng 8 năm trước. Cho một mảng, làm thế nào để tìm một kích thước nhất định trong postgresql
Vectơ tập hợp con
Tôi có quy trình tiếp theo. Tôi nên sử dụng trình lặp trong main như thế nào để hiển thị tập hợp con có tổng bằng 0? Chương trình của tôi sẽ in ra: 2 -2 5 -5 # include # include sử dụng không gian tên st
javascript - Tập hợp con Markdown
Tôi đang tìm kiếm một trình phân tích cú pháp Markdown có thể tùy chỉnh, tốt nhất là bằng Javascript. Đặc biệt, tôi muốn loại bỏ tùy chọn sử dụng thẻ HTML thực tế. Tôi đã thử chỉnh sửa nguồn của showdown nhưng không thể tìm ra cách. Tích hợp Jquery cũng tốt, mặc dù
Trích xuất thông tin (một tập hợp con) từ một tệp chính bằng cách sử dụng danh sách các mã định danh được lưu trong một tệp khác
Tôi có một tệp có danh sách tên (tệp tham chiếu 1): Apple Bat Cat Tôi có một tệp khác (tệp tham chiếu 2) có danh sách tên và thông tin chi tiết tham chiếu: Apple bla blaa aaaaaaaaaagggggg
Làm thế nào để tìm tập hợp con của hai tệp từ dòng lệnh?
Tôi có hai tập tin với các dòng được sắp xếp. Một tệp (B) là tập hợp con của tệp khác (A). Tôi muốn tìm tất cả các hàng trong A không có trong B. Lý tưởng nhất là tôi muốn tạo một tệp (C) chứa những dòng này. Điều này có thể thực hiện được trong Unix không? Tôi đang tìm kiếm một
Lọc/tập hợp con/xóa các hàng chứa ký tự ở giữa chuỗi trong R
Tôi có một khung dữ liệu với một cột chứa các chuỗi peptide và tôi chỉ muốn giữ lại các hàng không có chữ "R" hoặc "K" bên trong chuỗi. df1 <- data.frame( Peptide = c("ABCOIIJUHFSAUJHR", "AOFI
Tập hợp con 1 ma trận cột loại bỏ tên hàng
Câu hỏi này đã có câu trả lời tại đây: Cách chia ma trận thành một cột, duy trì kiểu dữ liệu ma trận, duy trì hàng/cột na
r - một vector danh sách cho tập hợp con R
Giả sử tôi có một vector danh sách: library(tidyverse) d 2) # A tibble: 5 x 1 x 1 2 3 4 5 Câu trả lời tốt nhất phải là lengt
javadoc tập hợp con/tổ chức thư viện java
Tôi chưa bao giờ tự chạy javadoc (từ dòng lệnh hoặc với tác vụ javadoc của ant; tôi sẽ sử dụng ant) -- Tôi cần tạo một javadoc cho thư viện mà tôi đang viết. Vấn đề là thư viện java của tôi được tổ chức thành nhiều gói, trong
Các tập hợp khóa hết hạn trong các chương trình mã hóa nhiều bên
Giả sử có một chương trình mã hóa nhiều bên, tương tự như câu trả lời cho câu hỏi: Mã hóa bằng nhiều khóa khác nhau? . Nghĩa là. Một bộ khóa K có thể được sử dụng để giải mã văn bản mã hóa. Có cách nào để hết hạn: K'⊆ K sao cho K \ K

trang đầu

đã học

Trí tuệ nhân tạo 6Ren

Trung tâm mua sắm

Phân tập các đối tượng ffdf (subset vs ffwhich)