r - 选择一列中给定值的数据框的一半-6ren

r - 选择一列中给定值的数据框的一半

In lại 作者：行者123 更新时间：2023-12-04 02:09:41

hai mươi bốn

4

我想选择其中一列中给定值的数据框的一半。换句话说，从下面给出的数据框中，我需要提取 Y 列中给定值的一半行:

DF:
 id1 column Y value
9830 A 6 
7609 A 0 
9925 B 0 
9922 B 5 
9916 B 6
9917 B 8 
9914 C 2
9914 C 7
9914 C 7
9914 C 2
9914 C 9

新数据框应如下所示:

  NEW DF:
     id1 column Y value
    9830 A 6 
    9925 B 0 
    9922 B 5 
    9914 C 2
    9914 C 7

此外，了解在给定 Y 列的情况下选择所有行 dateframe DF 的随机一半的解决方案会很有帮助(例如，不选择前 50%)。

任何帮助表示赞赏。
Cảm ơn!

1 Câu trả lời

假设您希望每组行的前半部分具有相同的值 column Y对于我们向下舍入的奇数行，我们可以使用 filterTừ dplyr :

library(dplyr)
df %>% group_by(`column Y`) %>% filter(row_number() <= floor(n()/2))
##Source: local data frame [5 x 3]
##Groups: column Y [3]
##
## id1 column Y laclen
##   
##1 9830 A 6
##2 9925 B 0
##3 9922 B 5
##4 9914 C 2
##5 9914 C 7

我们先 group_by column Y (注意反引号，因为列名包含空格)然后使用 filter仅保留 row_number 的行小于或等于 n() 给出的总行数为组除以 2 (并用 floor 向下舍入)。

要选择每组中随机 50% 的行，请使用 sample生成要保留的行号和 %in%匹配那些要保留的:

set.seed(123)
result <- df %>% group_by(`column Y`) %>% filter(row_number() %in% sample(seq_len(n()),floor(n()/2)))
##Source: local data frame [5 x 3]
##Groups: column Y [3]
##
## id1 column Y laclen
##   
##1 9830 A 6
##2 9922 B 5
##3 9917 B 8
##4 9914 C 2
##5 9914 C 9

关于r - 选择一列中给定值的数据框的一半，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/39805891/

hai mươi bốn

4

0

Bài viết được đề xuất: Neo4j 多个可选匹配查询非常慢

Bài viết được đề xuất: CEPH，通过互联网运行集群

Bài viết được đề xuất: asp.net - 如何使用 linq 在 asp.net/vb.net 中过滤列表

Bài viết được đề xuất: python - 无法找到或创建新的 virtualenv

Cách phân tích cú pháp name=value^^name=value^^name=value
Câu hỏi của tôi: Rất cụ thể. Tôi đang cố gắng tìm ra cách đơn giản nhất để phân tích cú pháp văn bản sau: ^^domain=domain_value^^version=version_value^^account_type=account_ty
Python: Cố gắng tạo giá trị tương đương với (hoặc (giá trị, giá trị, giá trị))
Được rồi, đây là tình huống khó xử của tôi: Tôi đang phát triển một bot Hỏi đáp thường gặp cho một khối subreddit Reddit. Tôi đang gặp rắc rối với logic bool và cần một người có kinh nghiệm hơn hướng dẫn (đây là lần đầu tiên tôi sử dụng Python). Bây giờ,
Làm sao để tạo một vòng lặp chạy qua tất cả các giá trị X và Y cùng một lúc, hiện tại nó chạy qua tất cả các giá trị Y và sau đó là tất cả các giá trị X
Đầu tiên nó lặp lại tất cả các giá trị y, sau đó lặp lại tất cả các giá trị x. Tôi cần cả X và y thay đổi cùng một lúc. Đối với x = 3 Đến lr + 1 Đối với y = 2 Đến lr anyl.Cells(x, 1)
Sự khác biệt giữa SUMIF(điều kiện, giá trị), SUMPROD(điều kiện, giá trị) và SUM(điều kiện*giá trị)
Giả sử tôi có một bảng Excel với 2 cột: ngày tháng trong các ô từ A1 đến A10 và giá trị trong các ô từ B1 đến B10. Tôi muốn tính tổng tất cả các giá trị của các ngày trong tháng 5. Tôi có 3 khả năng: {=SUM((MONTH(A1:A10)=
Chuyển đổi giá trị Z (điểm Z, điểm chuẩn) thành giá trị p cho phân phối chuẩn trong Python
Làm thế nào để chuyển đổi điểm Z từ phân phối Z (phân phối chuẩn, phân phối Gauss) sang giá trị p? Tôi vẫn chưa tìm thấy.
javascript(giá trị bool ^ giá trị bool)
Tôi đang viết lại một số mã Javascript để hoạt động trong Excel VBA. Nhờ tìm kiếm trên trang web này, tôi đã dịch được hầu hết mã Javascript! Tuy nhiên, có một số mã mà tôi không hiểu chính xác nó đang làm gì. Đây là một
Thêm khóa, giá trị mới (giá trị = 1) bên trong mảng trong php
Tôi đã gặp phải những tình huống trong đó dấu thời gian chứa định dạng ngày tháng. Sau đó, tôi muốn xây dựng một biểu đồ hiển thị số lượng "nhấp chuột" vào mục "mỗi ngày", //khai báo mảng $array1 = array("Date" => 0); $a
Sự khác biệt giữa Option(value) và Some(value)
Tôi mới làm quen với scala! Câu hỏi của tôi là, có một lớp trường hợp nào có thành viên myItem:Option[String] không Khi tôi xây dựng lớp, tôi cần gói nội dung chuỗi trong: Option("some string") Hoặc So
php - chọn * từ bảng có cột = giá trị ^ cột2 = giá trị
Tôi đang tạo một hệ thống đăng nhập bằng PHP. Tôi cần người dùng đăng nhập bằng tên người dùng hoặc email hoặc số điện thoại và sau đó là mật khẩu. Bởi vì tôi biết trong Java chúng ta có thứ gì đó giống như email == user ^ username == user
WHERE column = value, chỉ hoạt động với các giá trị INTEGER
Tôi đang sử dụng sqlite trên một dự án C++ nhưng tôi gặp sự cố khi sử dụng WHERE trên một cột có giá trị văn bản Tôi đã tạo một cơ sở dữ liệu sqlite: CREATE TABLE User( id INTEGER
Sự khác biệt giữa lớp classname(value); và lớp classname = value; khi có hàm tạo rõ ràng
Khi hàm tạo được nêu rõ ràng, nó không được sử dụng cho các chuyển đổi ngầm định. Trong đoạn mã đã cho, hàm tạo được đánh dấu là rõ ràng. Vậy tại sao trong trường hợp foo obj1(10.25); nó lại hoạt động nhưng trong trường hợp foo obj2=10.25;
: if(!value) hay if(flag == value) cái nào rõ ràng hơn?
Tôi biết đây là một câu hỏi chủ quan nên tôi xin lỗi nếu cần phải đóng lại, nhưng tôi cảm thấy câu hỏi này xuất hiện khá thường xuyên khiến tôi tự hỏi liệu có sự ưu tiên chung nào cho hình thức này hơn hình thức kia không. Rõ ràng, câu trả lời tốt nhất là "cải tiến mã của bạn để bạn không cần phải kiểm tra lỗi", nhưng đôi khi không có
Sự khác biệt giữa [property ~= value] và [property *= value] là gì?
Sự khác biệt giữa hai bộ chọn jQuery này là gì? Sau đây là định nghĩa từ w3schools.com: Bộ chọn [thuộc tính~=giá trị] chọn các đối tượng có thuộc tính cụ thể có giá trị chứa chuỗi cụ thể. [thuộc tính*=
Bộ chọn [thuộc tính|=giá trị] và [thuộc tính*=giá trị] của CSS
Tại sao chúng ta lại cần CSS [thuộc tính|=giá trị] Selector khi CSS3 [thuộc tính*=giá trị] Selector về cơ bản cũng thực hiện chức năng tương tự và khả năng tương thích với trình duyệt cũng gần như tương tự? Nó có tồn tại không?
Biểu thức chính quy để chỉ xác thực 0 giá trị. Một giá trị 0 duy nhất để xác thực
Tôi đang giải một bài toán về biểu thức chính quy. Tôi đã có một regx như thế này [0-9]*([.][0-9]{2}). Đây là một định dạng xác thực. Bây giờ, với xác thực này, tôi muốn bao gồm số tiền 0 không được cung cấp. Ví dụ, 10 là hợp lệ, nhưng
Tại sao giá trị '0' vẫn còn trong danh sách mặc dù mã đã xóa chúng?
Tôi đang nghiên cứu các câu hỏi mẫu cho kỳ thi Khoa học máy tính A và tôi không hiểu tại sao câu trả lời đúng cho câu hỏi sau lại là đúng. Hãy xem xét cách tiếp cận sau đây. public static void mystery(Danh sách số) { cho (
Sắp xếp băm Perl cơ bản các khóa, giá trị, nhưng cũng có khóa VÀ giá trị
Được rồi, vì vậy tôi đang viết một chương trình Perl có hàm băm các giá trị mà tôi thu thập (hoàn toàn trong một chương trình hoàn toàn riêng biệt) và đưa vào tập lệnh Perl này. Băm này là băm của (chuỗi, chuỗi). Tôi muốn sử dụng 3 phương pháp để
Chọn giá trị MAX của một cột dựa trên hai cột khác trong đó một cột có giá trị MAX
Tôi có bảng dữ liệu như sau từ nhiều bảng khác nhau. Tôi chỉ muốn lấy giá trị tối đa từ cột thứ tư nếu cột thứ ba có giá trị "Nợ" và cột đầu tiên (Ngày) có giá trị tối đa. Giá trị cuối cùng dựa trên MAX(DATE) thay vì MAX(PRICE). Vì vậy, trong ngôn ngữ đơn giản
Mã chỉ cập nhật giá trị false trong cơ sở dữ liệu nhưng không cập nhật giá trị true
Tôi gặp phải tình huống kỳ lạ khi chỉ có trạng thái lỗi được lưu vào cơ sở dữ liệu. Truy vấn của tôi vẫn trả về kết quả là false mặc dù "status" phải là true. Tôi có Controller public function change_a có chức năng này
mysql SUM(giá trị) trong đó SUM(giá trị) > 2500
Tôi có một bảng giao dịch (được đơn giản hóa cho các cột bắt buộc): id client_id giá trị 1 1 200 2 2 150 3 1

trang đầu

đã học

Trí tuệ nhân tạo 6Ren

Trung tâm mua sắm

r - 选择一列中给定值的数据框的一半