hadoop - Spark vs MapReduce，为什么Spark比MR快，原理？-6ren

hadoop - Spark vs MapReduce，为什么Spark比MR快，原理？

In lại 作者：可可西里更新时间：2023-11-01 14:24:00

据我所知，Spark 将每个节点的磁盘(HDFS)中的数据预加载到每个节点的 RDD 中进行计算。但正如我猜测的那样，MapReduce 必须还将数据从 HDFS 加载到内存，然后在内存中进行计算。那么.. 为什么 Spark 更快速？仅仅因为当 MapReduce 想要进行计算而 Spark 预加载数据时，MapReduce 每次都将数据加载到内存中？非常感谢。

1 Câu trả lời

Spark 使用弹性分布式数据集 (RDD) 的概念，它允许透明地将数据存储在内存中，并在需要时将其保存到磁盘。

另一方面，在 Map reduce 中，在 Map 和 reduce 任务之后数据将被洗牌和排序(同步屏障)并写入磁盘。

在 Spark 中，没有同步障碍会减慢 map-reduce 的速度。内存的使用使执行引擎非常快。

关于hadoop - Spark vs MapReduce，为什么Spark比MR快，原理？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/25374980/

Bài viết được đề xuất: hadoop - Spring XD动态部署 list

Bài viết được đề xuất: c++ - CMake:运行链接命令时出错:%1 不是有效的 Win32 应用程序

Bài viết được đề xuất: windows - 如何使用 python 2.7 移动 Windows 桌面图标？

Bài viết được đề xuất: Hỗ trợ Cloudera cho các container docker hoặc hỗ trợ Docker cho hình ảnh CM 5

Mercurial: transplant so với record so với qrecord so với shelve so với transplant so với dirstate so với queue
Tôi mới làm quen với Mercurial và vẫn đang trong quá trình đánh giá nên bốn khái niệm này có chút khó hiểu với tôi. Một số được cho là tương đương với khái niệm Staging/Index của Git và một số thậm chí còn tiên tiến hơn cả Staging của Git.
NPM so với Bower so với Browserify so với Gulp so với Grunt so với Webpack
đóng cửa. Câu hỏi này cần tập trung hơn. Hiện tại, câu hỏi này không chấp nhận câu trả lời. Bạn muốn cải thiện vấn đề này? Cập nhật câu hỏi để tập trung vào một câu hỏi duy nhất bằng cách chỉnh sửa bài đăng này. Đã đóng 6 tháng trước. Cải thiện câu hỏi này
Cú pháp so với phần tử so với thẻ so với thuộc tính so với thuộc tính so với bộ chọn?
Có ai có thể cho tôi biết thông tin chi tiết không? Ví dụ? #ID là một thuộc tính, một thuộc tính, một bộ chọn hay một neo? Thuộc tính mặc định và thuộc tính mặc định có phải là hai thứ khác nhau không? Đây có phải là tất cả các thẻ hay phần tử không? Chúng ta sẽ nói gì về điều này.....và những điều này
List so với ArrayList so với Dictionary so với Hashtable so với Stack so với Queue?
đóng cửa. Câu hỏi này cần tập trung hơn. Hiện tại, câu hỏi này không chấp nhận câu trả lời. Bạn có muốn cải thiện câu hỏi này không? Cập nhật câu hỏi để tập trung vào một vấn đề duy nhất bằng cách chỉnh sửa bài đăng này. Đã đóng 8 năm trước. Cải thiện điều này
innerText so với innerHTML so với label so với text so với textContent so với outerText
Tôi có một danh sách thả xuống được điền bằng Javascript. Trong khi quyết định các giá trị mặc định để hiển thị khi tải, tôi nhận ra rằng các thuộc tính sau đây hiển thị cùng một giá trị chính xác: innerText innerHTML label text textContent
nsis - Exec so với ExecWait so với ExecShell so với nsExec::Exec so với nsExec::ExecToLog so với nsExec::ExecToStack so với ExecDos so với ExeCmd
Tôi có thể biết sự khác biệt giữa mỗi Exec không? , ExecWait , ExecShell , nsExec::Exec , nsExec::ExecToLog, nsExec::ExecToStac
Bản vá so với Bản sửa lỗi nóng so với Bản phát hành bảo trì so với Gói dịch vụ so với
Bạn bảo trì phần mềm của mình như thế nào khi đang sử dụng phiên bản 1 và phiên bản 2? Theo quan điểm của tôi, các thuật ngữ như "bản vá", "bản sửa lỗi nhanh", "bản phát hành bảo trì", "gói dịch vụ", v.v. đều mơ hồ và có định nghĩa khác nhau tùy thuộc vào người bạn nói chuyện. Bạn gọi phiên bản này như thế nào?
`Math.trunc` so với `|0` so với `<<0` so với `>>0` so với `&-1` so với `^0`
Tôi vừa phát hiện ra có một phương pháp toán học mới trong ES6: Math.trunc. Tôi đã đọc mô tả của nó trong bài viết MDN này. , nghe giống như sử dụng |0 . Ngoài ra, >0 , &-1 , ^0 cũng làm những việc tương tự (cảm ơn
Stackpanel: Chiều cao so với Chiều cao thực tế so với Chiều cao mở rộng so với Chiều cao cổng nhìn so với Kích thước mong muốn so với Kích thước kết xuất
Tôi muốn biết chiều cao của tất cả các mục trong StackPanel của tôi. Sự khác biệt là gì: Chiều cao - Lấy hoặc đặt chiều cao được đề xuất của phần tử. ActualHeight - Lấy chiều cao được hiển thị của phần tử. (Chỉ đọc) ExtentHeight
bundler so với RVM so với gems so với RubyGems so với gemsets so với hệ thống ruby
đóng cửa. Câu hỏi này không liên quan đến chủ đề. Hiện tại không chấp nhận câu trả lời. Bạn có muốn cải thiện câu hỏi này không? Cập nhật câu hỏi để phù hợp với chủ đề trên Stack Overflow. Đã đóng cửa 9 năm trước. Cải thiện điều này
Toán học: Chưa đánh giá so với Trì hoãn so với Giữ so với GiữForm so với GiữTất cảHoàn thành so với v.v.
Tôi bối rối vì tất cả các hàm Mathematica tích hợp đều tuyên bố có thể ngăn chặn việc tính toán theo một cách nào đó: Unevaluated, Defer, Hold và hơn nửa tá biểu mẫu Hold*. Tài liệu Mathematica chỉ có sẵn cho cá nhân
sqlite so với ứng dụng bộ nhớ chia sẻ so với ipc so với?
Tôi thậm chí còn không chắc chắn về thuật ngữ chính xác, vậy nên hãy để tôi bắt đầu với mục tiêu của mình: có một ứng dụng đơn giản ("Data Doler") chỉ đọc một lượng lớn dữ liệu từ tệp vào bộ nhớ, sau đó cung cấp dịch vụ cắt dữ liệu đó thành một ứng dụng nhiều lớp duy nhất có tên là "Data Lapper".
Elasticsearch - Sự khác biệt và hiệu suất giữa Wildcard so với prefix so với regex so với query_string
Tôi vừa bắt đầu sử dụng Elasticsearch trong dự án của mình và tôi muốn tìm kiếm giống như từ khóa sql 'like %'. Ai đó có thể giải thích sự khác biệt giữa ký tự đại diện, tiền tố, chuỗi truy vấn và biểu thức chính quy không? Người nào có thể tìm kiếm tốt nhất cho
Tạo trình duyệt web nhẹ - Gecko so với Webkit so với ???; Qt4 so với Qt5 so với ?
Vì tôi không thực sự hài lòng với bất kỳ trình duyệt chính nào (Firefox, Chrome, Opera) và không có trình duyệt ít phổ biến nào mà tôi đã thử (gần chục trình duyệt) hoạt động được, nên tôi quyết định tự làm và tạo một trang web có thể trở thành trình duyệt tốt nhất mà tôi có thể. Mục tiêu chính là làm cho nó
Xpath so với DOM so với BeautifulSoup so với lxml so với các cách khác Cách nhanh nhất để phân tích cú pháp một trang web là gì?
Tôi biết cách phân tích cú pháp một trang bằng Python. Câu hỏi của tôi là trong số tất cả các kỹ thuật phân tích cú pháp, phương pháp nào là nhanh nhất và các phương pháp khác nhanh như thế nào? Các kỹ thuật phân tích cú pháp mà tôi biết là Xpath, DOM, BeautifulSoup và fin sử dụng Python.
atoi so với atol so với strtol so với strtoul so với sscanf
Tôi đang cố gắng tìm ra hàm nào là tốt nhất để chuyển đổi số thập phân, thập lục phân hoặc bát phân thành số int từ dòng lệnh mà tôi phân tích tốt nhất - mà không biết trước dữ liệu đầu vào. Mục tiêu là sử dụng một hàm để nhận dạng các loại đầu vào khác nhau và gán chúng cho các giá trị số nguyên (int).
TagSoup so với Jsoup so với HTML Parser so với HotSax so với
Hiện tại, câu hỏi này không phù hợp với định dạng Hỏi & Đáp của chúng tôi. Chúng tôi mong đợi câu trả lời được hỗ trợ bởi các sự kiện, tài liệu tham khảo hoặc chuyên môn, nhưng câu hỏi này có thể gây ra tranh luận, tranh cãi, thăm dò ý kiến hoặc thảo luận mở rộng. Nếu bạn cảm thấy vấn đề này có thể được cải thiện và có thể mở lại, hãy truy cập
API định vị địa lý: SimpleGeo so với CityGrid so với PublicEarth so với Twitter so với Foursquare so với Loopt so với Fwix. Làm thế nào để lấy thông tin trường/vị trí?
Chúng tôi cần hiển thị thông tin siêu dữ liệu (ví dụ: địa chỉ, tên) của nhiều địa điểm khác nhau như quán bar, nhà hàng và nhà hát trên trang web của mình. Trong trường hợp lý tưởng, người dùng sẽ nhập tên địa điểm cùng với mã bưu chính và chúng tôi sẽ cung cấp kết quả khớp nhất. Mọi người đang sử dụng API nào cho mục đích định vị địa lý tương tự?
Sencha Touch so với jQtouch so với GWT mobile so với XUI so với jQuery Mobile so với
Hiện tại, câu hỏi này không phù hợp với định dạng Hỏi & Đáp của chúng tôi. Chúng tôi mong đợi câu trả lời được hỗ trợ bằng sự kiện, trích dẫn hoặc chuyên môn, nhưng câu hỏi này có thể gây ra tranh luận, tranh cãi, thăm dò ý kiến hoặc thảo luận mở rộng. Nếu bạn cảm thấy câu hỏi này có thể được cải thiện và có thể mở lại, hãy truy cập
Flex so với jQuery so với GET so với /Closure so với Cappuccino so với JS và HTML5 thuần túy?
Tôi đang tạo ứng dụng web đầu tiên của mình và thực sự bối rối không biết nên sử dụng công nghệ nào. Ứng dụng của tôi cần trông nghiêm túc (như một ứng dụng thông thường), không cần nhiều giao diện đồ họa nhiều màu sắc. Nó chỉ cần một thanh công cụ, một thanh tab, một bảng chia tách (hầu hết

可可西里

Hồ sơ cá nhân

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá Didi Taxi miễn phí

Các bài viết nóng hổi trên toàn bộ trang web

trang đầu

đã học

Trí tuệ nhân tạo 6Ren

Trung tâm mua sắm

hadoop - Spark vs MapReduce，为什么Spark比MR快，原理？