- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用以下方式刮除Glassdoor的评论:
https://github.com/MatthewChatham/glassdoor-review-scraper
但是我得到了错误并且不知道如何克服它。请帮忙。
在Windows 10和Chrome 77上
2019-09-11 08:48:58,961信息377:main.py(1824)-配置浏览器
DevTools listening on ws://127.0.0.1:#####/devtools/browser/cccb51a6-3dc2-4f06-90db-################
2019-09-11 08:49:03,942 INFO 419 :main.py(1824) - Scraping up to 1000 reviews.
2019-09-11 08:49:03,946 INFO 358 :main.py(1824) - Signing in to email@gmail.com
2019-09-11 08:49:06,541 INFO 339 :main.py(1824) - Navigating to company reviews
2019-09-11 08:49:12,674 INFO 286 :main.py(1824) - Extracting reviews from page 1
2019-09-11 08:49:12,696 INFO 291 :main.py(1824) - Found 10 reviews on page 1
2019-09-11 08:49:12,840 WARNING 126 :main.py(1824) - Failed to scrape employee_title
Theo dõi (cuộc gọi gần đây nhất là cuộc gọi cuối cùng):
File "main.py", line 461, in
chủ yếu()
File "main.py", line 441, in main
reviews_df = extract_from_page()
File "main.py", line 295, in extract_from_page
data = extract_review(review)
File "main.py", line 281, in extract_review
res[field] = scrape(field, review, author)
File "main.py", line 264, in scrape
return fdict[field](review)
File "main.py", line 156, in scrape_years
'reviewBodyCell').find_element_by_tag_name('p')
File "C:\Users\dvnguyen\AppData\Local\Continuum\anaconda3\lib\site-packages\selenium\webdriver\remote\webelement.py", line 305, in find_element_by_tag_name
return self.find_element(by=By.TAG_NAME, value=name)
File "C:\Users\dvnguyen\AppData\Local\Continuum\anaconda3\lib\site-packages\selenium\webdriver\remote\webelement.py", line 659, in find_element
{"using": by, "value": value})['value']
File "C:\Users\dvnguyen\AppData\Local\Continuum\anaconda3\lib\site-packages\selenium\webdriver\remote\webelement.py", line 633, in _execute
return self._parent.execute(command, params)
File "C:\Users\dvnguyen\AppData\Local\Continuum\anaconda3\lib\site-packages\selenium\webdriver\remote\webdriver.py", line 321, in execute
self.error_handler.check_response(response)
File "C:\Users\dvnguyen\AppData\Local\Continuum\anaconda3\lib\site-packages\selenium\webdriver\remote\errorhandler.py", line 242, in check_response
raise exception_class(message, screen, stacktrace)
selenium.common.exceptions.NoSuchElementException: Message: no such element: Unable to locate element: {"method":"css selector","selector":"p"}
(Session info: headless chrome=77.0.3865.75)
1 Câu trả lời
glassdoor可能已更改其网站/布局,并且此刮板使用的方法不再有效地检测页面。
就是说,它正在类类型reviewBodyCell的某个元素内寻找简单的“p”标签。
File "main.py", line 156, in scrape_years
'reviewBodyCell').find_element_by_tag_name('p')
关于selenium - Selenium 没有这种元素异常,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57893079/
Vấn đề rất đơn giản: Tôi đang tìm một cách thanh lịch để sử dụng CompletableFuture#exceptionally cùng với CompletableFuture#supplyAsync. Cách này không hiệu quả: private void
Đối với các dịch vụ web, chúng tôi thường sử dụng maven-jaxb2-plugin để tạo java bean và sử dụng mã hóa JAXB2 trong Spring. Tôi muốn biết cách xử lý (SOAP-
Câu hỏi này đã có câu trả lời: Chỉ số mảng nằm ngoài hành vi giới hạn (10 câu trả lời) Đã đóng 8 năm trước. Tôi tò mò về đoạn mã C sau int main(){
Khi tôi khởi tạo đối tượng MediaPlayer với ngữ cảnh và tài nguyên ở đầu lớp, nó sẽ ném ra ngoại lệ NullPointer, nhưng khi tôi khai báo nó ở đầu lớp (do đó nó là null) rồi khởi tạo nó theo cùng một cách trong phương thức onCreate, nó sẽ ném ra ngoại lệ NullPointer.
Xin chào, tôi đang cố gắng kết nối một chương trình Java với REST API. Với cùng đoạn mã đó, tôi đã nhận được ngoại lệ Java trong Java 6 và nó hoạt động tốt trong Java 8. Cùng một môi trường: Trust machine unix user agent
Tôi đang cố gắng phân tích Twitter bằng Flume và Hive. Để lấy tweet từ twitter, tôi đã thiết lập tất cả các tham số bắt buộc (consumerKey, consumer
Tôi gặp một số vấn đề với ngoại lệ JavaFX. Dự án của tôi đang chạy trên Eclipse, nhưng bây giờ bạn tôi cũng đang cố gắng truy cập vào dự án đó. Chúng tôi đã chia sẻ và lưu trực tiếp vào thư mục Dropbox. Nhưng ông ấy không thể thực hiện được điều đó. Anh ấy đang ở bàn điều khiển
Giả sử tôi đã xác minh ID email bằng sự kiện blur(), tôi sẽ thực hiện như sau: $('#email').blur(function(){ //thực hiện lệnh gọi ajax, kiểm tra xem có trùng lặp không
Tôi làm điều này để gọi các hàm không được quản lý từ mã C. pCallback là một con trỏ hàm và do đó là một đại biểu ở phía được quản lý. [DllImport("MyDLL.dll")] công khai tĩnh
Tại sao đoạn mã này đúng: try { } catch(ArrayOutOfBoundsException e) {} Đoạn mã này sai: try { } catch(IOException e) {}
Tôi gặp vấn đề sau: Có một DLL xuất một hàm. Ví dụ mã như sau: [Thư viện liên kết động] __declspec(dllexport) int openDevice(int,void**) [Ứng dụng] Developer.h: __de
Từ các luồng khác, tôi biết rằng chúng ta không nên ném ngoại lệ vào hàm hủy! Nhưng đối với ví dụ bên dưới, nó lại hoạt động. Điều này có nghĩa là chúng ta chỉ có thể đưa ra ngoại lệ trong hàm hủy của một thể hiện không? Chúng ta nên hiểu ví dụ mã này như thế nào! #include sử dụng n
Tại sao chúng ta cần phải ném một ngoại lệ public static void main(String[
1. Cơ chế ngoại lệ của Java Lớp Throwable là lớp cha cấp cao nhất của các kiểu ngoại lệ Java. Chỉ khi một đối tượng là một thể hiện của lớp Throwable (trực tiếp hoặc gián tiếp) thì nó mới là một đối tượng ngoại lệ và có thể được cơ chế xử lý ngoại lệ nhận dạng. JDK
Tôi mới làm quen với Python và có một câu hỏi liên quan đến việc triển khai một phương thức ngoại lệ cụ thể. Sau đây là mã (viết tắt): class OurException(Exception): """Ngoại lệ do người dùng định nghĩa"
Tôi đã tạo sơ đồ sau để biểu diễn mối liên kết giữa người dùng và một tập hợp các luồng được sắp xếp theo tin nhắn cuối cùng của họ (những luồng nào người dùng đã đọc và những luồng nào chưa đọc): CREATE TABLE table(user_id bigint, mes
Tôi đang viết một tập lệnh tự động hóa đơn giản bằng Python có thể phát sinh ngoại lệ ở nhiều vị trí. Trong mỗi trường hợp, tôi muốn ghi lại một thông điệp cụ thể và thoát khỏi chương trình. Để thực hiện điều này, tôi đưa ra SysError sau khi phát hiện ngoại lệ và xử lý nó (thực hiện các hành động ghi nhật ký cụ thể, v.v.).
Có ai có thể giải thích tại sao điều này lại dẫn đến lỗi không: let xs = [| "Mary"; "Mungo"; "Midge" |] Array.iter printfn xs Trong khi đây không phải là trường hợp: Array.iter printfn xs
Trên trang web tôi đang sử dụng Play!, tôi có một phần quản trị. Tất cả Bộ điều khiển quản trị đều có chú thích @With và @Check. Sau khi ngắt kết nối, mọi thứ hoạt động bình thường. Sau khi kết nối được thực hiện, mỗi lần một trang được tải (bất kỳ trang nào, bất kể
Tôi thử kết nối với bộ lưu trữ bảng Azure và thêm một đối tượng. Nó hoạt động tốt trên máy chủ cục bộ, nhưng trên máy chủ tôi đang sử dụng, tôi nhận được ngoại lệ sau và ngoại lệ bên trong của nó: Ngoại lệ loại 'Microsoft.Wind
Tôi là một lập trình viên xuất sắc, rất giỏi!