cuốn sách gpt4 ai đã làm

Apache Tika - PrintWriter hoạt động trên máy Windows cục bộ nhưng không hoạt động trên máy Linux

In lại Tác giả: Taklimakan Thời gian cập nhật: 2023-11-03 01:24:03 28 4
mua khóa gpt4 Nike

Tôi đã bối rối. Tập lệnh này chạy tốt trong Eclipse trên máy Windows của tôi nếu tôi mã hóa đường dẫn tệp. Nếu tôi cố gắng chấp nhận các tham số và chạy nó trên nút cạnh của tôi (máy linux) thì nó không đưa ra bất kỳ lỗi cụ thể nào mà chỉ để lại một tệp đầu ra trống. Tôi phải thiếu điều gì đó ngu ngốc, nhưng tôi không thấy nó. Có ai biết chuyện gì đang xảy ra không?

gói com.trv.cbia.de.tika;

nhập java.io.File;
nhập java.io.FileInputStream;
nhập java.io.FileNotFoundException;
import java.io.IOException;
import java.io.PrintWriter;
nhập java.io.UnsupportedEncodingException;

nhập org.apache.tika.Exception.TikaException;
nhập org.apache.tika.metadata.Metadata;
nhập org.apache.tika.metadata.TikaCoreProperties;
nhập org.apache.tika.parser.AutoDetectParser;
nhập org.apache.tika.parser.ParseContext;
nhập org.apache.tika.parser.Parser;
nhập org.apache.tika.sax.BodyContentHandler;
nhập org.xml.sax.SAXException;

import java.io.InputStream;
nhập java.util.HashMap;
nhập java.util.Map;


lớp công khai DocParser {

public Map processRecord(String path) {
Map map = new HashMap();
Chuỗi docPath = đường dẫn;
try{
Trình xử lý BodyContentHandler = BodyContentHandler mới();
Siêu dữ liệu siêu dữ liệu = Siêu dữ liệu mới();
Dòng đầu vào inputStream = FileInputStream mới(Tệp mới(docPath));
ParseContext pcontext = new ParseContext();
Trình phân tích cú pháp pdfparser = AutoDetectParser mới();
pdfparser.parse(dòng đầu vào, trình xử lý, siêu dữ liệu, pcontext);
map.put("văn bản", handler.toString().replaceAll("\n|\r|\t", " "));
map.put("tiêu đề", siêu dữ liệu.get(TikaCoreProperties.TITLE));
map.put("pageCount", siêu dữ liệu.get("xmpTPg:NPages"));

} bắt (IOException ex){
System.out.println("Bắt IOException:" + ex.getMessage());
}
bắt (TikaException tx) {
System.out.println("Đã bắt được ngoại lệ TikaException: " + tx.getMessage());
}
bắt (SAXException sx){

System.out.println("Đã bắt được ngoại lệ SAXException: " + sx.getMessage());

}

trả lại bản đồ;
}

public static void main(String args[]){


Tệp chuỗi = args[0];
Chuỗi ra = args[1];
DocParser textExtract = new DocParser();
Map extractMap = textExtract.processRecord(file);
thử {
Trình ghi PrintWriter = PrintWriter mới(out,"UTF-8");
writer.println(extractedMap.get("text"));
writer.flush();
nhà văn.close();
} bắt (FileNotFoundException e) {
e.printStackTrace();
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
}

}

}

câu trả lời hay nhất

Cuối cùng, tôi cần thêm tika-app-1.13.jar vào đường dẫn lớp của mình. Nó không bao giờ rò rỉ bất kỳ lỗi đường dẫn lớp nào. Tôi đã phải xem qua rất nhiều danh sách gửi thư của Apache để tìm những người có vấn đề tương tự. Đăng giải pháp ở đây trong trường hợp có ai khác gặp phải nó.

Về java - Apache Tika - PrintWriter hoạt động trên máy Windows cục bộ nhưng không hoạt động trên máy Linux, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/38257557/

28 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress