sách gpt4 ăn đã đi

html - 以本地语言显示内容 : R

In lại 作者:数据小太阳 更新时间:2023-10-29 02:25:40 28 4
mua khóa gpt4 giày nike

我正在尝试从包含英文和本地语言(非英文)内容的网站下载数据。我能够获得英文数据,但对于本地语言的内容,我得到了如下内容。我的问题是如何显示两者?

X1 X2 X3
NA
1
2
3
4
5
6
7
8
9
10

câu trả lời hay nhất

您可能拥有所需的文本,只是显示不正确。

我可以重现你的问题。您的示例数据有 10 次相同的字符串。为了保持显示的合理性,我只重复了 3 次。

## Hex codes from your example
S1 = c("0926", "094B", "0932", "0916", "093E")
S2 = c("0915", "093E", "0932", "093F", "0928", "094D", "091A", "094B", "0915")
S3 = c("0917", "093E", "0909", "0901", "092A", "093E", "0932", "093F", "0915", "093E")

## Convert to Devanagari strings
X1 = rep(intToUtf8(strtoi(S1, base=16L)), 3)
X2 = rep(intToUtf8(strtoi(S2, base=16L)), 3)
X3 = rep(intToUtf8(strtoi(S3, base=16L)), 3)

df = data.frame(X1, X2, X3, stringsAsFactors=FALSE)

Hiện nayX1会正确显示,但是dfsẽ không

奇怪的是,df$X1df[,1] 会显示 unicode,但是 df[1, ] 不会。

解决方法是 as.matrix(df) 将显示整个内容作为 unicode 字符。

这显然是 RGui Windows 版本中的一个已知错误。可以在此处找到对此的一些其他探索 Earlier SO Question还有这个Mailing List Post

phụ lục

将这些字符串写入可读的 Unicode 文件需要小心。这为我的示例创建了一个 csv 文件。

Mat = as.matrix(df)
F <- file("Test1.csv", "wb", encoding="UTF-8")
BOM <- charToRaw('\xEF\xBB\xBF')
writeBin(BOM, F)
for(r in 1:nrow(Mat)) {
Line = paste(Mat[r,], collapse=",")
writeLines(Line, F, useBytes=T)
}
close(F)

关于html - 以本地语言显示内容 : R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44223726/

28 4 0
Chứng chỉ ICP Bắc Kinh số 000000
Hợp tác quảng cáo: 1813099741@qq.com 6ren.com
Xem sitemap của VNExpress