- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
在拉丁文字中,字母有大写和小写形式。在 Python 中,如果你想比较两个字符串而不考虑它们的大小写,你可以使用 'string'.upper()
hoặc 'string'.lower() 将它们转换为相同的大小写
在阿拉伯文字中,字母可以有首字母、中字母或词尾形式。有没有类似的方法来比较阿拉伯字符的字符串而不关心字母的形式?
câu trả lời hay nhất
这有两个部分,应该适用于所有语言:*
在两者之间,它处理英语的大小写、阿拉伯语的首字母/中间/末尾(加上孤立的)、德语 ß
Và ss
、é
作为单个代码点与 e\N{COMBINING ACUTE ACCENT}
、中文旋转字符、日语半角假名,以及可能您未曾想到的各种其他内容.
在 Python 中,它看起来像这样:
>>> s1 = 'ﻧ'
>>> s2 = 'ﻨ'
>>> unicodedata.normalize('NFKD', s1).casefold() == unicodedata.normalize('NFKD', s2)
ĐÚNG VẬY
Xin lưu ý rằngcasefold
直到 Python 3.3 才被添加。如果您使用的是早期版本的 Python,PyPI 上有实现;使用它们应该类似于使用 3.3+ 内置。
如果您对它如何适用于阿拉伯语感兴趣,而不仅仅是它适用于阿拉伯语和所有其他语言,您已经阅读了 unicode.org 上的算法和表格. IIRC,建议这样做的 W3C 文档解释了为什么它以阿拉伯语为例。我相信这是因为 Unicode 将初始、中间、最终和隔离视为相同字符的兼容性等效表示形式,因此规范化为分解为您有效地提供了隔离形式加上一个修饰符,即使直接在 casefolding 上, casefolding 也可以跳过或转换组合字符仅返回字符本身。
* 在某些情况下,两种不同的语言或文化使用相同的文字,但有不同的大小写规则;在这种情况下,您需要特定于语言环境的 casefolding,而 Python 不包括它。但这在这里不应该是相关的。
关于python - 有没有办法比较阿拉伯字符而不考虑它们的初始/中间/最终形式?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30042618/
Ai đó có thể cho tôi một giải pháp đơn giản hơn cho đoạn mã sau (đang giải phóng danh sách các số nguyên có cấu trúc 0xFC::len::payload::...::0x0A::0x0D ): object Payload
Tôi đã cài đặt chứng chỉ SSL trên trang web của mình nhưng middle.crt không hoạt động bình thường. Bất kỳ trình kiểm tra SSL nào (ví dụ: GeoTrust Checker) đều cho tôi biết rằng khóa trung gian bị thiếu. Đã được sử dụng trên trang web
Làm cách nào để làm cho hình ảnh bắt đầu ở giữa hộp này? (giữa dọc và ngang) Câu trả lời hay nhất Có một số cách để thực hiện việc này và nếu nó cần hoạt động trong tất cả các trình duyệt (IE7+ và các trình duyệt khác), bạn cần thực hiện những việc khác nhau để nó hoạt động trong một số trường hợp nhất định. Sử dụng vị trí tuyệt đối
Làm cách nào tôi có thể buộc chiều cao tối thiểu và căn chỉnh dọc: giữa hoạt động cho phần tử td hoặc các phần tử bên trong của nó? Chiều cao câu trả lời hay nhất trên phần tử td tương đương với chiều cao tối thiểu vì bảng
Tôi đang cố gắng tự động cuộn đến hàng giữa của sổ đặt hàng. Tôi có div orderBook nơi đặt bảng có orderBook. Một trong các hàng trong bảng có id middleRow. Điều tôi muốn làm là cuộn hàng và đặt nó theo thứ tự
Tôi đang cố gắng tính toán thuộc tính nguồn gốc biến đổi của các phần tử được định vị tuyệt đối trong javascript để chúng lấp đầy toàn bộ khung nhìn khi di chuột. Tôi đã thử chia x cho chiều rộng cửa sổ và y cho chiều cao cửa sổ
Tôi có chuỗi thông thường ' đây là chuỗi của tôi ' Có thể xóa tất cả khoảng trắng ở đầu và cuối và chỉ để lại một khoảng trắng giữa các từ. Để chọn tất cả khoảng trắng tôi đã sử dụng: SELECT regrec_replace('
Tôi đang cố gắng tạo giải pháp J2E phức tạp đầu tiên của mình và trong mỗi hướng dẫn, tôi nhận thấy cách sử dụng một số loại bảng trung gian, như thế này: Tables: User, UserRole, Role Trong khi logic chỉ đơn giản là đi đến Bảng người dùng thêm vào một chìa khóa để tham chiếu vai trò của nó trên bảng vai trò, nhưng tại sao
Tôi đang tìm giải pháp sau đây. Tôi muốn định vị một phần tử hình ảnh, ví dụ như ở giữa. Vì vậy, chiều cao là chiều cao của khung nhìn, chiều rộng được đặt tự động và phần giữa của hình ảnh phải ở giữa chiều rộng của khung nhìn. Một ví dụ về tìm kiếm của tôi giống như mạng sau
Tôi đang thiết kế một bố cục giống trang tổng quan cá nhân hơn dành cho người dùng đã đăng ký. Tôi giữ nó đơn giản, sử dụng lưới 2 cột cơ bản, một cột cho thanh bên và một cột cho nội dung chính. Bởi vì, ví dụ, 80% việc sử dụng trang web sẽ diễn ra trong một hệ thống con riêng biệt, không có chrom
Tôi có ba thẻ div khác nhau (không nằm trong nhau) và mã nên nó có một thẻ đặt các từ ở bên trái, giữa hoặc phải, nhưng phần giữa rất lệch giữa. Đây là mã HTML: .desc { float: color:
Tôi có CSS sau http://jsbin.com/azivip/75/edit Tôi muốn div màu vàng có chiều cao lấp đầy khoảng trống giữa các div màu xanh lam và xanh lục. Việc sử dụng tính kế thừa chiều cao dường như làm cho div vượt ra ngoài div màu xanh lá cây. bất kỳ ý tưởng nào
Tôi phải đặt một số văn bản ở giữa phần tử gốc của nó. Tôi đã triển khai nó với đoạn mã sau: #div1 { location:relative; đệm: 0;
Tìm thấy một trang web sử dụng chứng chỉ hợp pháp (được ký bởi thawte), nhưng tất cả các trình duyệt đều từ chối nó. Tôi không hiểu tại sao. bộ phận hỗ trợ thawte đã nói với tôi rằng một miền có hai chứng chỉ và sau đó là https://www.sslshopper[dot
Tôi đang cố gắng tạo chuỗi chứng chỉ bằng OpenSSL, nhưng vì lý do nào đó khi tôi cài đặt CA gốc trên máy tính của mình và cố gắng xác minh chuỗi chứng chỉ, nó liên tục báo với tôi rằng nó không thể tìm thấy nhà phát hành chứng chỉ. có chuyện xảy ra, tôi phải cài đặt CA trung gian, điều này thật vô nghĩa
Một trong những lợi ích lớn mà tôi thấy với REST là sự phụ thuộc vào bộ nhớ đệm HTTP. Tôi không tranh luận về điều này nhưng hoàn toàn đồng ý với ý kiến này. Tuy nhiên, tôi chưa bao giờ thấy lời giải thích sâu hơn về bộ nhớ đệm HTTP trung gian. Nếu tôi thay đổi tiêu đề Kiểm soát bộ đệm
Xem hình ảnh này Nút ứng dụng Facebook Messenger Android ( MESSENGER\ACTIVE ) Tôi có thể làm điều này bằng cách nào? Chi tiết:- di có viền đỏ 2px
Nhiệm vụ của mình là làm sao cho chữ đẹp có dòng trắng ở giữa chữ như hình bên dưới. Có thể làm điều này bằng cách sử dụng css? Đây là Fiddle .container{height:200px;
Trong văn bản Latinh, các chữ cái có dạng chữ hoa và chữ thường. Trong Python, nếu bạn muốn so sánh hai chuỗi bất kể trường hợp của chúng, bạn có thể sử dụng 'string'.upper() hoặc 'string'.low() để chuyển đổi chúng thành cùng một chuỗi
Tôi đang sử dụng awk để thực hiện một số thao tác xử lý văn bản trên các tệp. Ví dụ: loại bỏ dấu cách. awk '{gsub(/ +$/, "")} {print $0}' tên tệp Điều này hoạt động rất tốt. Nhưng khi tôi chuyển hướng đầu ra sang tệp gốc. nó thay đổi
Tôi là một lập trình viên xuất sắc, rất giỏi!