Đối sánh biểu thức chính quy PHP tương tự như các chữ cái. Còn được gọi là u=ü hoặc ê=é=è=e-6ren

Đối sánh biểu thức chính quy PHP tương tự như các chữ cái. Còn được gọi là u=ü hoặc ê=é=è=e

In lại Tác giả: Hồ Xil Thời gian cập nhật: 2023-10-31 23:10:40

Tôi đang tìm cách tìm kiếm các từ cụ thể trong văn bản và đánh dấu chúng. Mã hoạt động hoàn hảo ngoại trừ việc tôi muốn nó khớp với các chữ cái tương tự. Ý tôi là, tìm kiếm fête phải phù hợp với fêté, fete,...

Có cách nào đơn giản và thanh lịch để thực hiện việc này không?

Đây là mã hiện tại của tôi:

$regex='/(' . preg_replace('/\s+/', '|', preg_quote($usersearchstring)) .')/iu';

$higlightedtext = preg_replace($regex, '\0', $text);

Văn bản của tôi không được mã hóa html. Tìm kiếm MariaDB để có kết quả tương tự.

[EDIT] Đây là một ví dụ dài hơn về câu hỏi:

$usersearchstring='fête';
$text='la paix fêtée avec plus de 40 culture';
$regex='/(' . preg_replace('/\s+/', '|', preg_quote($usersearchstring)) .')/iu';
$higlightedtext = preg_replace($regex, '\0', $text);

Kết quả là $higlightedtext giống với $text

Khi $higlightedtext từ "fêté" được thay đổi, $higlightedtext sẽ là

'la paix fêtée avec plus de 40 culture'

Tuy nhiên, tôi muốn nó "luôn luôn" khớp với tất cả các biến thể của chữ cái, vì có thể có (và trên thực tế có thể có) nhiều biến thể của từ này. Chúng tôi có fête fêté trong cơ sở dữ liệu, thậm chí có thể là fêté.

Tôi đã suy nghĩ về điều này, nhưng giải pháp duy nhất tôi thấy là có một mảng lớn với tất cả các tùy chọn thay thế chữ cái, sau đó lặp qua chúng và thử từng biến thể. Nhưng điều này không thanh lịch và sẽ chậm. (Vì đối với nhiều chữ cái tôi có ít nhất 5 biến thể: aáàâä, hóa ra nếu từ đó có 3 nguyên âm, tôi cần phải thực hiện 75x (5x5x5) preg_replace.

[/biên tập]

câu trả lời hay nhất

Câu hỏi của bạn là vềngăn nắp, nghệ thuật xử lý văn bản ngôn ngữ tự nhiên để sắp xếp và so sánh nó bằng cách sử dụng kiến thức về các quy tắc từ vựng của ngôn ngữ. Bạn đang tìm kiếm một đối chiếu không phân biệt chữ hoa chữ thường và không phân biệt dấu phụ.

Nguyên tắc phân loại phổ biến là Bhiện hữu MỘT sau đó . Một quy tắc ít phổ biến hơn nhưng quan trọng đối với vấn đề của bạn là êVà elà tương đương. Việc phân loại chứa nhiều quy tắc như vậy, được xây dựng cẩn thận trong nhiều năm. Nếu bạn đang sử dụng cách đối chiếu không phân biệt chữ hoa chữ thường, bạn sẽ cần một cái gì đó như Một Những quy định như vậy và MỘTlà tương đương.

Các quy tắc dấu phụ cho hầu hết các ngôn ngữ châu Âu (trừ tiếng Tây Ban Nha) là: NVà Nlà tương đương. Trong tiếng Tây Ban Nha, Nhiện hữu N sau đó.

Cơ sở dữ liệu hiện đại nhận thức được những đối chiếu này. Ví dụ: nếu bạn sử dụng MySQL, bạn có thể đặt mã hóa ký tự thành utf8mb4 của các cột. Và utf8mb4_unicode_ci đối chiếu. Điều này hoạt động tốt với hầu hết các ngôn ngữ (nhưng không hoàn hảo cho tiếng Tây Ban Nha).

Công nghệ Regex không hữu ích lắm cho việc hoàn thiện công việc. Nếu bạn sử dụng biểu thức thông thường cho việc này thì bạn đang cố gắng phát minh lại bánh xe và rất có thể bạn đang phát minh lại chiếc lốp bị xẹp.

PHP, giống như hầu hết các ngôn ngữ lập trình hiện đại, bao gồm hỗ trợ sắp xếp được tích hợp trong Lớp đối chiếu ở giữa. .Đây là một ví dụ đơn giản về cách sử dụng đối tượng Collator cho trường hợp sử dụng ký tự có dấu. nó sử dụng Collator::Sức mạnh đối chiếu CHÍNHThực hiện so sánh không phân biệt chữ hoa chữ thường và dấu trọng âm.

mb_internal_encoding("UTF-8"); $collator = collator_create('fr_FR'); $collator->setStrength(Collator::PRIMARY); $str1 = mb_convert_encoding('fêté', 'UTF-8'); $str2 = mb_convert_encoding('fete', 'UTF-8'); $result = $collator->compare($str1, $str2); kết quả echo $;
kết quả $Đây là số 0, nghĩa là các chuỗi bằng nhau. Đây là những gì bạn muốn.
Nếu bạn muốn tìm kiếm chuỗi con phù hợp trong một chuỗi theo cách này, bạn sẽ cần sử dụng tính năng khớp chuỗi con rõ ràng để thực hiện việc này. Công nghệ biểu thức chính quy không cung cấp điều này.
Đây là chức năng thực hiện tìm kiếm và chú thích (ví dụ: thêm Nhãn). Nó tận dụng tối đa sơ đồ bình đẳng ký tự của lớp Collator.

hàm annotate_ci ($haystack, $needle, $prefix, $suffix, $locale="FR-fr") { $restoreEncoding = mb_internal_encoding(); mb_internal_encoding("UTF-8"); $len = mb_strlen($needle); if (mb_strlen( $haystack ) < $len ) { mb_internal_encoding($restoreEncoding); trả về $haystack; } $collator = collator_create( $locale ); $collator->setStrength( Collator::PRIMARY ); $kết quả = ""; $vẫn = $haystack; trong khi ( mb_strlen( $remain ) >= $len ) { $matchStr = mb_substr($remain, 0, $len); $match = $collator->compare( $needle, $matchStr ); nếu ( $match == 0 ) { /* thêm chuỗi $needle phù hợp vào kết quả, kèm theo chú thích. * lấy chuỗi khớp từ $remain */ $result .= $prefix . $remain = mb_substr( $remain, $len ); } khác { /* thêm một ký tự vào $result, lấy một ký tự từ $remain */ $result .= mb_substr( $remain, 0, 1 ); $remain = mb_substr( $remain, 1 ); } } $result .= $remain; mb_internal_encoding($restoreEncoding); trả về kết quả $; }
Dưới đây là một ví dụ về cách sử dụng chức năng này.

$needle = 'Fete'; /* không có dấu phụ ở đây! $haystack= mb_convert_encoding('avec cộng với 40 nền văn hóa', 'UTF-8'); $kết quả = annotate_ci($haystack, $needle, '' , '');
nó trả lại

la paix fêtée avec plus de 40 culture

Về việc kết hợp biểu thức chính quy trong php cũng tương tự như các chữ cái. Còn được gọi là u=ü hoặc ê=é=è=e, chúng tôi đã tìm thấy một câu hỏi tương tự trên Stack Overflow: https://stackoverflow.com/questions/40436672/

Bài viết khuyến nghị: php - Django so với ASP.NET MVC so với khung PHP - chi phí

Bài viết khuyến nghị: Cách di chuyển Zend Framework 1 sang 3

Bài viết khuyến nghị: Lõi chia sẻ CakePHP cho nhiều ứng dụng

Bài viết khuyến nghị: Các tệp opcached PHP7 có thể được phân phối mà không cần mã nguồn không?

java - Sự khác biệt giữa add(E e) và Offer(E e) của lớp ArrayDqueue
Xin chào, tôi đã sử dụng tính năng thêm và ưu đãi ở bước cuối cùng để thêm các phần tử của mình. Cả hai đều trả về giá trị boolean và không đưa ra bất kỳ ngoại lệ nào ngoại trừ NPE. lớp công khai ArrayDequeDemo
Chuyển đổi các ký tự đặc biệt (é è ë) bằng mã hóa url
Tôi đang làm việc trên một tính năng trong đó ứng dụng email của người dùng chỉ mở nội dung được điền sẵn (javascript). Vấn đề là tôi gặp khó khăn khi chuyển đổi các ký tự đặc biệt nên chúng không hiển thị chính xác cho ứng dụng email (nội dung được gửi bằng url). tôi đã viết một lá thư
Bộ sưu tập java&Hàng đợi&ChặnHàng đợiphương thức add(E e) trong giao diện
Câu hỏi 1: Khi đọc mã nguồn JDK, tôi thấy rằng phương thức boolean add(E e); định nghĩa Collection & Queue & BlockingQueue trong giao diện.
sql-server-2005 - Làm cách nào để thực hiện so sánh không phân biệt trọng âm (e với è, é, ê và ë) trong SQL Server?
Tôi muốn so sánh hai varchar trong SQL, một cái tương tự như Cafe và cái kia là Café. Có cách nào trong SQL cho phép so sánh hai giá trị này không. Ví dụ: CHỌN * TỪ Địa điểm WHERE Na
Đối sánh biểu thức chính quy PHP tương tự như các chữ cái. Còn được gọi là u=ü hoặc ê=é=è=e
Tôi đang tìm cách tìm kiếm các từ cụ thể trong văn bản và đánh dấu chúng. Mã hoạt động hoàn hảo ngoại trừ việc tôi muốn nó khớp với các chữ cái tương tự. Ý tôi là, tìm kiếm fête phải phù hợp với fêté, fete,... Có cách nào đơn giản và tinh tế để thực hiện việc này không
Ngoại lệ Angular2: Không có nhà cung cấp cho e! (e -> e)
Vì vậy, tôi có một thành phần rất đơn giản để tải một bộ định tuyến đơn giản. Tôi đang sử dụng tất cả những thứ cơ bản như ngFor, ngSwitch, ngIf và tôi tiêm chúng qua COMMON_DIRECTIVES tôi nhận được
Làm cách nào để chuyển đổi é -> e, š -> s, ė -> e , ą -> a ... trong javascript?
Tôi có một chuỗi như Brazil: Série A và mục tiêu của tôi là chuyển đổi nó sang Brazil: Série A. Hơn nữa, phương thức cần chuyển đổi và các trường hợp tương tự khác: é -> e, š -> s, ė -> e , ą -
java-AbstractList - Sự khác biệt giữa các kiểu trả về của add(int index, E element), add(E e), v.v. là gì?
Như hiện tại, câu hỏi này không phù hợp với định dạng Hỏi & Đáp của chúng tôi. Chúng tôi mong đợi câu trả lời sẽ được hỗ trợ bởi các sự kiện, trích dẫn hoặc kiến thức chuyên môn, nhưng câu hỏi có thể gây ra tranh luận, tranh luận, bỏ phiếu hoặc thảo luận mở rộng. Nếu bạn cảm thấy vấn đề này có thể được cải thiện và có thể mở lại, hãy truy cập trang
StaticInjectorError[e -> e] : NullInjectorError: Không có nhà cung cấp nào cho e
Trong app.module.ts @NgModule của tôi ({ khai báo: [ AppComponent ], nhập: [ BrowserModule
CHỌN e Từ nhân viên e - tại sao lại có chữ "e" dư thừa?
Truy vấn mẫu: SELECT e FROM Nhân viên e WHERE SUBSTRING(e.name, 3) = 'Mac' Trong cú pháp này, có vẻ trực quan khi nói SELECT e, tức là bây giờ
object-c - Chuyển đổi tất cả các ký tự đặc biệt như ë, à, é, ä sang e, a, e, a? mục tiêu-c
Có cách nào dễ dàng trong Objective-C để chuyển đổi tất cả các ký tự đặc biệt (như ë, à, é, ä) thành các ký tự bình thường (như e en a) không? Câu trả lời hay nhất là có, và nó rất đơn giản: NSString *src = @"Conv
ruby - Trong Ruby, làm thế nào để chuyển đổi tất cả các ký tự đặc biệt như ë, à, é, ä sang e, a, e, a?
Tôi muốn chuyển đổi một ký tự như ë thành một ký tự e thông thường. Tôi đang tìm kiếm sự chuyển đổi về ngôn ngữ và cách mọi người nhập thành phố. Ví dụ: hầu hết mọi người thực sự gõ Brasilia khi tìm kiếm chứ không phải Brasília. Khi các tổ chức tin tức như Rueters đưa tin
javascript - function(e){e.something...} e là gì?
Khi tôi viết $("#new_lang").click(function(e) { notification("something"); e.stopPropagation(); }); e ở đây là gì,
Danh sách Java Đi tới Bản đồKhóa của > là thuộc tính nào đó của E và giá trị là E với thuộc tính đó
Tôi muốn biết cách chuyển đổi Danh sách Java thành Bản đồ. Các khóa trong bản đồ là các thuộc tính nhất định của các thành phần danh sách (các thành phần khác nhau có thể có cùng thuộc tính) và các giá trị là danh sách các mục danh sách này (có cùng thuộc tính). Ví dụ. Danh sách --> Bản đồ> . tôi đã tìm thấy
Tại sao chúng ta có các phương thức Offer(E e) và OfferLast(E e) trong Deque mặc dù chúng giải quyết cùng một mục đích
Tôi đang cố gắng hiểu tại sao chúng ta cần các phương thức Offer và OfferLast trong Deque, vì cả hai phương thức đều nằm ở cuối/đuôi của Deque. Vấn đề là gì? Câu trả lời đúng nhất là giao diện Queue (giao diện)
c# - Tạo e bằng biểu thức => new { e.Id, e.CompanyId }
Câu hỏi này là phần tiếp theo của câu hỏi này ở đây Nếu có ai thắc mắc tại sao tôi cần phải làm điều gì đó như thế này thì bạn có thể tìm thấy lý do căn bản trong câu hỏi đó. Nó không quan trọng, thực sự. Tôi cần một phương thức như thế này: Biểu thức ảo công khai>
Khi nào cần một số> thay vì Một số?
LƯU Ý: Câu hỏi này không liên quan gì đến Enum, vì vậy nó không trùng lặp. Enum buộc phải so sánh chỉ với chính nó vì trình biên dịch tạo ra các tham số kiểu chứ không phải do các tham số kiểu đệ quy của Java. Tôi đang cố gắng tìm lợi thế của việc khai báo lớp là: public class S
Khi nào cần một số> thay vì Một số?
LƯU Ý: Câu hỏi này không liên quan gì đến Enum, vì vậy nó không trùng lặp. Enum buộc phải so sánh chỉ với chính nó vì trình biên dịch tạo ra các tham số kiểu chứ không phải do các tham số kiểu đệ quy của Java. Tôi đang cố gắng tìm lợi thế của việc khai báo lớp là: public class S
c - Ví dụ về cấu trúc *e : sự khác nhau giữa hàm(&e) và hàm(e)
Nếu tôi có một ví dụ về cấu trúc *e, thì sự khác biệt giữa hàm (&e) và hàm (e) là gì? Một ví dụ. Đây là mã đầu tiên: #include struct example {
LINQ: Sự khác biệt giữa "chọn {e.FName, e.LName} mới" và "select (e.FName, e.LName)"?
Câu hỏi này đã có câu trả lời ở đây: C# 7.0 ValueTuples so với các loại ẩn danh (2 câu trả lời) Đã đóng vào năm ngoái. Sự khác biệt giữa hai truy vấn này là gì? truy vấn var = từ ei

Hồ Xil

Hồ sơ

Tôi là một lập trình viên xuất sắc, rất giỏi!

Bài viết phổ biến của tác giả

Nhận phiếu giảm giá taxi Didi miễn phí

Các bài viết phổ biến trên toàn bộ trang web

trang đầu

đã học

6Ren·AI

Trung tâm mua sắm

Đối sánh biểu thức chính quy PHP tương tự như các chữ cái. Còn được gọi là u=ü hoặc ê=é=è=e