عبارت منظم برای حروف فارسی

تو یکی از برنامه هایی که مینوشتم نیاز بود یک ورودی از کاربر بگیرم که این ورودی فقط باید شامل حروف و اعداد فارسی میشد، انواع فاصله و نیم فاصله هم مجاز بود.

پیش خودم گفتم یه جستجو میکنم و نتیجه رو سریع پیدا میکنم ولی در کمال تعجب فقط چند تا عبارت منظم برای حروف عربی پیدا کردم و یکی هم برای حروف فارسی که البته همه حروف و نیم فاصله رو پوشش نمیداد.

برای درست کردن همچین عبارت منظمی اول باید میفهمیدم الفبای فارسی ما دقیقا شامل چه حروفی میشه.

ویژگی های خط فارسی در تارنمای فرهنگستان زبان فارسی چیزی بود که دنبالش بودم.

بعد از مشخص کردن حروفی که باید در عبارت منظم قرار داده میشد باید Codepoint اونها رو پیدا میکردم که از این تارنمای فوق العاده استفاده کردم.

تو پیدا کردن کدپینت فاصله و نیم فاصله کار خیلی مشکل شد چون تعدادشون زیاد و در جاهای مختلفی بودن.

نتیجه هم شد Regex.Persian.Language

امیدوارم به دردتون بخوره

جستجو در کل مطالب سایت

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *