چند تذکر مهم در مورد جستجوى متن فارسى در اينترنت و اين سايت

کاراکترهاى فارسى و عربى در "يونى کد" Unicode بعضا مشترکند و بعضا متفاوت.

حروفى مثل "ح"، "م" و "ت" و خيلى هاى ديگر، عربى و فارسى شان عين هم است و همان يک کد را دارد. اما بعنوان مثال، "ک" هم فارسى دارد و هم عربى. ايندو حتى اگر عين هم بنظر برسند دو کاراکتر مختلفند: کاف فارسى ک و کاف عربى ك است. اولى کدش، همانطور که در جدول زير ميبينيد 06A9 و دومى کدش 0643 است. بنابراين اگر در سايت خود حکمت بدنبال لغت "حكمت" بگرديد که کافش کاف عربى است (و چون کاف کوچک است از ظاهرش چيزى معلوم نيست)، هيچ چيز پيدا نميکنيد!

اين تفاوتها در مورد حروف "ه"، "ي" و اعداد فارسى و عربى هم وجود دارد. اگر بدنبال ۱۹۱۷ در اين سايت بگرديد، هيچ چيز پيدا نميکنيد در حاليکه در مورد انقلاب ١٩١٧ خيلى چيزها در اين سايت نوشته شده است. علت اين است که اولى فارسى است و دومى عربى. تفاوتهاى ايندو وقتى روشن ميشود که کدشان را مقايسه کنيد: اولى کدش 06f1;06f9;06f1;06f7; و دومى کدش 0661;0669;0661;0667; است...

وقتى فونتهاى ويندوز يونى کد شدند دوران ويندوز ٩٨ بود. آنزمان ويندوز ميتوانست حروف و اعداد عربى را نشان بدهد اما قادر نبود همينکار را با حروف و اعداد فارسى بکند. بجاى آنها مربعهاى توخالى يا علامت سئوال نشان ميداد، يا موفق نميشد "ى" فارسى را به حروف مجاورش بچسباند... اين مشکلات را کسانى که از سيستم هاى قديمى استفاده ميکنند هنوز هم دارند. بنابراين در اين سايت از همان اول براى اجتناب از اين مشکلات از اعداد عربى، "ک" فارسى، "ي" و "ه" عربى استفاده کرده ايم و براى اينکه مشکلات ويندوز را دور بزنيم بجاى "ي" آخر که در فارسى نقطه ندارد از "الف مقصوره عربى" که کدش 0649 است استفاده کرده ايم. در تصوير بالا کاراکترهايى که در تکستهاى فارسى اين سايت بکار ميروند با حاشيه قرمز مشخص شده اند. در آينده که ديگر خط فارسى با کامپيوتر مشکلى نداشته باشد، همه اينها را ميشود با جايگزينى سراسرى يکباره فارسى کرد، اما در حال حاضر بايد بدانيد که براى جستجو در اين سايت کى بوردهاى فارسى ويندوز XP که همه چيز را فارسى مينويسد و درست نشان ميدهد اما اسنادش را کاربران ويندوز NT40 و ويندوز ٩٨ نميتوانند بخوانند، چندان بدردتان نميخورد. توصيه ما براى جستجو در اين سايت اين است که از ليستهاى صفحه جستجو "فهرست اعلام" و "فهرست موضوعات" تا حد امکان استفاده کنيد و اگر موضوع يا اسم خاصى را از قلم انداخته ايم تذکر بدهيد.

اما خط عربى و فارسى مشکلات مادرزادى دارند که با تغييرات ويندوز مايکروسافت حل و فصل نميشود. اگر به فرض بخواهيد دنبال نام کبرا عليزاده در اينترنت بگرديد بايد همه اين شکلهاى ممکن را بخاطر داشته باشيد:

کبرا عليزاده
کبرى عليزاده
کبري عليزاده
کبرا علي زاده
کبرى علي زاده
کبري علي زاده
کبرا على زاده
کبرى على زاده
کبري على زاده
کبرا علي‌زاده
کبرى علي‌زاده
کبري علي‌زاده
کبرا على‌زاده
کبرى على‌زاده
کبري على‌زاده
...

و بعد يادتان باشد همين ها را يکبار با کاف فارسى يک بار با کاف عربى يکبار با "ه" فارسى و يکبار با "ه" عربى تکرار کنيد تا همه پرموتاسيونهاى ممکن و صحيح را به گوگل داده باشيد.

تنها مزيت خط فارسى عربى به خط اوروفارسى اين است که اگر کبرى عليزاده در کامپيوترهاى اداره گذرنامه ايران ممنوع الخروج بوده باشد، بالاخره يکى از آنها ميتواند قانونا ورقه خروج از ايران را بگيرد!!