رمزگشایی با آمار

احمد احیایی

به عنوان یکی از کاربردهای آمار در شاخه‌های دیگر علوم می‌توان به کاربرد آن در مباحث مربوط به تحلیل متن اشاره کرد. این کارگاه که برگزاری آن را آقای احیایی، دانشجوی دکتری دانشکده‌ی ریاضی بر عهده داشتند و روزهای شنبه و یک‌شنبه اجرا شد، به دو نمونه از این کاربرد‌ها می‌پرداخت: شناسایی مؤلف یک اثر ادبی و رمزگشایی از متون رمزگذاری شده.
در مبحث شناسایی مؤلف، اثری وجود دارد که مؤلف آن مورد اختلاف است. برای مثال در این کارگاه شعری وجود داشت که آقای دُرفشان آن را سروده‌ی شهریار می‌دانست و آقای شعرباف معتقد بود از اشعار نظامی است. راهکار آماری که در این کارگاه برای حل این اختلاف ارائه شد، خوشه‌بندی اشعار بر مبنای درصد تکرر حروف اضافه در آن‌ها بود. به این ترتیب که به هر شعر نقطه‌ای در فضا نظیر می‌شد که هر مؤلفه‌ی آن عبارت بود از درصد فراوانی نسبی یکی از چهارده حرف اضافه‌ی مورد مطالعه به کل واژه‌های‌‌ همان شعر. در مرحله‌ی بعدی این انتظار وجود داشت که نقاط متناظر اشعار شهریار در فضای چهارده‌بعدی یک خوشه و نقاط نظیر اشعار نظامی خوشه‌ای دیگر بسازند تا به این ترتیب محکی برای تشخیص شاعر واقعی به دست آید.
رمزگشایی از متون رمزگذاری شده، خود شامل دو فعالیت بود: آشنایی با آنچه آمار برای رمزگشایی انجام می‌دهد و دیگری ارائه‌ی متنی که بخشی از آن رمزگذاری شده بود و مطرح کردن پرسشی که جواب آن در این بخش وجود داشت. نکته‌ای که این دو فعالیت را متمایز می‌کرد این است که وقتی با حجم بزرگی از متون رمزگذاری شده روبرو هستیم و ناگزیر از استفاده از ابزارهای آماری، روش مورد استفاده رمزگشایی با استفاده از فراوانی نسبی نماد‌ها در متن است در حالی‌که وقتی قطعه‌ی کوچکی متن به رمز درآمده داریم احتمالاً با حدس زدن واژه‌ای کوچک مانند حروف ربط، حروف اضافه، افعال پر تکرر و کم واج شروع خواهیم کرد و نتایج را در کشف کلمات بزرگ‌تر به کار خواهیم بست.