رمزگشایی با آمار
به عنوان یکی از کاربردهای آمار در شاخههای دیگر علوم میتوان به کاربرد آن در مباحث مربوط به تحلیل متن اشاره کرد. این کارگاه که برگزاری آن را آقای احیایی، دانشجوی دکتری دانشکدهی ریاضی بر عهده داشتند و روزهای شنبه و یکشنبه اجرا شد، به دو نمونه از این کاربردها میپرداخت: شناسایی مؤلف یک اثر ادبی و رمزگشایی از متون رمزگذاری شده.
در مبحث شناسایی مؤلف، اثری وجود دارد که مؤلف آن مورد اختلاف است. برای مثال در این کارگاه شعری وجود داشت که آقای دُرفشان آن را سرودهی شهریار میدانست و آقای شعرباف معتقد بود از اشعار نظامی است. راهکار آماری که در این کارگاه برای حل این اختلاف ارائه شد، خوشهبندی اشعار بر مبنای درصد تکرر حروف اضافه در آنها بود. به این ترتیب که به هر شعر نقطهای در فضا نظیر میشد که هر مؤلفهی آن عبارت بود از درصد فراوانی نسبی یکی از چهارده حرف اضافهی مورد مطالعه به کل واژههای همان شعر. در مرحلهی بعدی این انتظار وجود داشت که نقاط متناظر اشعار شهریار در فضای چهاردهبعدی یک خوشه و نقاط نظیر اشعار نظامی خوشهای دیگر بسازند تا به این ترتیب محکی برای تشخیص شاعر واقعی به دست آید.
رمزگشایی از متون رمزگذاری شده، خود شامل دو فعالیت بود: آشنایی با آنچه آمار برای رمزگشایی انجام میدهد و دیگری ارائهی متنی که بخشی از آن رمزگذاری شده بود و مطرح کردن پرسشی که جواب آن در این بخش وجود داشت. نکتهای که این دو فعالیت را متمایز میکرد این است که وقتی با حجم بزرگی از متون رمزگذاری شده روبرو هستیم و ناگزیر از استفاده از ابزارهای آماری، روش مورد استفاده رمزگشایی با استفاده از فراوانی نسبی نمادها در متن است در حالیکه وقتی قطعهی کوچکی متن به رمز درآمده داریم احتمالاً با حدس زدن واژهای کوچک مانند حروف ربط، حروف اضافه، افعال پر تکرر و کم واج شروع خواهیم کرد و نتایج را در کشف کلمات بزرگتر به کار خواهیم بست.