بسم الله الرحمن الرحیم

اشتقاق و فقه اللغة با هوش مصنوعي

الفهرست العام
کتاب و کتابخانه
یادداشتها
آقا سعید ص

المعاجم واللغات
زبانشناسی-زبان-الفبا-خط
الاشتقاق-اشتقاق كبیر
الاشتقاق الكبیر في القرآن الكریم-ارسال آقا سيد مرتضی
هوش مصنوعي
فهرست جلسات فقه هوش مصنوعي

(- پیش از شروع گفت‌وگو: اشاره‌ای به نگاه مکملیت بین هوش مصنوعی اتصال‌گرا و هوش مصنوعی نمادگرا)

- از همان کتابهایی که مباحثه می‌کردیم مثل دراسات فی فقه اللغة صبحی صالح، با یک چیزهایی برخورد می‌کردیم که خیلی عجیب بود از این جهت که خود را با یک بستر بسیار گسترده مواجه می‌دیدیم که استحضار نسبت به مطالب آن بستر به نحو جمعی نیاز بود و از طرفی هم ممکن نبود.

بعد که مباحث تکنیکی پیش می‌رفت و با آن آشنا می‌شدم، می‌دیدم که آن استحضاری که به آن نیاز داریم و برایمان ممکن نبود که مطالب را در حافظه احضار کنیم و برایمان سخت بود، انجام می‌دهد و در آنچه که ما در اشتقاق کبیر، اکبر و کبّار به دنبالش بودیم، خیلی می‌تواند کمک کند. و با پیشرفت‌‌های جدیدی که در هوش مصنوعی رخ داده، می‌تواند کمک بیشتری هم متصور باشد.

البته ما ادعا نداریم که در زمینه اشتقاق و هوش مصنوعی چیزی بلدیم، اما مطالبی که به ذهن می‌رسد، عرض می‌کنیم برای اینکه شروع راه باشد.

این فضا آن اندازه که به ذهن ما می‌رسد، اعجاب‌آور است.

- به خاطر دارم که ابتدا که با زبان‌های برنامه‌نویسی آشنا شدم، متوجه شدم که خود برنامه‌نویس‌ها، نیاز به شیءگرایی را احساس کرده‌اند و در کنار زبان C به مرور که زبان ++C را به میان آوردند، مایکروسافت هم زبان #C را آورد که از پایه شیءگرایی را مبنا قرار داده بود و نسبتاً سریع هم کتابش را در ایران ترجمه کردند و با آن آشنا شدیم و کار با آن را شروع کردیم. در اولین فرصتی که با پایتون آشنا شدم و دیدم که متن-باز است و آن مضیقه‌های #C را ندارد، سراغ پایتون آمدم.

در آن وقت پایتون ۲ بود و در اسم کلاس‌ها و متغیرها از unicode استفاده نمی‌کرد. پایتون ۳ در این جهت که هم از اساس شیءگراست و هم در نام کلاس‌ها و متغیرها از unicode پشتیبانی می‌کند (مثل #C)، خیلی خوب شده؛ خوبی unicode این بود که برای کلاس‌ها و متغیرها ما از همان لفظ مأنوس خودمان استفاده می‌کردیم و مجبور نبودیم که از حروف لاتین استفاده کنیم و گیر این بیفتیم که حروفی مثل "خ" و "غ" و ... را چطور بنویسیم. بعد هم که انسان انس بگیرد، می‌بیند که خواندن اسم کلاس‌ها و متغیرها خیلی راحت است.

البته کار را نتوانستم ادامه دهم، اما ابتدا که شروع به پروژه الاشتقاق کردم با #C آغاز کردم و بعد از آن با پایتون قدری ادامه دادم که فایل‌های اولیه آن هم به گمانم موجود است (پروژه الاشتقاق بر خلاف المبین که بر پایه html بود، با نگاه شیءگرایی و بر پایه برنامه‌نویسی بود). البته خوب است از افراد مجرب در این زمینه پرسیده شود که آیا اگر نام کلاس‌ها و متغیرها را فارسی بنویسیم، بعداً چه لوازمی دارد و آیا دست‌وپاگیر است یا نه؟

آنچه که در پروژه الاشتقاق - بر پایه این ایده که هرچه که داریم شیء است - به دنبالش بودم، این بود که گرچه ما در خود همین زبان‌های شیءگرا ما نوع داده رشته (string) را داریم که عناصر تشکیل دهنده آنها کاراکتر هستند، اما ما می‌خواهیم که این عوض شود و هر حرفی به جای اینکه یک رشته تک‌کاراکتری باشد، یک شیء باشد و وقتی می‌گوییم "ر" یک کاراکتر از یک رشته نباشد و خودش یک کلاس شیء باشد که برنامه ما کاملاً از خصوصیات آن - همچون معانی مختلفش و طبایعی که با آن در ارتباط هستند و همه آنچه که در فقه اللغة می‌خواهیم که از حروف و خصوصیات آنها حرف بزنیم - خبر دارد و تا به برنامه بگوییم "ر"، همه را دارد. این اصل ایده برای پروژه الاشتقاق بود.

وقتی چنین شد و یک برنامه پایتون داشتیم که پایه‌ای‌ترین برنامه ما برای فقه اللغة باشد، کلاس‌ها و فضاهای نامی را سامان‌دهی کنیم که در اینجور فضاها مهم‌ترین چیز را حروف داشته باشند.

- برای اینکه حروف شیء باشد با همه لوازمش، ما دو مسیر را می‌توانیم طی کنیم:

۱- مسیری که از پیکره زبان برسیم به حروف (شاید بتوان گفت با رویکرد از پایین به بالا)

۲- از حروف شروع کنیم و برویم تا برسیم به پیکره زبان (شاید بتوان گفت با رویکرد از بالا به پایین)

نظیر تفاوت میان Joomla با Drupal که هردو مدیریت اطلاعات می‌کنند ولی تا جایی که به خاطر دارم، Drupal داده‌محور بود و اول داده‌ها را که به او می‌دادیم در بانک برچسب‌زنی می‌کرد و از داده‌های منفرد پایگاه دانش را بنا می‌کرد و آنها را سامان‌دهی می‌کرد. اما Joomla برعکس بود و می‌گفتند شما اول یک درخت داده درست کن و یک کلی بگو که چند زیرشاخه دارد و به آن ساختار بده. این دو جور رویکرد است که البته من بعداً بیشتر رویکرد Drupal را پسندیدم چون یک فوائدی داشت که آدم خودش باید لمس کند.

نکته مهم در این دو مسیر که بعداً برای هوش مصنوعی هم اهمیت دارد، این است که گاهی به‌صورت یک پروژه و یک رشته علمی کاری را شروع می‌کنیم و تا آخر ادامه می‌دهیم. معمولاً در پروژهای منفرد یک چیزهایی برجسته می‌شود و بعضی جهات دیگر - اگر هم وجود داشته باشد - حالت جنبی پیدا می‌کند و به نحوی باطن - نسبت به ظاهر - می‌شوند و این یک معایبی دارد. پیشنهادی که من دارم این است که چند پروژه با مقصدهای مستقل تعریف کنید ولی از اول بدانید که مقصود اصلی شما - همانطور که در فضای رشته‌های دانشگاهی یک رشته‌هایی داریم و یک مباحثی هم بین رشته‌ای هستند - این است که کار بین پروژه‌ای هم حتماً انجام دهید. اما دلیل اینکه چند تا پروژه مستقل تعریف کنیم، این است که تجربتاً وقتی یک پروژه جامع تعریف می‌کنیم، بعضی از آنها لوث می‌شوند و خواص خود را به‌خوبی نشان نمی‌دهند.

گاهی به ذهن می‌آید که یک برنامه باید باشد که یک قاعده فقه اللغة را الی النهایة روی مبنای خودش پیش ببرد. مثل آقای حسن جبل که در کتاب خودش روی مبنایی که خودش از اول تعریف کرده، کار را تا انتها پیش برده و حال آنکه مثلاً اگر می‌خواست با ذهن من هم همکاری کند، کار او سر نمی‌رسید. بعداً دیگران هم روی یک مبنای دیگر، یک پروژه را تا انتها پیش می‌برند و سر می‌رسانند، اما مقصود نهایی این است که حتماً خروجی این پروژه‌ها را با هم مرتبط کنیم و مکمل یکدیگر قرار دهیم. فایده این راه این است که آنچه که یک پروژه استقلالاً دارد، این استقلالات در هنگام جمع شدن با پروژه‌های دیگر لوث نمی‌شود. بنده یک چیزهایی را برخورد کرده‌ام که این را دارم عرض می‌کنم. لذا به جای یک پروژه جامع، بهتر آن است که چندین پروژه باشند که در آخر کار به نحو بین‌رشته‌ای از آنها نتیجه‌گیری شود.

الآن هم عرض بنده در نتایجی که بشر به نحو بالفعل گرفته، خیلی روشن است. مثلاً فیزیک علمی است که برای خودش پیش رفته و رشد کرده و روانشناسی هم یک علم مستقلی برای خودش است که متخصصین کارها کرده‌اند و پیش رفته‌اند. همین‌طور جامعه‌شناسی و اقتصاد که هر کدام یک رشته مستقل بوده‌اند. اما وقتی علوم بشر پیشرفت کرد، هر کدام احساس کردند که دیگران در  علوم خودشان یک پیشرفت‌هایی داشته‌اند که خیلی به درد ما می‌خورد. لذا الآن بشر نیامده بگوید یک پروژه جامع داشته باشیم، چراکه پروژه جامع یک نقایصی دارد و سراغ علم جامع نرفته که علم جامع درست کند، بلکه می‌گوید " بین رشته‌ای"؛ یعنی من استقلال را از آن رشته‌ها نمی‌گیرم، اما از دستاوردهای هر کدام در دیگری استفاده می‌کنم. نتیجه این رویکرد مثلاً در تفاوت روانشناسی نیمه اول قرن بیستم با نیمه دوم آن و مخصوصاً بعد از قرن بیست‌ویکم نمود پیدا کرده که وقتی روانشناسی، بین رشته‌ای شد، اصلاً تفاوت جوهری پیدا کرد. جامعه‌شناسی و سایر علوم هم همینطور. چراکه می‌دیدند که وقتی از دستاوردهای علوم مستقل دیگر استفاده می‌کنیم، فضای تحقیق و علم ما و پیشرفتمان از زمین تا آسمان تفاوت می‌کند.

- این انگیزه که بستری برای کارهای پژوهشی و پروژه‌های مختلف فراهم شود، انگیزه درستی است که وقتی بستر مناسب فراهم شود، هر فکر و ایده‌ای بعداً می‌تواند فوائد خودش را در این بستر به بروز و ظهور بیاورد، به خلاف اینکه از ابتدا او را کانالیزه کنیم و نگذاریم. تمام فکر بنده - حتی در پروژه المبین - این بوده که مؤید محقق باشیم، نه تعیین‌کننده چیزی برای او.

- پیشنهاداتی که در ذهن من است این است:

- پیکره را دو جور اعمال می‌کنیم؛ به وزان همان دو رویکردی که گفته شد. اصطلاح پیکره - اگرچه در زبان‌شناسی هم دارند - اما رایج شدن بیشترش در فضای هوش مصنوعی بعد از اتصال‌گرایی و نسل دوم مهم شده و وقتی در فضای قاعده‌محور بودند، پیکره‌ها چندان حرفی برای گفتن نداشتند. بعدها بود که جالب شد. در خصوص پیکره، پیشنهاد من این است که در ابتدا پیکره، جامع باشد؛ یعنی نه محدود به مثلاً کتاب العین، بلکه بالای ۴۰۰ کتاب لغت، بالای چندین هزار کتاب تفسیر و ...؛ همه اینها پیکره‌ای باشند که بعداً بخواهند پایگاه دانش و هرم دانش را تشکیل دهند. هرچه پیکره را محدود در نظر بگیریم، معلوم نیست که به نفع کار باشد. بله، برای رویکرد قاعده‌محور اگر بخواهیم پیش برویم، مانعی ندارد، اما با نسل دوم که بخواهیم جلو برویم، هرچه پیکره وسیع‌تر باشد، راندمان کار بالاتر می‌رود.

لذا پیشنهاد من این است که در ابتدای کار، پیکره را جامع کتب لغت، تفسیر و فقه قرار دهیم. دلیل اینکه کتب فقهی را هم نام بردم برای این است که بسیاری از مطالب لغوی مهم مورد بحث فقهاء قرار گرفته است. غیر از اینکه من همیشه می‌گفتم که کتاب مجمع البیان که یک کتاب تفسیری است، از مصادر لغت است، می‌توانیم بگوییم که یکی از مصادر و منابع مهم لغت هم کتاب جواهر است؛ واقعاً جواهر مباحث لغوی خیلی خوبی دارد که من برخورد کرده‌ام. لذا ما پیکره را وسیع در نظر می‌گیریم و چون الآن تکنیک طوری است که می‌گویند به سخت‌افزار رحم نکن و اینگونه نیست که بگویند ماشین، حافظه کم می‌آورد و ...؛ در فضایی که با رویکرد قاعده‌محور و مقدماتش مشغول بودند، کم می‌آوردند و وقتی می‌خواست واحدی را که پردازش می‌کند در صفحه قرار دهد، هرچه این صفحه می‌خواست گسترده شود، ماشین هنگ می‌کرد و دیگر نمی‌توانست محاسبه کند؛ در نسل دوم (اتصال‌گرایی) چنین بود و در نسل نمادگرایی هم طور دیگری بود که حالا ما می‌خواهیم از مزایای هر کدام از این رویکردها استفاده کنیم.

امروزه که سروکار ما با اتصال‌گرایی و نسل دوم است، به راحتی می‌توانیم با تکنیک‌هایی که وجود دارد از یک پیکره‌ بسیار گسترده استفاده کنیم؛ در تکنیک‌های امروز، روش ابتدائاً اصلاً به صورت اسم و فعل و حرف نیست؛ خصوصاً با آن چیزی که ما می‌خواهیم.

پردازش زبان طبیعی که یکی از مهم‌ترین چیزهایی بوده که - مخصوصاً بعد از سال ۲۰۱۰ - خیلی پیشرفت کرده و دارد به اوج خودش نزدیک می‌شود، قبلاً خیلی مشکل داشته و زمستان هوش مصنوعی که در دهه ۸۰ رخ داد، یکی از مشکلاتش این بود که پردازش زبان طبیعی کم آورد و با طریق قاعده‌محور نتوانست به سرانجام برسد و پول‌ها هدر شد و دولت‌ها هم بودجه‌ها را قطع کردند و پروژه‌ها روی زمین ماندند.

بعداً که نسل دوم مطرح شد (اگرچه قبلاً هم مطرح بود و با نمادگرایی با هم رشد کرده بودند، اما وقتی زمستان برای این روش پیش آمد این روش کم‌کم ادامه داد و به یک نتایج خیلی خوبی رسید) مسیری که جلو رفت این بود که از طریق آمار، در پیکره، کلمه بعدی را حدس بزنند. اینگونه که جای کلمه‌ای را خالی می‌گذاشتند و در ابتدا که در جمله‌ها و با تک کلمه‌ها این کار را انجام می‌دادند، مثلاً در جمله "حسن از تهران ..." او با کارهای آماری بر روی جمله‌ها در پیکره باید می‌توانست حدس بزند که کلمه "آمد" در اینجا بوده. نکته این است که در اینکه در یک جمله بگوییم "حسن از تهران پیامید"(با فرض اینکه در یک زبانی "پیامیدن" داشته باشیم) مردد می‌شود که آن کلمه "آمد" بوده یا "پیامید". برای اینکه بفهمد کدام یک از آن دو کلمه است، یک قطعه و بخشی از متن را که با ملاحظه آن می‌توانست حدس بزند و تشخیص دهد که این کلمه چه بوده، به او می‌دادند. در این مسیر با مشکل پردازش و حافظه مواجه می‌شدند که باید پردازشگر مثلاً یک صفحه را پردازش می‌کرد و گاهی نیاز بود مثلاً ده صفحه را پردازش کند تا بتواند آن کلمه را بفهمد و حدس بزند. بعد تکنیک‌هایی را به‌کار بردند برای اینکه هنگ نکند و زمان پردازش آن زیاد طولانی نشود؛ تکنیک‌هایی همچون درخت تصمیم، توجه، embedding (تعبیه) و ...؛ این embedding نقش خیلی بیشتری از موارد قبلی داشت.

البته سیر پیشرفت آن خیلی جالب است و هر کدام قدم به قدم مشکلاتی را که با آن مواجه می‌شدند را برطرف می‌کردند و همه هم بر مبنای آمار در کلمات بود، نه بر مبنای معنا؛ در رویکرد نمادین، سروکار برنامه با معانی می‌شد و مقصود از نمادها، معانی بود، اما در روش اتصال‌گرایی اصلاً معنا میزان نیست و اینکه حدس می‌زند که مثلاً کلمه "آمد" باید در جای خالی قرار گیرد، فقط با تعداد کاربرد و همراه بودن اینها در کل زبان - باهم‌آیی آماری، نه باهم‌آیی معنایی - کار دارد. و جالب این است که بعداً در همین باهم‌آیی آماری معنا و ارتباطات معنایی هم مکشوف می‌شود. لذا در embedding تا اندازه‌ای که من می‌دانم، هر کلمه‌ای را که در یک بافت است به یک بردار تبدیل می‌کند و بعداً در یک پیکره، یک بردار داریم. همانطور که در یک بافت کوچک و در یک صفحه، یک کلمه embed می‌شود و بردار تشکیل می‌شود، در کل زبان فارسی هم یک واژه پس از مراحل آموزش یک بردار دارد. (۴۳د)

- پس از بیان این مقدمات، به مقصود خودمان در بحث فقه اللغة برمی‌گردیم؛ وقتی می‌خواهیم در فقه اللغة کار کنیم، هرگز از طریق این پردازش زبان طبیعی معمول جلو نمی‌رویم و روش ما از اساس فرق می‌کند. پردازش زبان طبیعی معمول، واژه‌محور بوده و الآن هم که پیشرفت کرده، جمله‌محور شده؛ یعنی وقتی در آن masking می‌خواستند حدس بزند که به جای این واژه چه چیزی قرار دهیم و چند گزینه داریم و در درخت تصمیم باید چکار کند - که گاهی هم به صورت تصادفی (random) انتخاب می‌کند - و الآن هم که پیشرفته‌تر شده، جمله‌محور شده و آن mask ما جمله است که می‌خواهیم حدس بزنیم که آن جمله چیست، اما در فقه اللغة masking بر اساس حروف است و نه واژه‌محور است و نه جمله‌محور، بلکه آن چیزی که روی آن mask می‌زنیم، حرف است. در ابتدای عرایضم هم گفتم که ما با حرف به عنوان یک شیء برخورد کردیم و برای ما یک شیء نقش‌آفرین در کل پیکره است. بنابراین ما دو مسیر را بعداً‌ می‌توانیم طی کنیم: ۱- مسیری که روی تک تک حروف mask بزنیم که البته این را در پردازش و تحلیل صرفی (stemming/lemmatitzation/tokenization) که اصل و اساس کار امروزه token است که قبلاً‌ واژه‌محور بود و هر token یک واژه بود و parser آن بر اساس فضای خالی (space) عمل می‌کرد.

در زبان فارسی دو-سه کتاب خوب هم پیدا کردم که از یکی از اساتید دستور زبان است و در این رشته پردازش زبان طبیعی توسط ماشین هم زحمت کشیده و بعدها قدر ایشان را خواهند دانست که یک پل برقرار کرده بین زبان‌شناسی که رشته ایشان بوده با آماده کرده زبان فارسی برای tokenگیری و آماده کردن بستر برای پردازش زبان طبیعی در ماشین که من مقاله ایشان را هم دیدم که خیلی مقاله خوبی است.

ما چون دنبال این هستیم که با حروف به عنوان یک کاراکتر برخورد نکنیم و چون خیلی با آن کار داریم و بیش از یک کاراکتر است، ما در برنامه خودمان پیکره داریم، اما با پشتوانه rule که بعداً‌ در پروژه‌های مستقل ضمیمه می‌کنیم و خروجی‌های آن را می‌گیریم، مقصود ما این است که ببینیم که بعداً ما در آمارگیری و باهم‌آیی در محور همنشینی و در محور جانشینی - که این دو را ترکیب می‌کنیم مآلاً در تحلیل آماری - باید به دو چیز اهمیت بدهیم: ۱- آنچه که روی آن mask زده شده، تشخیص داده شود و ۲- اینکه ببینیم کجا قرار گرفته است. ما یک نحو (syntax) در کل بافت داریم و در صرف هم یک نحو (syntax) داریم که من اسم آن را نحوِ صَرف می‌گذارم؛ چون نحو یعنی ساختار؛ ساختاری در محور همنشینی و اگر همنشینی بین کلمات و tokenهای رایج است، در محور همنشینی روی یک token که در حالت عادی کلمه است، mask می‌زنیم و کار ما واژه‌محور می‌شود، اما اگر در صَرف داریم tokenبندی می‌کنیم، token ما یک حرف است، چون با ساختار کلمه سروکار داریم. پس وقتی نگاه ما، نگاه صرفی است، tokenهای ما حروف می‌شوند. یعنی وقتی یک واژه می‌آید، وقتی روی یک حرف آن mask می‌زنیم، یعنی دیدگاه ما صرفی است و ما می‌خواهیم در یک کلمه تشخیص بدهیم که این حرفش چیست. آنچه که بعداً بسیار برای ما مهم است، این است که ما دو طبیعت در ساختار صرفی داریم: یکی طبیعت ماده و دیگری طبیعت هیأت که باید برای هر دوی آنها فکر کنیم (که در هوش مصنوعی بعداً‌ خواهیم دید که چه استفاده‌هایی از آن می‌شود). پس وقتی mask می‌زنیم، این mask ما دو چیز را باید ملاحظه کند: یکی ملاحظه کند که این token و این mask روی حرف، کجای کلمه ماست (که در بحث صرف می‌دانیم که قرار است روی کلمه پردازش انجام شود و الآن دیگر فعلاً کار با کل جمله نداریم و بعداً به آن می‌رسیم)، و یکی اینکه ترتیب آن چیست؟ فاء الفعل است یا عین الفعل یا لام الفعل است یا جزء حروف زوائد است یا جزء آنهایی است که قلب یا ابدال در آن صورت گرفته؟ من اسم این را طبیعت صرفی و هیأت می‌گذارم که در مقابل طبایع ماده است. این برای زبان‌های قیاسی مثل عربی است.

در زبان‌های انضمامی - که قیاسی نیستند و «وندی» هستند - یک جور دیگری است. و لذا اینکه گفتم پروژه‌های مستقل تعریف می‌کنیم، برای این است که ما یک قواعدی داریم در یک زبانی که بسیار راندمان بالا دارند و اگر ما پروژه جامع تعریف کنیم، راندمان پایین خواهد آمد (مثل همین وندی بودن که در زبان‌هایی مثل فارسی حالت غالبی دارد، اما در زبان عربی در برخی موارد مثل رباعی‌هایی که بر پایه تکرار ثنائی‌ها ساخته می‌شوند هم وجود دارد). مابرای همه اینها به‌صورت مجزا پروژه داریم و به‌خوبی و زود به نتایج خاص خودشان می‌رسیم و بعد در نهایت به شکل بین رشته‌ای و بین پروژه‌ای بهترین استفاده را از آنها می‌کنیم. این تأکید بر اینکه به‌صورت بین پروژه‌ای کار شود، به خاطر تجربیاتی است که شاید الآن نتوانم تفصیلاً‌ بگویم، اما به وضوح به این رسیده‌ام که اگر اینطور پیش برویم، بهتر است. البته اینکه در آینده چطور کار کنند و به چه نتایجی برسند در این مورد، ما نمی‌دانیم و فعلاً به عنوان یک ذهن داریم آنچه که برایمان واضح شده را عرض می‌کنیم. بنابراین اگر بخواهیم که اینها جامع شود، به جای امثال کتاب العین، پیشنهاد می‌کنم که به‌عنوان یک پروژه مستقل کامل روی کتاب حسن جبل کار شود. به‌خاطر اینکه راندمان هوش مصنوعی rule-based (قاعده‌محور) در این کتاب بسیار بالاست. رویکرد آماری در یک پیکره دیگری خوب جواب می‌دهد. یعنی از کتاب حسن جبل برای روش نمادین پیکره‌ای درست کنیم که کتاب را به نحو قاعده‌محور بررسی کنیم و پایگاه دانش بر اساس باهم‌آیی نیست، بلکه بر مبنای آن چیزهایی است که آقای حسن جبل قاعده‌هایش را بیان کرده.

الآن هم پردازش زبان طبیعی در رشته‌های ریاضی خیلی نمود قابل توجهی ندارد و وقتی می‌خواهند پیشرفت کند، همان روش‌های خودشان - مثل روشی که تورینگ آورد - کارآیی دارد و در ریاضیات، چنین روشی جلوه می‌کند و کتاب آقای حسن جبل ساختار ریاضی دارد. تا مقدمه آن روشن نشود، فایده ندارد و مقدمه آن را هم باید تدریس کنید و برای متعلمین به‌خوبی توضیح دهید تا بعد بفهمند که این کتاب چکار کرده و این پروژه چیست. البته باید تذکر داده شود که این کتاب، اگرچه بسیار خوب است اما خدا نکند که این کتاب محور شود، چون مضیقه‌هایی در آن است که جلوی پیشرفت را می‌گیرد. ایشان بستر قابل گسترش فراهم نکرده و ruleهایی که او اعمال می‌کند، یک مضیقه‌هایی برای تحقیقت آینده فقه اللغة می‌آورد. لذا کتاب ایشان، خودش یک پروژه شود و روی خروجی‌های آن هوش مصنوعی اعمال شود و بارور شود، اما محور برای همه چیز نباشد، بلکه یکی از چیزهایی باشد که به‌صورت بین پروژه‌ای از آن استفاده می‌شود. ولی خوبی‌ای که کتاب ایشان دارد این است که شیء بودن هر حرف در این کتاب خیلی خوب می‌تواند برجسته شود، چون بر خلاف کتب لغتی مثل العین و لسان العرب، که مبنای آنها حرف به عنوان یک مؤلفه مستقل نیست و هرچند در کتابی مثل العین گاهی تذکر داده می‌شود که این حرف با این حرف در کلمات عرب جمع نمی‌شود و ... اما روی ماده دور می‌زند و اینها تذکرات گذرا و جنبی است (مثل فرق ++C است با #C و پایتون که بخشی از ++C شیءگرایی بود و کسی که برنامه به زبان ++C می‌نویسد می‌تواند از شیء گرایی استفاده کند، اما کسی که به #C برنامه می‌نویسد، نمی‌تواند از شیءگرایی استفاده نکند چون مبنایش شیءگرایی است) ، این کتاب آقای حسن جبل هم مبنایش بر شیء بودن هر حرف است و لذا در کتاب ایشان، هر حرف یک کاراکتر نیست، بلکه یک شیء است و در مقدمه هم اینها را توضیح می‌دهد. ایشان تا آخر کتابش تلاش می‌کند مبنا را حفظ کند - در حد همین کار یک‌نفره که خودش بوده - و مبنای ایشان این است که با شکل حرف کار ندارد و مبنایش بر صوت است و همانطور که مرتب تذکر داده می‌شد که یادمان باشد که واج با نقش حروف کار ندارد و تا می‌گوییم «واج» آدم کور و بچه مدرسه نرفته به یادمان بیاید که هیچ نقشی از حروف در ذهنشان نیست و فقط صوت است و لذا گفتم که آقای دوسوسور در کتاب زبانشناسی عمومی می‌گفت که آن چیزی که حتی زبانشناسان هم آن را مخلوط می‌کنند، تازه شروع بحث ماست و اصطلاح واج دقیقاً برای صوت است. خوبی کتاب آقای حسن جبل این است که اصلاً از اول تا آخر کتاب سروکارش با واج من حیث هی صوت است و با تصوّت آن کار دارد و با نقوش و چیزهای دیگر آن کار ندارد؛ خب این یک پروژه است برای خودش که یک کتابی با ساختار ریاضی‌مانند و فقط هم با آکوستیک و فونتیک سروکار دارد و فقه اللغة را سامان‌دهی می‌کند. اینجا باید هوش مصنوعی از دو مسیر کار کند: یک مسیر rule-based و یک مسیر آمارمحور. من نمی‌خواهم آن روش را نفی کنم، بلکه می‌خواهم تأکید کنم که کتاب آقای حسن جبل بیشتر با rule-based تناسب دارد. البته اتصال‌گرایی هم اگر روی آن کار کند، فوائد خیلی زیادی دارد که بعداً اگر اعمال شود، دیده خواهد شد. مثلاً دو پروژه روی المعجم الاشتقاقی ایشان تعریف می‌شود که یکی بر مبنای آمارگرایی و با هم آمدن و یکی هم بر مبنای قاعده‌محوری که قاعده‌ها را نگاه می‌کند، نه صِرف با هم آمدن‌ها را؛ این دو پروژه، خروجی‌های خیلی خوبی دارند و در آخر کار، یک متخصص بین خروجی این دو جمع می‌کند و یک پروژه هوش مصنوعی بین پروژه‌ای بین همه اینها اعمال می‌کند و شروع به استفاده از خروجی همه اینها می‌کند.

- دو مسأله در اصول و تفسیر داریم که در فقه اللغة خیلی تفاوت می‌کند. یکی مسأله اینکه یک جمله‌ای را در محور جانشینی چند جور می‌توان ادا کرد. یکی هم استعمال لفظ در اکثر از معناست. برای این دو وادی در فقه اللغة باید حساب باز کنیم، حالا به عنوان دو پروژه نمی‌دانم، اما باید آن را در نظر داشته باشیم. این بسیار اهمیت دارد که مثلاً در جمله مبارک «مالک یوم الدین» و «ملک یوم الدین» وقتی شما دو قرائت دارید، دو لفظ دارید، پس دوتا دال دارید و قهراً در رابطه‌اش با معنا، دوتا مدلول دارید. اما در استعمال لفظ در اکثر از معنا، دقیقاً‌بحث این است که یک دال دارید، اما دوتا معنا را استقلالاً‌قصد می‌کنید. بعداً ما در فقه اللغة و پیشرفتش برای تفسیر، باید این دو را از هم جدا کنیم؛ یعنی یک کار داشته باشیم برای اعمال هوش مصنوعی با دیدگاه استعمال لفظ در اکثر از معنا با وحدت دال، و یک دیدگاه داشته باشیم در انعطاف دال به‌صورت دوال متعدده و مدالیل متحده یا مدالیل متباینه. (۱ساعت و ۴دقیقه)

- سر و کار علم عَروض نه با حرف است،نه با واژه است و نه با نحو. جوهره الی علم عروض، سر و کارش با وزن است. وزن اساساً خودش را در خط نمی‌تواند نشان دهد و خط به عنوان نقش محض اصلاً عروض ندارد و علم عروض در مورد آن مطرح نیست و شما هر کجا را می‌توانید بینش فاصله بیندازید و خیال کنند شعر است و حال آنکه شعر نیست و خط، خط است. اساس علم عروض هم - دقیقاً به همان معنایی که دوسوسور گفت و من هم الآن دارم عرض می‌کنم و کتاب آقای حسن جبل هم خیلی زیبا بر همین مبناست - بر صوت است، اما صوتی که تفاوت خیلی مهمی با دیدگاه آقای حسن جبل، دیدگاه فونتیک و دیدگاه آکوستیک دارد.

عروض یک نحو صوت گسترده دارای ساختار و محور هم‌نشینی است؛ یعنی شما می‌خواهید از اصواتی در یک محور هم‌نشینی گسترده، کشف الگو و ریتم و امثال اینها کنید؛ بحرها (همچون بحر تقارب و ...). اگر صوت نداشته باشید، بحر ندارید. ولذا وقتی ما می‌خواهیم در فقه اللغة کار کنیم، در مآل می‌بینیم برای اینکه در لغت - به عنوان یک زبان - حروف بتوانند آن نقش مستقل اصلی خودشان را ایفا کنند، حتی به بحرها هم مربوط می‌شوند؛ اینقدر کار ظریف است. لذا آن ماسکی که در عروض می‌زنیم، پشت ماسک ما نه یک واژه است و نه یک جمله است، بلکه یک سیلاب (syllable) است (چنانکه در اوزانی مثل مفاعلٌ فعولٌ ... خود را نشان می‌دهد). علم عروض که مؤسس آن خلیل بوده، علمی بسیار عال العال است.

زبانشناس‌های شناختی امروز، بافت را محور قرار می‌دهند و باز با معنا سر و کار دارند، اما علم عروض چون سر و کارش با بحر است، اصلاً کار به معنا ندارد و فقط اوزان را تنظیم می‌کند - صوت بما هو صوت. نظیر آن در صورت‌گرایی بود که در اتاق چینی می‌گفتیم که زبان صوری محض و استنتاج صوری باشد. صوری‌سازی محض مقطع‌های اصوات و سیلاب‌ها که سیلاب‌ها را طوری maskزنی می‌کنند که اصلاً کاری با معنای پشت صحنه او کار ندارند و فقط با وزن آن کار دارند، اما بعد از اینکه عروض را صوری‌سازی محض کردند، معنادهی می‌کنند؛ و چه معنادهی‌های جذابی! مثلاً می‌گویند این بحر و وزن و دستگاه، خواب‌آور است اما آن یکی گریه‌آور و دیگری سرورآور است؛ فقط خود صوت! اصلاً کاری به این ندارند که محتوای آن معارفی است یا بد است، بلکه آن ضرب‌آهنگ و ریتم کار با دستگاهی که خدای متعال قرار داده، این حالت را ایجاد می‌کند. این به آن معناست که صوری‌سازی محض کرده‌ایم ریتم‌ها و مقطع‌ها را و بعد از صوری‌سازی محض، حالت‌دهی کرده‌ایم برای معنا که در اینجا دیگر مقصودمان از معنا معنای لغت نیست بلکه تناسب هر بحری است با آن تأثیرگذاری‌های روحی، روانی و معنای مناسب خودش (اما نه معنای لغوی و قاموسی) و آن معنایی که به حمل شایع ایجاد می‌کند. پس ان شاء‌ الله در آینده فقه اللغة، ارتباط وثیقی دارد با همان صوت‌ها. حروف که آنها را به عنوان شیء در نظر گرفتیم، محوری‌ترین چیز آن شیء، صوت آن است و بعداً هم که می‌خواهیم بگوییم که هر حرفی با یک معنا تناسب الهی دارد، آن صوت است که با معنا ارتباط طبعی برقرار می‌کند. البته بعداً هم به سراغ نقوش می‌رویم که خیلی گسترده است. اینکه اما صادق(سلام الله علیه) فرمودند «انّ فی الألف ستّ صفات» سراغ نقش آن رفته‌اند و آن روایت کاملاً به نقش حرف ارتباط دارد؛ اینها مربوط به مراحل بعدی است و قاطی هم نمی‌کنیم. اینکه من مرتباً تأکید می‌کنم، به خاطر این است که اول باید این جهات را جدا کنیم و بعد که حیثیات جدا شد، می‌توانیم بعداً پیوند بزنیم، به خلاف اینکه از اول قاطی باشد. آقای دوسوسور می‌گفت که بسیاری از آنهایی که اصلاً رشته‌شان هم زبانشناسی بوده، تفکیک صوت از نقش برایشان سخت است و در ذهنشان با هم جوش خورده است. وزن‌ها در عروض هم که اشاره شد، ریختش آنالوگ است، اما بعداً‌ همین‌ها را می‌توانند دیچیتالی کنند به صورت بسیار ریز. عرض شد دو مسیر متصور است که از حروف به سمت کلام و جمله و کتاب و کل یک پیکره زبان بیاییم یا از پیکره به صورت آماری و تحلیل با‌هم‌آیی embed کنیم و در آخر کار با بردار و تنسورها و نهایتاً از کل پیکره چیزهای خوبی استخراج کنیم - اما در رویکرد قاعده‌محور چیزهایی نهفته است که با رویکرد آماری و مبتنی بر اتصال‌گرایی به آنها نمی‌رسیم، کما اینکه در رویکرد اتصال‌گرایی یک چیزهایی داریم که از طریق دیگر نمی‌توانیم برسیم؛ لذا لازم است پروژه‌های مستقل داشته باشیم که در نهایت آنها را مکمل یکدیگر قرار دهیم.

- وقتی با حروف به عنوان شیء برخورد کردیم، هر شیء شؤونات مختلف دارد و دیگر یک کاراکتر نیست که بگوییم مثلاً «ر» و یک کد دارد و خلاص؛ نه، یک شیء است. وقتی یک شیء است همچنانکه می‌گوییم آقای زید شیء است (به عنوان یک نمونه از یک کلاس شیء، هرچند با یک نگاه دیگر خود زید هم می‌تواند یک کلاس باشد، به ملاحظه اینکه آن را طبیعت شخصیه لحاظ کنیم) که روح و روان دارد، بدن دارد، طفولیت دارد، بلوغ دارد، نفس کشیدن دارد، جمجمه دارد، اسم دارد و این اسم هم تلفظ دارد و ...؛ همه اینها مال زید است. اگر مثلاً با حرف «ر» به عنوان یک شیء برخورد کردیم، در این صورت «ر» یک تلفظ و صوت دارد و یک نقش دارد. خود صوت آن، طیف دارد؛ یک واج داریم و واج‌گونه داریم. هر حرفی که شما با آن برخورد می‌کنید، در هوش مصنوعی فقط با واج آن سر و کار نداریم، بلکه با تمام واج‌گونه‌های آن هم سر و کار داریم؛ واج‌گونه‌های آن که در محور جانشینی خودشان را نشان می‌دهند. ما در واج‌گونه‌های یک حرف خیلی چیزها درمی‌آوریم؛ چون مثل روانشناسان که می‌گویند زید دوشخصیتی است به این معنا که گاهی یک چیزهایی از او بروز می‌کند که گویا دیگر اصلاً‌ او نیست - مثل انسان‌ها در وقت غضب -، می‌گوییم وقتی به واج‌گونه‌های حروف هم ترتیب اثر بدهیم، همینطور می‌شود؛ یعنی مثلاً «ر» به عنوان یک طبیعت و یک کلاس، صوت آن یک واحد نیست، بلکه یک طیف است و از حیث صوتش به‌تنهایی، شخصیت‌ها دارد. کما اینکه در فونتش جورواجور است و در زبان‌های مختلف هم نقش‌های مختلف دارد و r که در انگلیسی می‌نویسند با «ر» که در فارسی می‌نویسند و با عبری و ... فرق دارد و با وجودی که همه می‌گویند «ر» اما آن نقشی که در انگلیسی برای آن می‌گذارند با آن نقشی که در فارسی می‌گذارند، فرق می‌کند. حتی در همین فارسی و عربی بعضی حروف فونت‌های مختلف دارد؛ مثلاً «غ» فونت وسط کلمه با آخر کلمه و اول کلمه و ... متفاوت است؛ اگرچه یک حرف است و صوت آن هم یکی است. و بعد حتی صوتش غیر از اینکه طیف دارد و واج‌گونه دارد، صوت‌ها و واج‌هایی دارد در جایگاهی که در ساختار زنجیره کلام - بر اساس نام‌گذاری‌ای که دوسوسور به زنجیره هم‌نشینی انجام می‌داد - قرار می‌گیرد که زبان‌شناسان روی آن تأکید می‌کنند. مثلاً (اینها مستند نیست و فقط برای روشن شدن مقصود دارم مثال می‌زنم) وقتی که «غ» بین دو حرف مثلاً هوایی قرار بگیرد، ریخت صوتش تغییر می‌کند و همین حرف وقتی مثلاً هم‌نشین می‌شود با یک حرف حلقی یا ... ریخت دیگری پیدا می‌کند و دستگاه صوت‌سنج این تفاوت‌ها را تشخیص می‌دهد. اینکه عرض کردم اهمیت دارد که ترتیب حرف در کلمه کجاست، یعنی روی ترتیب حساب باز کرده‌ایم و همینجوری رد نمی‌شویم. بنابراین در محور همنشینی و اینکه کجای کلمه قرار گرفته، بعداً حتی در رابطه طبعی که با معنا دارد، اثرگذار است. و لذا مثلاً وقتی «غ» در یک کلمه می‌آید، نباید انتظار داشته باشیم که همان رابطه طبعی داشته باشد که در کلمه دیگر برقرار می‌کند، چون «غ» یک شیئی است که رابطه اصواتش با معانی یک طیف است و آن طیف، خودش را در کلمات مختلف به انحاء گوناگون نشان می‌دهد و همچون مباحث ژنتیک که یک اوصافی از یک ژنی در یک فردی ظهور می‌کند و بیشتر خودش را نشان می‌دهد و بقیه مخفی است، حرف هم به عنوان یک شیء با اوصافی که دارد، وقتی در کلمات مختلف می‌خواهد خودش را نشان بدهد، بعضی از آن طیف خودش را نشان می‌دهد، مثل ژنی که الآن فعال شده است. شما ببینید که بعداً هوش مصنوعی اگر از اینها استفاده کند، چه چیزها کشف می‌کند، چون اینها را به سرعت با هم ساماندهی می‌کند؛ الآن برای ما سخت است و مثال‌های آن یادمان می‌رود اما او این را در جاهای مختلف به خوبی اعمال می‌کند.

چیزی که در هوش مصنوعی نظارت‌نشده که امروزه داریم و ممکن است در خیلی از جاها خیلی صدمه بزند و باید کنترل شود، اما در مباحثه هم گفتم که یکی از محل‌های بسیار پرفایده برای هوش مصنوعی نظارت‌نشده، همین فقه اللغة است و یکی از پروژه‌هایی که بسیار کارساز است یک پروژه هوش مصنوعی نظارت‌نشده با روش آمارمحور یا تلفیقی از آمارمحور و قاعده‌محور در فضای فقه اللغة است، که بسیار پرفایده است؛ ما در فقه اللغة یک قواعدی را به عنوان یک الگو اعمال می‌کنیم، اما چون اطلاعاتمان و پیکره‌ای که در ذهنمان حاضر است، کم و محدود است، سبب می‌شود که کند جلو برویم که اگر زود جلو می‌رفتیم، پشت این قاعده‌ای که اعمال می‌کنیم قواعد لطیف‌تری وجود دارد و الگوهایی است که ما هنوز آنها را کشف نکرده‌ایم. هوش مصنوعی با آن سرعتی که دارد و آن استحضاری که به شکل دفعی بر اطلاعات دارد، به‌سرعت الگوهایی را که با روش خودمان شاید ۵۰ سال با زحمت زمان می‌برد تا آنها را کشف کنیم، در زمان کوتاهی با روش آمارمحور اتصال‌گرایی آنها را کشف می‌کند. این الگوها اگرچه به صورت صریح نیستند، اما می‌توانیم آن را درست کنیم. الگوهایی که از روش آماری به ما می‌دهد، اول صورت خام دارد؛ مثل فیلم‌های عکاسی قدیم که نیاز به ظاهر کردن داشت، الگوهایی که او به ما می‌دهد را ما به نحو بین رشته‌ای با یک پروژه دیگری که به صورت قاعده‌محور مطلب را جلو برده‌ایم، مثلاً یک قاعده این است که فقط محور جانشینی ما در تبدیلاتمان، فاء الفعل باشد که به عنوان یک پروژه شروع می‌کند در کل پیکره می‌گردد و mask را روی فاء الفعل می‌زند و در محور جانشینی، آن را تبدیل می‌کند و بعد تلاش می‌کند یک معنای واحد از این جانشینی‌ها دربیاورد؛ مثلاً «حد» را می‌گیرد و کلماتی مثل «احد»، «بحد»، «تحد»، «دحد»، «سحد» و ... که «ح» و «د» را محفوظ نگاه داشت و حرف اول را تغییر داد. یک روش دیگر، روش وسط است که در مواد ثلاثی، فاء الفعل و لام الفعل را ثابت نگه می‌دارد و محور جانشینی را وسط قرار می‌دهد. این هم روشن است و مثلاً «کفر»، «کتر» و ... و یک پروژه هم اینکه لام الفعل محور جانشینی باشد؛ که اینها پروژه‌های مستقل می‌شوند. یکی هم مثل ابن جنی، قلب می‌کند و کلماتی مثل «قول«، «وقل» «لقو» و ... که ترتیب را بر اساس آنالیز ترکیبی می‌گرداند. اینها اگر می‌خواست پروژه جامع باشد، راندمان پایین می‌آمد، اما اگر هر کدام از اینها به صورت مچزا پروژه داشته باشد و یک ناظر در انتها راندمان‌ها را بگیرد و وقتی هر قاعده تمام نتایج خودش را داد، ارزش‌گذاری کند و از نتایج همه اینها استفاده کند. چیزی که در این فضا مهم است این است که ما باید از هوش مصنوعی بخواهیم که وقتی یک قاعده‌ای را اعمال می‌کنیم، موارد نقض آن را به ما بدهد و این مهمتر از این است که موارد همساز با آن را بدهد؛ مثلاً بگوییم که اگر ما فاء الفعل را تبدیل کردیم، حدس می‌زنیم که با تبدیل فاء الفعل، معنای جامع آن دو حرف باقیمانده، فلان معناست که بعداً هم بخواهیم از آن دو حرف به معنای حرف واحد برسانیم، مثلاً در بین «مَدّ» و «بَدّ» و ... همین روال را اعمال کنیم تا معنای جامعی برای «د» کشف شود که پس از اینکه در مثلاً «کَمَدَ» کاف را انداختیم و معنای جامعی برای «مدّ» به دست آوردیم، حالا به سراغ انداختن میم در «مدّ» می‌رویم که با سایر موارد (مثل «بَدّ» و «رَدّ» و «شَدّ» و ...) آن را می‌گردانیم و در اینجا هم جامع‌گیری که کردیم، می‌فهمیم که آن متغیرها که معنایشان تغییر می‌کرد، پس آنچه که جامع در اینهاست، معنای «د» است. همه اینها را اعمال می‌کنیم. نکته‌ای که در اینجا وجود دارد این است که آن معناهای جامعی که گرفتیم - چه برای دو حرف و چه یک حرف - در آن پیکره موارد نقضش کجاست و کجا کاربردی دارد که با این جامع‌گیری ما منافات دارد و آن معنای جامع‌گیری ما با آن کاربرد توافق ندارد؛ اینها بسیار در پیشرفت آینده فقه اللغة کمک می‌کند. وقتی ما با یک سری پروژه‌های جامع‌گیری، معنای جامع برای ثلاثی‌ها، ثنایی‌ها و حروف منفرد به دست آورده‌ایم، اما پیکره به ما می‌گوید که من می‌بینم که در فضای زبان خلاف آن را استعمال می‌کنند. این موارد نقض برای ما در پیشرفت علم حرف بیشتری برای گفتن دارد تا موارد توافق و شواهد آن معنای جامع. این هم از جمله چیزهایی است که حتماً باید مورد عنایت قرار بگیرد که موارد نقض خیلی به پیشرفت علم کمک می‌کند. (۱ساعت و ۲۷ دقیقه و ۴۰ ثانیه)

- گفته شد که چون هر حرفی به عنوان یک شیء برای ما مطرح است، صوت دارد که برای ما یک طیف تشکیل می‌دهد، نقوش دارد که انواعی دارد و فونت‌ها در یک زبان و در یک کاربرد و بلکه نقش‌های مختلف در زبان‌های مختلف. مثلاً‌ حرف «ر» که گمان می‌کنم هیچ زبانی در بین بشر نیست که حرف «ر» نداشته باشد یا حرف «ک» نداشته باشد. اینکه چرا چنین است هم بحث‌های قشنگی دارد. بعضی از حروف هستند که بین المللی‌اند؛ یعنی تولید آنها برای تولیدکننده phon بشر راحت است و لذا در همه زبان‌ها هستند. مثلاً شاید ۱۵-۱۶ حرف صامت هستند که در هر زبانی که بروید، هستند. چند تا از مصوت‌ها نیز چنین‌اند. البته هر کدام از اینها طیف دارند. واج برای خودش دستگاهی دارد و نقوش نیز برای خود دستگاهی دارند. نکته مهم این است که حالا که حرف، شیء شد، فقط صوت ندارد و فقط نقش و فونت ندارد، بلکه طبیعت یک معنا هم دارد؛ یعنی طبعاً‌ آکوستیک یک phon رابطه طبعی دارد با یک معنا؛ مثل «ش» که تفشی در آن است؛ تفشی این است که دهان هوا را پخش می‌کند. خود ما وقتی بخواهیم صوت را توصیف کنیم، می‌بینیم با یک سری معانی در ارتباط است که در مثل علم تجوید برای آن اصطلاح قرار داده شده. مثلاً وقتی صوت یک حرف، تفشی دارد که پخش شدن است، پس صوت آن با یک معنا رابطه طبعی دارد. و این کار را آقای حسن جبل انجام داده و بین آکوستیک صوت با معنای آن رابطه برقرار کرده. اینکه می‌گویم کتاب ریاضی است ، بر پایه چنین چیزهایی است که خیلی جالب است و جا دارد مقدمه آن را تدریس کنید. تا مقدمه آن به‌خوبی دانسته نشود، استفاده از کتاب، تام نخواهد بود، همچنانکه تا با کتاب کار نشود، مقدمه آن هم جا نمی‌گیرد.

حال که صوت چنین است و با معانی در ارتباط است، نکته دیگر آن است که همانطور که هر حرفی طبیعتاً با یک معنایی رابطه خدادادی دارد، هر حرفی با اعداد مختلفی هم در ارتباط است؛ یعنی وقتی حرف را یک شیء در نظر گرفتیم، اینطور نیست که بگوییم مثلاً یک «ر» چه ربطی به عدد دارد. خدای متعال در طبیعت هر حرفی، یک عددی قرار داده است. شبیه فرکانس طبیعی که خدای متعال برای هر شیء یک فرکانس طبیعی گذاشته است، برای هر حرف هم چنین است و جالب این است که یک طیفی از اعداد است و یک عدد نیست. بعداً‌ در اشتقاق کبیر نباید از اینها غض نظر کنیم. این هم خودش یک پروژه است؛ پروژه ارتباط این حروف با اعداد. الآن هم آنهایی که علم جفر می‌دانند، می‌گویند در استنطاق، اول به عدد برمی‌گردانند و روی عددها کار می‌کنند و بعد، استنطاق می‌کنند. پس رابطه وجود دارد. ابجد کبیر یک عدد است و ابجد صغیر - که ۵تا ۵تا می‌اندازند یا ۱۲تا ۱۲تا می‌اندازند - یک عدد دیگری می‌دهد. معلوم می‌شود که حرف به عنوان یک شیء، شؤونات زیادی دارد. همچون زید که به عنوان یک شیء، بدن و روح و شُش و قلب و دستگاه گردش خون و دستگاه تصفیه و سیستم ایمنی و شبکه عصبی و ... دارد، حروف هم چنین هستند و بلکه هرچه جلوتر رفتیم، می‌بینیم اعظم من هذا! به خاطر دارید که می‌گفتم عدد گنگ که در زمان فیثاغورس پیدا شد، یک رادیکال دو بود که همه را بیچاره کرد، اما الآن در زمان ما می‌گویند که مجموعه اعداد گنگ به مراتب بیش از اعداد گویاست؛ ببینید بشر به کجاها می‌رود و چه کشفیاتی می‌کند. حالا حرف به عنوان یک کلاس، خیلی اعظم است از این چیزهایی که ما فعلاً یک چند کلمه‌ای از آن را گفته‌ایم. پس از ابتدا نباید ضیق‌نگر باشیم و باید واقعاً آن را به عنوان شیپی که این شؤونات را دارد و اولیای خدا و کلمات وحی، این را بیان کرده‌اند، نگاه کنیم.

به عنوان ختامه مسک عرض می‌کنم که از اینجا معلوم می‌شود که وقتی ابوفاخته - سعید بن علاقه - می‌گوید که ام الکتاب فواتح السور هستند، چیزهایی زیادی در این حرف نهفته است. بعد که می‌گوید منها یستخرج القرآن، الم منها یستخرج سورة البقرة؛ می‌بینیم که پس این یک چیز ساده‌ای نیست و دم و دستگاهی در این فضا هست. بحث من در درس دیروز همین شد که سفارش می‌کردم برای فقه اللغة و چند تا روایت خواندم و از جمله این روایت که عرش، علمِ باطن است و علم الالفاظ و الحرکات و الترک؛ واقعاً اعجاز قولی است. امام نمی‌فرمایند «علم الحروف» - حروف سر جای خودش مقامی دارد - اما در اینجا تأکید می‌فرمایند روی الفاظ که تبلور لفظ در حیث آکوستیک آن است و امروزه هم صوت‌شناسی بسیار مهم جلوه کرده و اینکه هر حرفی را بعداً بگوییم که یک رابطه طبعی با معنا دارد، بشر مثل اینکه می‌گوید خورشید در آسمان است و آن را می‌بینیم، اینها را بعداً می‌بیند. الآن یک مقدار مبهم است ولی بعداً که باز شد، آنها را می‌بیند. آنچه که درباره علم عَروض گفتم، الآن اگر بگویید، می‌گویند فقه اللغة به عنوان یک علم که با حروف سر و کار دارد، چه ربطی به علم عَروض دارد که با بحور سر و کار دارد؟ اما با این توضیحی که برای صوت دادم و مقاطع و بحور، که هر سیلابی رابطه طبعی با یک معنایی دارد، ارتباط بحث معلوم می‌شود. البته اینکه آیا سیلاب‌ها را دیجیتالی کرده‌اند یا نه، و اینکه آیا تقطیع کرده‌اند یا نه، نمی‌دانم. ولی امروزه که عصر اطلاعات است، اگر از هوش مصنوعی هم سؤال کنند، هرچه جای دیگر بوده، سریع جواب می‌دهد.

خوب است مباحث مطرح شده ثبت شود تا بعداً محل مراجعه شود و از یادمان نرود. البته در قواعد فقه اللغة که فعلاً وارد نشده‌ام و فقط اشاره کردم. در این خصوص خیلی قاعده‌های زیبایی وجود دارد که حالا بعداً وقتی ان شاء الله اقدام کردید و پروژه‌ها شروع شد، نسبت به هر پروژه جدایی هرچه که در ذهنم بود، عرض می‌کنم.




اشتقاق و فقه اللغة با هوش مصنوعي