بسم الله الرحمن الرحیم
فقه هوش مصنوعی؛ جلسه 50--25/2/1404
بسم الله الرحمن الرحیم
اولی که این مباحثه شروع شد، عرض کردم در علوم طلبگی خوب درس نخواندم چه برسد به چیزی که درسش را نخواندهایم. ولی خب مثالی که زدم همان هندل زدن ماشین است. کسی که هندل میزد لازم نبود رانندگی بلد باشد. فقط هندل میزد که ماشین روشن شود. حالا ما هم بهعنوان طلبه، میتوانیم اینطور نقشی داشته باشیم.
علی ای حال اولی که شروع کردیم، مباحثی بهصورت متفرق جلو رفت. الآن نزدیک پنجاه جلسه، مباحث را در سه مرحله دستهبندی کردم. من هم تکرار میکنم تا بعداً روی این سه مرحله تمرکز شود و مطالبی به آن افزوده شود. راجع به هر کدام میتواند مقالاتی نوشته شود.
مرحله اول، تمایز گذاری بین هوش اشراق محور و هوش پایه محور بود. هوشی که برای نفوس است، برای جانهایی است که از عالم دیگری به این عالم فیزیکی و ناسوتی هبوط کرده است. آن هوش برای آنها است. شواهدی روشن غیر از اثبات علمی هست که قابل ارائه است. کل بشر حتی از دبستان که شروع میکنند، طوری ارائه بدهیم که چشم عقلشان ببینند. همانطوری که چشم سرشان چیزهایی را میبیند، چشم عقلشان هم ببیند که این برای هوش پایه محور نیست و نمیتواند باشد. این برای انسانیت انسان است. این بخش اول کار بود.
هوشی که الآن بحث میکنیم، هوش پایه محور است. این چه کار میکند؟ اینکه ببینیم کارش چیست، مرحلۀ دوم بود. سوم هم این بود که وقتی موضوع را تصور کردیم، ببینیم احکام شرعیه و ادله شرعیه که برای خودش موضوعاتی دارد، در این هوش پایه محور کدام یک از این موضوعات محقق است. این سه مرحله مباحثه ما به اینجا رسید.
برای مرحله اول نکتهای را عرض میکنم. بعداً هم هر کدام نکاتی به ذهنتان آمد، بگویید. یکی از چیزهایی که میتوان گفت هوش اشراق محور را از پایه محور جدا میکند، در فضای علمی و پیشرفت نظریات و کشفیات، اسم آن را حدس های شبهای بی خوابی میگذارند. کسانی که کار علمی میکنند گاهی بی خوابی به سرشان میزند. در این بی خوابی، برایشان یک چیزهایی پیش میآید که شروع فضاهای علمی عجیبی است. نمیدانم در فضای خود علم به این چه میگویند. اصطلاح آن بود. همین اندازه در حافظه ام هست؛ شرح حالی آن ژاپنی بود که در فیزیک ذرات بنیادین استارت کار را زد. بعد از اینکه الکترون و پروتون و نوترون در فضای فیزیک آمده بود، او شروع ذرات بنیادین را در جدول استاندارد انجام داد. در شرح حالش گفته بودند؛ شبی که بی خوابی به سرش زده بود، در همان بی خوابی مطالبی آمده بود. یعنی یک فتح بابی بود که بیش از نیم قرن بیستم را به خودش مشغول کرد. مطالبی مفصلی بود.
خب وقتی یک انسانی حدسیات شب بی خوابی دارد، این از کجا میآید؟ آیا از آمار و اطلاعات و زبان و فکرهای پایه محور میآید؟ واقعاً از آن هوش پایه محور متفکر است؟ یا نه، مواردی داریم که اخذ کردهاند؛ «و الحق أن فاض من القدسي الصور ***وإنما إعداده من الفكر»1. یک چیزی شده که اصلاً وقتی ملائکه نگاه میکنند، میبینند برای خودش نیست. از عالم دیگری برای او آمده است. خب این چطور میشود؟ پایه محور نیست، اشراق محور است. جمعآوری شواهد خیلی خوب است. حدسیاتی که زده میشود…؛ مثلاً در نظریه اعداد هنوز چند حدس خیلی مهم زده شده است. مثلاً حدس فلان شخص برای اعداد اول، و …. نقطه اول این حدس از کجا میآید؟ اگر نظرتان باشد، فرگه مقالهای داشت که قبل از کرونا مباحثه میکردیم. وسط راه قطع شد. اسم مقاله خود را «اندیشه» گذاشته بود. همان جا عرض میکردم که اصلاً تمسیه به اندیشه اصلاً درست نیست. ولو آن چه که میخواست بگوید مطلب خوبی بود. مدعای او چه بود؟ تصور و ایده با اندیشه تفاوت میکند. مقصود او از اندیشه چیزی نبود که به انسان بند باشد. او که اندیشه میگفت یعنی مطابَق گزارهها. هر گزارۀ نفس الامریه و حقی که دارید، مطابَقش ولو انسانی نباشد، هست. شما میگویید «التناقض مستحیل». میگوییم خب اگر انسان هست، تناقض محال است. اگر اصلاً انسانی نبود که تناقض نبود. اصلاً قضیهای نداشتیم. تناقض هم محال نبود. نه، مطابَق و واقعیت قضیه «التناقض مستحیل»، یک ایده نیست، یک تصور نیست. بند به انسانها نیست. واقعیتی است که اگر انسانها هم نباشند، هست. افلاطون گرائی در ریاضیات همین است. یعنی تمام حقائق ریاضی همینطور هستند. انسان هم نباشد، قاعده شکل عروس جاری است؛ قاعده فیثاغورث در شکل عروس جاری است.
فرگه چه میگفت؟ اسم اندیشه برایش خوب نبود. ما به آن طبیعی نفس الامر میگوییم. این بهتر از کلمه اندیشه است. چون اندیشه طوری است که در نهایت به انسان بند میشود. و حال اینکه او صریحاً میگفت که اینها موجوداتی مجرد، غیر مادی، خارجی و عینی هستند که ربطی به انسان ندارند. ذهن انسان اینها را فراچنگ میکند. معدل فراچنگ «grasp» است. این را به دست میآورد.
آن چه که من عرض میکنم، این است: انسانها حدسیاتی دارند؛ حدسیاتی است که به چنگ میآید. بله، مشکلی نداریم…؛ همانطور که در المنطق، در حاشیه و سائر کتب منطقی بود، یکی از وجوهی که منطق دان ها در بیان مباحث الفاظ در منطق میگفتند، این بود: بسیاری از اشتباهاتی که در تفکر صورت میگیرد به این خاطر است که انسان فکرهایی با پشتوانه زبان دارد. یعنی وقتی دارد فکر میکند حدیث نفس میکند. با حدیث نفس فکرش را جلو میبرد. دقیقاً در حدیث نفس، اشتراک لفظی کلاه سر او میگذارد. میگوید اشتراک لفظی برای مغالطه با خصم است! نه، کسی که دارد تفکر میکند، وقتی با الفاظ فکر میکند، دچارش میشود. خواجه فرمودند: «ان الانتقالات الذهنیه تکون بالفاظ ذهنی». تفکرات و از یک قضیه استنتاج دیگری کردن با الفاظ ذهنی است. این درست است و مطلب خوبی است. اما منافاتی با این عرض من ندارد. چون همینطور که بشر تفکراتی دارد که در ظل حدیث نفس و زبان جلو میرود، تفکراتی هم دارد که در زیرساخت قضایا است. بعداً هم در خودتان تأمل کنید، میبینید. گاهی که فکر میکنید اصلاً همراه آن حدیث نفس نیست. دارید یک چیزی را میفهمید. اول خدا به ذهن شما می فهماند، بعد میگویید حالا چطور بگویم. این تفکر، دریافتی قبل از زبان است. مثلاً اگر شیخ الرئیس راه میرفت و فکر میکرد، بعد سخن میگفت و مینوشتند. وقتی دارد فکر میکند گاهی است که با حدیث نفس جلو میرود؛ این همان حرف منطقیین است. اما گاهی است که اصلاً این جور نیست. نفس او در یک موطنی ورای زبان و نظم زبانی است؛ در مفاهیم و زیرساخت زبانی است. حالا به گمانم بالاتر از بحث زیرساختی که امروزه زبان شناس ها میگویند، برود. یعنی ملموسشان شود، و الا دستگاه که خیلی عظیم است. پس همه ذهن بشر فکرهای زبانی نیست.
چند جلسه قبل عرض کردم؛ آن الکترودهایی که زیر جمجمه یا روی جمجمه یا در خود مغز جاسازی میکردند که در ذهنتان وقتی حرف میزنید و فکر میکنید، چون این نرم افزار قانون زبان و سیگنال های مغز شما را بلد است، فوری بودن اینکه حرف بزنید، ذهن شما را میخواند و متن هم مینویسد. یا اگر در ذهنتان بگویید، گفته شما را میگوید. راجع به همین یک جلسه صحبت شد.
مطلبی که من عرض میکنم، غیر از اینها است. یعنی همان الکترودهایی که در مغز، زیر استخوان جمجمه یا روی جمجمه کار میگذارند، نمیتواند این چیزی که ما میگوییم را ثبت کند. چرا؟ چون دریافتی است که ریخت این دریافت ریخت زبان نیست. زبان «llm»ها نمیتواند آن را به دست بیاورد. چون «llm» دارد روی مدلهای زبانی کار میکند. آن فکری که در ذهن آن شخص میآید، زبانی نیست. سطحی فراتر از زبان است. لذا اگر یک شخص قوی ای باشد که شئونات ذهنش تحت کنترل خودش باشد، فکر میکند و فکرش را در سطحی نگه میدارد که آنها را به حدیث نفس و زبان ذهنی نمیکند. همین الکترودها هم نمیتوانند بفهمند که الآن او چه دریافت کرد. دریافتی دارد ورای اینکه بخواهند بگویند او دارد چه فکری میکند.
شاگرد: این اشراق محور است یا پایه محوری است که قابل درک نیست؟
استاد: در نوعی از پایه محور میتواند باشد. ولی آن چه که الآن میخواهم بگویم خصوص آن نوعی است که شاهد داریم فراچنگ آورد. نه اینکه با مقدمات صغری و کبرای منطقی و زبان منطق گزارهها باشد. چون زبانهای صوری هم حرفهای خاص خودش را دارد. آن چه که الآن عرض میکنم دقیقاً در حوزه اشراق محور است. جالب هم این است که اصلاً خودش شخص نمیداند. گاهی میگویند چطور شد به این رسیدی؟ میگوید گفتم که اگر این جور و آن جور است؛ صغری و کبری را به دست شما میدهد. یعنی مسیری را که طی کرده برای شما بیان میکند. اما گاهی است مثل شبهای بی خوابی است. میگوید نمیدانم چه شد. همینطور آمد.
شاگرد: حدس هیدکی یوکاوا بود. بین نترون و پروتون ذره ای واسطه کشف کرده است. اسمش مزون است.
استاد: بله، بین نترون و پروتون ذره این تبادل می شده. اولین بار او کشف کرد. الآن بالای هفتاد ذره بنیادی در جدول استاندارد ذرات بنیادین هست. قطع نظر از آن هایی که غیر استاندارد هستند. مثلاً ماده تاریک و انرژی تاریک که غیر استاندارد هستند. ذرات استاندارد جدولی دارد که بالای هفتادتا است.
اینها چیزهایی است که اصلاً خودش شخص میبیند از جای دیگری آمده است. مثال روشن ترش مثل کسی است که خواب میبیند. دانشمند است و دارد فکر میکند، در خواب میبیند شخصی میآید و مطلب را به او میگوید. اینجا بگوییم صغری و کبری کرده است؟! درست است که در خواب به زبان گفت، فرض میگیریم که القاء ذهنی هم نباشد. خیلی چیزها القاء ذهنی است، اصلاً مطلب را القاء میکند. آن هم نه. مثلاً اگر متفکر فارس زبان است، در خواب میآید و با زبان فارسی به او میگوید. خب خود این دانشمند میفهمد که من فکرش را نکرده بودم. در خواب کسی آمد و این مطلب را به زبان فارسی به من گفت، بیدار شدم و دنباله اش را گرفتم و دیدم راست میگوید. الآن اسم این را چه میگذاریم؟ میگوییم پایه محور است؟! این چه پایه محوری است؟! او دارد خواب میبیند که شخصی به او چیزی را میگوید که او اصلاً در فضای آن نبود. منظور من مثالهایی است که نزد کسانی که وجدان بدون تعصب دارد واضح است. حالا کسی از اول قسم خورده که تا آخر به فیزیکالیسمی که آنها میگویند پایبندم. ما با او کار نداریم. او از اول قسم خورده که این جور کار کند.
شاگرد: منظور از پایه، این اتفاقاتی است که در مغز میافتد هست؟ یا صغری و کبری و آن پنج مرحله فکری است که در منطق بود؟
استاد: صغری و کبری هم پایه است. یعنی امکان ظهور در پایه هست. در جلسات متعددی از این فرمایش شما صحبت کردیم. اینکه پایه چیست و مقصود ما از پایه چیست. شاید سیزده-چهارده نوع پایه را گفتیم. انواع پایهها و ظهور معنا در انواع آن را گفتیم. شاید بالای پنج جلسه صحبت شد. اگر حوصله کردید مراجعه کنید. سبب خیرش یکی از آقایان شدند. ایشان یک جملهای گفتند و همین جمله ایشان سبب شد تا ببینم هنوز خیلی باید مبادی این مسائلی که هست را با بسط بیشتری توضیح بدهم. و الا اگر همینطور هوش پایه محور بگوییم و جلو برویم، در اذهان مخلوط میشود. مطالب مهم را مخلوط میکند. فرمایش ایشان سبب شد که اینها جدا شود.
اینکه در زیرساخت قضایای زبانی چه صورت میگیرد، خودش چند سطح است. من حرفی ندارم که شما در مرحلهای از زیرساخت زبان -گشتارهای روساخت نه- یا گزارهها یک جور پایه محور را بیاورید. نظیر منطق گزارهها و محمولات. همه اینها را الآن هوش مصنوعی به کار میگیرند. «llm» نوع اول به کار میگیرد. «llm» الآن که این قدر تکرار میشود از نوع دوم است. نوع اول چه بود؟ «Logic learning machine» بود؛ یعنی یادگیری ماشین منطقی. این روی استدلال است. پایه محوری منطق محور است. استدلال محور است. اما «llm» جدید «Large Language Model» است؛ مدل زبانی بزرگ است که الآن از آن استفاده میکنند. ذیل جلسه چهل و ششم مباحثه، سؤال و جوابی کردهاند و آن جا گذاشتهاند. من هم فی الجمله ویرایشی انجام دادهام. برای همین هایی که صحبت شده، مثالهایی زده و خودش را توضیح داده است. الآن همین هوشی که ایشان با آن صحبت کردند همین «llm» دومی است. یعنی مدل زبانی وسیع است. مطالبی هم که میخواهم عرض کنم مربوط به همین است.
بخش اول کلام این شد: در انسانها و تاریخ آنها، مؤلفههایی داریم که برای انسانهای بدون پیشفرض و منصف، و بلکه در آینده اگر ابزارها پیشرفتهتر شد، برای کل بشری که چشم عقل دارد، میبیند که این از امتیاز اشراق انسان است. این برای بخشی از انسان است که از جای دیگر میآید. در جلسه قبل عرض کردم؛ اگر این ربات را پیشرفته کنند، در حیطه اطلاعاتی که دارد، خود آن بین دیتاهای دریافت شده از انواع سنسورهایی که به آن دادهاند، با اطلاعات دریافت شده از اجرای تابع ها و رول ها تفاوت میکند. خودش میفهمد. میفهمد که این از سنسور آمده و من فکرش را نکردهام، من استدلال نکردهام. از سنسور آمده، یعنی برای من نیست و از بیرون آمده است. همین جور چیزی برای عقل انسان هست. دستگاهش هم فراهم است. هر چه بیشتر روی آن کار کنید یک علم حوزوی ممتعی میشود. یعنی به عقل کل بشر میگوید ببین اینجا عقل تو از سنسور عقلانی گرفت. «sense» بهمعنای حس است؛ من از باب تشبیه معقول به محسوس میگویم. سنسور یعنی حسگر؛ آن چه که میبیند و میشنود. من اینها را به استعاره به کار میبرم. عقل ما یک چیزهایی دارد که برای صغری کردن ها؛ همانطور که حاجی فرمودند «اعداده من الفکر». معداتی در عقل ما هست که آن معدات، صغری و کبری کردن است. انتقال از مجهول به معلوم است. اما «ان فاض من القدس الصور»؛ فکر فقط معد است و از آنها میآید. یعنی چشم عقل میگوید این مطلبی که آمد از آن سنسور عقلانی وارد شد. نه از صغری و کبری کردن من. وقتی دید دیگر تمام است. این دیدن خیلی مهم است.
تبیین مفهوم بردار و تنسور
بخش دوم که بهشدت پیشرفت کرده و میکند، این است که هوش پایه محور است. پایه محور است یعنی درک معنا ندارد. فهم معنا ندارد، اما عملیات معنادار به سرعت و بسیار انجام میدهد. ملازمه ای نیست بین عملیات معناداری که هوش مصنوعی انجام میدهد با اینکه درک و فهم معنا هم داشته باشد. فهم نفسانی ندارد. ولی رفتار مبتنیبر معنادار بودن را انجام میدهد.
برای اینکه بخش دوم واضحتر شود، مبادی ای را خدمت شما عرض کردم. شما هم پی آن را بگیرید و کامل کنید. در جلسه قبل مفهوم بردار، فاصله بین دو بردار، و فضاهای بین دو بردار را در قالب مثالی عرض کردم. عرض کردم مثلاً شما یک سنگی را دست راست میبرید یا چپ میبرید. دست راست و چپ یک پارامتر بود. میگفتید سنگی را دست راست یا چپ بردهایم. محور x بود. همه دانشآموزان با این محور آشنا هستند. خود این محور x یک بردار است. محور y هم یک بردار است. این دو محور ضرب هندسی میشوند و یک صفحه درست میکنند. دو خط است. محور x بردار عدد است. البته اینکه حتماً باید درایه های بردارهای عددی محدود باشد، باید ببینیم. اگر محدود باشد ما محور x را طور دیگری تعریف میکنیم. اما اگر بگوییم نه، میتوانیم یک برداری داشته باشیم که فراتر از اعداد گویا است. بردار پیوسته اعداد حقیقی؛ خب این محور x میتواند یک بردار باشد. محور y هم همینطور میشود؛ بهعنوان یک خط میشوند. بعد اگر روی هم عمود شدند یک فضای برداری دو بعدی پدید میآید.
جلسه قبل عرض کردم وقتی دو پارامتر را ردیف کنید، مثلاً میگویید دو متر دست راست برو، سه متر هم پایین برو. چون دو پارامتر را اعمال میکنید، فضای شما دو بعدی میشود و یک بردار برای شما درست میشود. خود محور x یک بردار میشود. با توضیحاتی که مبادی آن را قبول کنیم یا نه، فقط میخواهم ذهن جلو برود.
در ادامه محور z هم آمد. عرض کردم میتوانیم بگوییم این سنگ را دومتر دست راست ببر، درحالیکه سه متر پایین میبری و درحالیکه پنج متر جلو میبری. الآن سه پارامتر شد. وقتی سه تا شد حتماً شما به فضای سه بعدی مواجه میشوید. قبلش فضای دو بعدی بود ولی در اینجا با فضای سه بعدی مواجه میشوید. مثالهای دیگری هم زدیم. مثلاً چند سنگ است؛ یکی را دو ساعت با سرعت کذا ببر. دیگری را یک ساعت با سرعت کذا ببر. الآن در پارامترهای اول و دومش، متر متغیر شد. اگر بگوییم سه متر ببر، نمیتوانیم بگوییم یکی را با این سرعت دو ساعت ببر. این دیگر دست ما نیست که بگوییم سه متر. خب معنایش این است که الآن پارامترهای اول تبدیل به a شد. یعنی متغیر شد. به محض اینکه در یک بردار یا یک ماتریس عددتان تاب این را داشت که متغیر شود، آن مفهوم پربار تنسور مطرح میشود. تمایز اصلی تنسور با قبلی های خودش به همین است. درست است که شما یک بردار را میگویید تنسور یک بعدی است و یک عدد اسکالر است و منفردا میگویید تنسور صفر است، یک ماتریس را هم میگویید تنسور دو بعدی است. اینها درست است، اما تفاوت این است که ریخت تنسور طوری است که در دلش متغیر هست؛ بالاتر از متغیر هست. تابع است. تنسورهای دیگری هم دارد. همه اینها را میپذیریم. این مطلب خیلی مهمی است.
علی ای حال این مفهوم بسیار مهمی است. یعنی اساساً همه بحثهای امروزی، روی بردار، ماتریس، بهخصوص تنسور است، با این نگاه که سر و کار ما در تنسور با صرف عدد نیست. ساختارها عددی است اما ظرفهای عددی و چیزهایی که عنصر ریاضی هستند ولی الآن یک داده خاصی ندارند. بنابراین اگر یک سنگ را با سرعتی بردید، پارامترهای اول و دوم محو نشده ولی از یک عدد در آمده است. شما میگویید سه سنگ داریم، از نقطه صفر شروع میکنیم. یکی را با سرعت پنجاه کیلومتر ببر؛ کجا ببر؟ سه پارامتر اول محفوظ است. دست راست، به طرف بالا و به طرف جلو ببر. دیگری را چطور ببر؟ دست چپ، به طرف پایین و به عقب ببر. در این فضا شما دارید سنگها را میبرید. یعنی پارامترهای محور x و y و z اصلش جایی نرفته، بهعنوان یک بعد نمود دارد ولی از یک عدد ثابت به یک عدد متغیر تبدیل شده است.
آن چه که در جلسه قبل عرض کردم و مهم بود، این بود: وقتی شما این سنگها را میبردید، بعد از اینکه یک بردار حاصل شد، میگفتید فاصله این دو سنگ چقدر است. کلمه فاصله سنگها در چه چیزی رسم میشد؟ فاصله در فضایی بود که پارامتر x و y و z ترسیم کرده بود؛ همچنین سرعت و حرکت. در این فضا بود. فاصله هم فیزیکی میشد. اما همان جا برای اینکه روشنتر شود، عرض کردم در اثر حرکت سرعت یکی از این سنگها کم میشود. مثلاً در حرکت زیاد قیمتش کمتر میشود. دیگری برعکس است؛ با حرکت قیمتش زیاد میشود. الآن گه این سنگها را در فاصله بردید، گاهی است این دو را طوری بردهاید که نزدیک هم هستند، ولی چون جنس سنگها تفاوت دارد، قیمت یکی در اثر بردن کم میشد و دیگری قیمتش زیاد میشد. از حیث مکان این دو سنگ نزدیک هم هستند اما از حیث قیمت و فاصله برداری که یک بعدش قیمت سنگ است، متفاوت میشوند.
تأکیدی که من داشتم این بود که حالا درک کنیم که قیمت سنگ، یک بعد است در محاسبه کردن آن چیزی که آخر کار میخواهیم بهعنوان تعیین وزن برای سنگ الف فکر کنیم. این خیلی مهم است. الآن دیگر بعد، طول و عرض و عمق نیست. قیمت بعد است. فاصله دو قیمت در یک فضای برداری اصلاً ربطی به فاصله دو سنگ در فضای فیزیکی ندارد. چه بسا دو سنگ را تکان دادیم و از نظر فیزیکی بسیار از هم دور شدند اما قیمتشان به هم نزدیک هستند. در بعد قیمت نزدیک هستند. چرا؟ چون ریختشان اینطور است. این مطالب جلسه قبلی بود.
شاگرد: اینها محدودیت ندارد؟ مثلاً رنگ و حرارت و ….
استاد: نه، عرض کردم زبانهای بزرگ برای همین است. هفتصد و شصت و یک میلیارد پارامتر دارد. این هایی که من گفتم چهار-پنج مورد در بعد دار کردن بود. وقتی شما از آن سؤال میکنید، نرمافزار چینی که روی دست آمریکاییها زد و سختافزار کم را برای راندمان بالا استفاده کرد؛ ریاضی دان هایی بودند که با ابتکار ریاضی کاری کرده بودند که وقتی از دیپ سیک سؤال میپرسید، به جای اینکه هفتصد و شصت میلیارد پارامتر را فعال کند تا بتواند جواب شما را بدهد، در ابتدا حدود هفتاد و پنج میلیارد را فعال میکند و جواب شما را میدهد. اگر بعداً نیاز شد، در مراحل بعدی بقیه پارامترها را فعال میکند. این خیلی مهم بود و صدا کرد.
بنابراین یک برداری که سرسام آور بعد و درایه داشته باشد، هیچ مشکلی ندارد. همچنین تنسورها. عرض کردم آلبوم فیلمها، پنج-شش بعدی بود. وقتی تنسور شما شش بعدی شد، یک آلبوم خوب فیلم رنگی کامل دارید. اصلاً نیازی به تنسور هفت بعدی ندارید. اما وقتی الآن شما میخواهید پردازش زبان کنید، با یک تنسور شش بعدی کارتان در نمیرود. خیلی باید گسترده باشد.
تا اینجا فضای برداری برای شروع کار روشن شد. حالا در فضای بعدی باید ببینیم کاری که اینها در مرحله دوم انجام میدهند، چه چیزی صورت میگیرد تا وقتی بعداً بخواهیم قصد پایه محور و … را بررسی کنیم، در این هوش هایی که امروز هستند تفاوتهایی دارند یا ندارند.
جلسه قبل در صدد بودیم تا مقدمات «Embedding» را عرض کنم. شما در یک پیکره متنی میآیید…؛ الآن زمان ما خیلی مهم شده است. زمان ما تماماً روی این میگردد. ولی گمان من این است: الآن بخاطر اطلاعات زیاد و جذابیتی که دارد، خیلی سر و صدا دارد. اما طولی نمی کشد آن چه که نیاز بشر است و بشر میفهمد کارآیی دارد، از این مدلهای زبانی عظیم فاصله میگیرند. کاری که این مدلهای میکنند حدس کلمه است یا در «lcm» حدس جمله است. ولی مهم این است که روش آنها آماری است. یعنی کل اطلاعات هر چه در اینترنت بوده را به او دادهاند، حتی در زبانهای مختلف هم اینچنین است. یعنی وقتی از این هوش مصنوعی ها سؤال میکنید، او مبدل ها و مترجم های قوی ای دارد و کل اطلاعات را دارد، لذا میبینید در یک مکالمه زبان چینی، مثلاً استاد یک مثال قشنگی به ذهنش آمد و برای شاگرد خودش به زبان چینی گفته، الآن فوری همان مثال را از زبان چینی به فارسی برای شما میگوید. یعنی کل اطلاعات به همه زبانها نزد او موجود است. بهراحتی هم ترجمه میکند. در زیر ثانیه مطالب را از این زبان به آن زبان ترجمه میکند. خیلی میشود. یعنی شما ببینید چقدر مطالب در فارسی هست که در انگلیسی نیست. آن همین ها را سریع به انگلیسی ترجمه میکند. یا در انگلیسی هست و در فارسی نیست. در چینی هست و در دیگری نیست. سریع اینها را تبدیل میکند. این یک کرپز شده است. پیکره زبانی بسیار مهم است؛ اینکه چطور یک پیکره زبانی را آنالیز و تحلیل کنیم. اما روش اصلی این کاری که الآن صورت میگیرد -که با مقصود ما در جلسات پارسال خیلی فاصله دارد- روش زبانی و آماری است. یعنی با آمار تعیین میکند که من چطور جواب شما را بدهم. توضیح آن فی الجمله در دو-سه جلسه صحبت شد.
پارسال اتاق چینی را عرض کردیم. در اتاق چینی چه میگذشت؟ در اتاق چینی کسی بود که زبان چینی بلد نبود. اما بازی با حروف الفبای چینی را بلد بود. بازی با نمادها را بلد بود. شما رفتار کسی که زبان چینی را بلد نبود اما قواعد جا به جا کردن نمادها و زبان چینی را بلد بود، عمل او را میگفتید که فهم معنا ندارد اما طبق عمکردش میگفتید رفتار او معنادار هست. مثالی که عرض کردم چه بود؟ جدول ضرب بود. طفلی بود که به او میگفتید ناخت را بکش. اصلاً عدد نمیدانست. ضرب نمی شناخت. فقط یک شکل میدید که با ناخن روی آنها میکشید. رفتار طفل معنادار بود یا نبود؟ رفتار طفل معنادار بود ولو خودش درک معنا نداشت.
نکتهای که مهم است؛ روش جدید آماری که هوش مصنوعی با آن به شما جواب میدهد، اصلاً رفتار معنادار نیست. چرا؟ البته بعداً به معنا نزدیک میشود؛ «Embedding» دارد همین کار را میکند. اصل روش آماری معنادار نیست. چرا؟ چون او نمیگوید شما با نماد…. اصلاً تفاوت نمادگرائی با اتصال گرائی و شبکههای عصبی در همین است. در نمادگرائی شما نمادها را دستکاری میکنید. اما در هوش مصنوعی اتصال مبنا و شبکههای عصبی، با آمار سر و کار دارید. مثلاً او میبیند کلمه «پیکان» در کل استعمالاتش چند جا به کار رفته است، و با چه کلمات دیگری همراه شده است. او فقط به آمار میگوید کلمه «پیکان» با کلمه «چرخ» در متن ها با هم به کار رفتهاند. آمارگیری کرده است. مثلاً میگوید در تمام متون بشر چند میلیون بار کلمه «پیکان» به کار رفته، در همان پیکره، مقدار کمتری کلمه «چرخ» هم به کار رفته است. اینکه با آمار در کاربرد «پیکان» و «چرخ» فقط عدد را میبیند، اینجا نمیتوانید او دارد رفتار معنادار انجام میدهد. فقط دارد آمار میگیرد.
شاگرد: الآن هوش مصنوعی ایمیل شما را دارد، اطلاعات روانشناسی هم دارد….
استاد: آنها برای مراحل بعدی است. من صرفاً روش آماری را میگویم. مقدمه چینی میکنم برای «Embedding». فرمایش شما خیلی بعدش است. فعلاً با روش آمار به وسیله شبکههای عصبی مصنوعی، هر کلمهای را به یک بردار تبدیل کردهاید. هنوز هم «Embedding» مانده است. شما هر کلمهای را به یک بردار تبدیل کردید؛ در جلسه قبل مثالی را عرض کردم. گفتم شما متن جواهر را بهعنوان یک پیکره متنی انتخاب میکنید. بعد میگویید واژه طواف. شما واژه طواف را در پیکره جواهر به یک بردار تبدیل میکنید، با پارامترهای برداری که عرض کردم. مثلاً اول پنج تا میگویید. بعد سه تا میگویید. دیگری صفر تا، تا یک جا که میرسید و میگویید دو هزارتا. بعد میگویید ردیف های این بردار، ردیف های کتابهای فقهی است. طواف بهعنوان یک عنصر در پیکره جواهر، اول در کتاب طهارت فقط یک بار آمده است. در کتاب صلات سه بار آمده است. تا اینکه به کتاب حج میرسید و میبینید پنج هزاربار آمده است. با این آماردادن کاربرد طواف در جواهر، هیچ تبادل معنایی نیست. ولذا بعداً شما میبینید با «فی» و «من» سر و کاردارید. چون در جواهر «من» هم هست. فقط «طواف» نیست. بعداً با ترفندهایی باید کلمات پرکاربرد را حذف کنید. کلمات به غایت کم کاربرد را هم با ضوابطی حذف کنید.
شاگرد: با این آمار چه میشود؟
استاد: با این آمار هر کلمه یک بردار میشود. ببینید الآن طواف یک بردار شد. یعنی وقتی شما طواف میگویید یک لیستی از اعداد در کنارش هست. بعداً نرم میگیرید. یعنی با فرمولهای مختلفی از هر برداری نرم گیری میکنید. در جلسه قبل عرض کردم. بعد از اینکه نرم گیری کردید، آن وقت میگویید این طواف، نسبت به پیکره جواهر یک صدم درصد است. این، عددی میشود و میگویید یک عدد. بردار او را با یک نرم به یک عدد تبدیل کردهاید. میگویید وزن طواف در پیکره جواهر این اندازه است. جورواجور هم هست. یعنی هر فرمولی خروجی خاص خودش را دارد.
از این عددی که شما از بردار طواف در پیکره جواهر به دست میآورید، بعداً با این اعداد به فاصلهها و ارتباطات معنا میرسید. بعداً میبینید «طواف» و «سعی» از حیث ستونهای کاربرد و تعداد، در بردار پنجم که کتاب حج بود، بیشتر با هم میآیند. بعداً وزنها را در فضای برداری قرار میدهید. «Embedding» که ما به دنبالش هستیم، همینجا میآید. یعنی شما به واسطه اعمال این هنر که هنر بسیار مهمی هم بوده، میفهمید کدام کلمات از حیث معنا نزدیک هم هستند. البته او فقط با آمار و «Embedding» میگوید. او درک معنا ندارد. ولی این اندازه میداند که فضای برداری «طواف» و «سعی» نزدیک هم هستند. فضای برداری «طواف» از «قصاص» خیلی دور است. «قصاص» جایی است که فضای که برای خودش انتخاب میکند خیلی فاصله دارد تا فضای «طواف».
شاگرد: اگر به او گفتم فرق «طواف» و «سعی» چیست، براساس همین آماری که دارد به من جواب میدهد؟
استاد: مشکلی که هست، این است: چون آماری رفتار میکند، به جایی میرسد که رندم انتخاب میکند. اگر جعبه سیاه هم یادتان باشد، همین بود. مشکل جعبه سیاه مهم بود. چون او آماری کار میکند و متن ها هم گسترده است، در یک جاهایی وقتی میخواهد جواب بدهد…؛ گاهی اساتید گفته اند. من تجربه سؤال کردن از آنها را ندارم. ولی دیدم کسانی که تجربه داشتهاند میگویند. میگویند وقتی یک سؤال را دوبار میپرسید دو گونه جواب میدهد. چرا؟ بهخاطر مسأله جعبه سیاه است. جعبه سیاه چه کار میکند؟ یادگیری عمیق این مشکل را پیش آورد. در یادگیری عمیق چون لایههای طولانی هست، در این لایهها توضیح پذیر نیست. یعنی شما نمیتوانید پی چویی کنید که چرا این کار را کرد. روی صرف آمار جلو میرود. حالا خوب متوجه میشوید که وقتی روی مبنای آمار جلو میرود و توضیح پذیر نیست، ولو خودش درک معنا ندارد، اما نمیتوانید بگویید رفتار معنادار دارد. بلکه حتی رفتار معنادار هم ندارد. چون فقط با آمار و نزدیکی آمار کار میکند. این مهم است. ولذا ما هم که الآن بهدنبال معنا بودیم، تا زمانیکه این زبانهای وسیع و لارج –که از آمار استفاده میکند- هستند، به آن نمیرسیم. البته به گمانم بعداً عوض میشود. استدلالات، خلاقیت، درک معنا و… را بشر میبیند و میخواهد در هوش مصنوعی پیاده کند. فعلاً این برای آنها خیلی جذابیت داشته است.
شاگرد: رابطه بین اعداد را نمیدانست و هر بار یک اشتباه جدیدی میکرد. به آنکه گفتم چرا هر بار اشتباه میکنی، این فرمایشات شما را توضیح داد.
استاد: که من رندم انتخاب میکنم.
شاگرد: بله، اینکه تو میتوانی چه چیزهایی را از من بپرسی و چه چیزهایی را نپرسی.
استاد: اینها مطالب مهمی است. وقتی شما اینها را بدانید توقعات شما بالا نمیرود. اوائلی که داس آمده بود، نرمافزارها هم تحت داس بودند، مکرر برخورد کرده بودم، میآمدند و میگفتند چطور این قدر میگویند کامپیوتر جواب میدهد؟! من با چشم خودم در بحارالانوار این را دیدهام، اما وقتی جست و جو میکنیم حدیث را نمیآورد. مکرر میشد. یکی از پیشرفتهای مهمی که در نرمافزارهای نور شد، اولینش در جامع الاحادیث بود. قبل از آن نور العتره بود که این اشکال را داشت. مثلاً ماشین نویس، کلمه مبارکه «ابراهیم» را با الف بودن همزه زده بود. خب کارکتر «إ» و «ا» تفاوت داشت. مثلاً شما در جست و جو آن را با همزه میزدید. یا او با همزه «إ» تایپ کرده بود، ولی شما با «ا» میزدید، جواب میآمد که نیست. او هم میگفت من خودم دیدم و اینها به درد نمی خورد. این یک توقعی بیش از آن چیزی بود که به آن داده بودند. بعد که جامع الاحادیث آمد، میگویید تیک دقت را بردار. یعنی به او میگوید «ا» و «إ» و … را با هم بگرد. این بار دیگر جواب میدهد. الآن هم هوش مصنوعی همینطور است. یعنی وقتی شما بدانید که او چه کار میکند، در آن محدودهای که کار انجام میدهد از او توقع دارید. فریب آن را هم نمی خورید و بعداً هم ان شاءالله تکمیل میکنید.
شاگرد: منظور از پایه، ماده و صورت ارسطویی است؟ رابطه بین ماده و صورت را هم یک جور پایه میدانید؟ چون ادبیان رسمی فلسفه اسلامی است، عرض میکنم.
استاد: مقصودم از پایه را توضیح دادم. بهترین مثالی که برای پایه تکرار میکردم، آب با فرمول h2o بود. اکسیژن و دو هیدروژن کنار هم میآیند و یک هینتی مثل کرسی میشود. منظورم از پایه این است. آنها یک کرسی میشوند و مولکول آب میشود. خب اگر آن ترکیب صورت نگیرد و همینطور مخلوط کنیم، یعنی ترکیبی از h2o بهعنوان مولکول آب نداشته باشید، ولی مخلوطی از شش اکسیژن و دوازده هیدروژن داشته باشید، اینکه آب نمیشود. اسم آن هیئت خاصه ای که مولکول آب را پدید میآورد، پایه میگذاریم.
شاگرد: اصطلاح سوپروینینس که الآن میگویند، شبیه به همان را میگویید؟ دو دسته ویژگی سطح بالا و پایین درست میکنند، بعد میگویند….
استاد: عدهای تلاش میکنند تمام این ویژگیهای کل گرا را به اجزاء بکاهند. آنها میگویند بی خود کل گرا نگویید، ما ویژگی کل گرا را هم به خصوصیات و ویژگیهای مؤلفههای پایه میکاهیم. همان جا راجع به اجتماع هم صحبت شد. فرمایش علامه طباطبایی را هم عرض کردیم. گمان من این است که کل گرائی درست است؛ اینکه در همه جا بکاهیم ممکن نیست. روی آن حساب وقتی پایه میگوییم، آن پایه حتی در لطیف ترین مراحل علوم انسانی مثل جامعه هم میآید. اکسیژن و هیدروژن فقط پایه نیست. وقتی شما یک شرکت درست میکنید، وقتی در ان جی او های اجتماعی گروهی را تشکیل میدهید، واقعاً دارید سراغ یک کل گرائی میروید. در مقاله آقا هم بود و خواندیم. همان استادی که بهشدت مدافع اصالت فرد بودند، در جاهایی گفته بودند نمیتوان این مسائل اجتماعی را با فرد توضیح داد. معنای این چیست؟ گاهی دیدید عنصرهای ریاضی خیلی تجریدی هستند، این پایههایی که من عرض میکنم یک مفهومی بسیار تجریدی است. لذا این پایه در منطق زبان گزارهها که یک روال مکانیکی دارد، اما نه مکانیک حرکت و فیزیک، یعنی جدول صدقش مکانیکی است. خودکار است، در فضای منطق. نه خودکار در فضای حرکت مکانیک کلاسیک. لذا برای جدول صدق گزارهها مکانیک میگویند. الآن پایهای که من میگویم در همه اینها میآید. این جور نیست که فقط صورت و ماده بگویم. مقصود من خیلی با اینها تفاوت دارد. پایه یعنی یک چیزی که سبب میشود یک چیزی ظهور کند. الآن در مولکول آب واقعاً یک طبیعی با آثار و خواص خودش دارید؛ یخ زدنش، ذوب شدنش، نقطه انجمادش، این آب غیر از دوتا هیدروژن و یک اکسیژن است. ولی آن سه تا پایه میشوند تا این ظهور کند. اگر این پایه به هم بخورد دیگر آن هم نیست. پس در عالم فیزیکی ما یک هویت مشت پر کنی بهمعنای آب در کنار اتم هیدروژن و اکسیژن نداریم، ولی یک هویت ظهور کرده به نام آب فیزیکی داریم.
والحمد لله رب العالمین
کلید: پایه محور، هوش اشراق محور، هوش پایه محور، پایه و کرسی، ظهور معنا، درک معنا، عملیات معنادار، مدل زبانی بزرگ، جعبه سیاه،
1 شرح المنظومة ت حسن زاده آملي نویسنده : السبزواري، الملا هادي جلد : 1 صفحه : 283