بسم الله الرحمن الرحیم

جلسات فقه هوش مصنوعي

فهرست جلسات فقه هوش مصنوعي

فقه هوش مصنوعی؛ جلسه 46 21/1/1404

بسم الله الرحمن الرحیم

تمایز بین هوش اشراق محور و پایه محور

قرار شد مباحثه را سه بخش کنیم. بخش اول مسأله مهم تمایز بین هوش اشراق محور با پایه محور است. با تلاش‌هایی که در آینده صورت می‌گیرد، برای نوع انسان واضح می‌شود که امتیاز انسان دارا بودن روح و نفس مجرده است؛ نفسی که از عالم دیگر آمده است. این برای نوع بشر واضح می‌شود. الآن به گمانم آن‌چنان در محافل جمعی و عقل جمعی بشر واضح نیست. ولی مبادی آن فراهم است؛ یعنی زحمت کشیده بشود که این جاهای خاص را نشان بدهند. تفاوت‌های آن را به نحو خیلی منحاز نشان بدهد. این بخش اول بود. هر چه هم ممکن بود از آن صحبت کردیم. در ادامه هم هر چه شما به نکته‌ای در توضیحش برخورد کردید، حتماً بفرمایید. پرونده بخش اول همین‌طور مفتوح است. عرض کردم رویکرد و روشی که می‌خواهیم اعمال کنیم، بیشتر روشی است که حالت تفلسف و اثبات کردن ندارند. می‌خواهیم بیشتر حالت ارائه شهودات وجدانی داشته باشد. همان‌طور که عرض کردم طوری باشد که چشم ذهن ببیند. نه این‌که ذهن با استدلال قانع بشود. خیلی تفاوت هست بین جایی که چشم ذهن چیزی را می‌بیند با این‌که ذهن با اثبات برهانی قانع شود. مقصود ما در بخش اول بیشتر آن است.

سیر تحلیل هوش پایه محور با شروع از اعداد باینری

بخش دوم این بود: بعد از فراغ از این‌که ما بین اشراق محور و پایه محور تفاوت گذاشتیم حالا بیاییم هوش پایه محور را دقیق تحلیل کنیم. به آن آگاهی کامل پیدا کنیم به‌نحوی‌که وقتی می‌خواهیم برای آن حکم فقهی بیاوریم، بدانیم که موضوع چیست. نسبتاً یک دید روشنی از پایه محور بودنش داشته باشیم. بخش سوم هم که بیان حکم شرعی بود.

در بخش دوم برای مباحثه ما یک مسیری طی شد. اگر نظرتان باشد برای این‌که توضیح بدهم که این هوش پایه محور چیست، از همان دل سخت‌افزار شروع کردیم و مسیری را جلو آمدیم. دیدم بعضی از اساتید تذکری داده بودند؛ به گمانم در مباحثه ما انجام شده است؛ فرمایشات اساتید در مباحثه‌های هوش مصنوعی را ارسال کرده بودند. دیدم تذکر داده بودند که رئالیستی رفتار کنید. یعنی روی فروض و قضایای شرطیه جلو نروید؛ اگر آگاهی داشت، اگر قصد داشت حکمش چیست و … جلو نروید. بگویید این کارهایی که انجام می‌شود جایز هست یا جایز نیست؟ احکامش چیست؟ این کارها بشود یا نشود؟ یکی هم این است که آن چه که هست را بگویید. در این فاصله که مباحثه کردیم هیچ وقت دنبال این نرفتیم که بگوییم اگر هوش داشت و اگر قصد داشت.

در روزهای اول عرض کردم، قصد و آگاهی های با روش فلسفه ذهن و هوش قوی اصلاً مورد بحث ما نبود. مکرر عرض کردم. من روی پایه محور تأکید می‌کنم به این جهت که متمحض و متبلور در رئالیستی است. یعنی در چنین فضایی که جلو می‌رویم، آن چه که الآن هست و واضح است و دارد انجام می‌شود و مهندس‌های نرم‌افزار با آن سر و کار دارند، داریم حکم همین را می‌گوییم. نه این‌که اگر فلان طور شد، بعداً بگوییم حکم فقهی اش چیست. همه تلاش ما در این بخش دوم همین است. یعنی آن چه که دارد می‌گذرد و آن چه که الآن هست را ببینیم حکمش چیست. اگر ما می‌گوییم قصد پایه محور، یک امر مبهم علی العمیاء به‌صورت قضیه شرطیه نباشد. بدانیم داریم چه می‌گوییم. بدانیم الآن در فرایند قصد پایه محور چه می‌گذرد. این مقصود ما در بخش دوم بوده است. حالا با توضیحاتی که عرض می‌کنم.

در این فرایندی که آمدیم اول عرض کردم اساس این‌که کامپیوتر پدید آمد و رشد کرد، این بود که عدد در مبنای دو دویی -باینری- جلو رفت و شروع به پیشرفت کرد. اگر عدد در مبنای دو -صفر و یکی- نبود، این‌ها نبود. البته فهرست وار عرض می‌کنم. ولی چیزی که بسیار مهم بود و اگر آن نبود، کامپیوتر نبود -یعنی از نظر وزن علمی مهم بود- کاری بود که شانون کرد. با تورینگ معاصر بود. او جبر صفر و یکی را وارد کامپیوتر کرد. عدد صفر و یک با جبر صفر و یکی -جبر بولی- خیلی متفاوت است. این‌ها را عرض کردم. جبری که متغیرهای آن فقط یکی از صفر یا یک را قبول می‌کند. این جبر صفر و یکی است. جبر دو ارزشی است. او بهترین استفاده را از این جبر کرد. جبر را کنار باینری آورد. صفر و یک به‌عنوان یک عدد، به‌عنوان رقمی که عددی را می‌رساند، یک هویت مقولی دارد. شما الآن می‌گویید صفر و یک؛ یک درکی دارید که در ذهن شما روشن است. از اعداد دو و سه و پنج و … یک درک مقولی و هویت مفهومی در ذهنتان می‌آید. اما اگر بگویم «صحیح و غلط» مفهومی واضح در ذهنتان می‌آید اما یک هویت ندارد. هویت «صحیح» چیست؟ شما بیان کنید. می‌گویید «یک»، یک هویت مفهومی دارد که یک عدد است. می‌گویید «انسان» یا سائر مقولات، این‌ها یک مفاهیمی هستند که هویت دارند. حالا یا شخصیتی پیشین یا پسین. اما وقتی می‌گویم «صحیح»، مفهوم خیلی روشنی دارد ولی این مفهوم چه هویتی را ارائه می‌کند؟ هویتی ارائه نمی‌کند. چرا؟ چون اصلاً ریختش نسبت است. صحیح یعنی آن چه که مطابق واقع است. دارد نسبت مطابقت یک قضیه و یک ایده را با واقع بیان می‌کند. صحیح یعنی مطابق واقع و درست. ببینید هویت ندارد.

بنابراین در چنین فضایی جبر صفر و یکی، معنا را -نه معنای هویت دار مثل عدد صفر و یک- که در حیطه روابط و نسب است داخل کرد. این گام بسیار مهمی بود که جبر آمد و نقش ایفاء کرد.

رد تبعیت تمام تکنیک‌های امروزی از ایده فلسفی

جلوتر عرض کردم؛ گفته می‌شود که خیلی از تکنیک‌های امروزی تبلور و تجسم یک ایده فلسفی است. جلوترها عرض کردم اندازه‌ای که من می‌فهمم، در ذهنم صاف نمی‌شود. اتفاقا مهندسین نرم‌افزار، یا کلاً مهندسین از اول تا آخر، آن کسی که برای مهئدس کار انجام می‌دهد ریاضی‌دان و ریاضیات است. او است که دارد کار انجام می‌دهد. فیلسوف اصلاً برای مهندس کار انجام نمی‌دهد. خود کلمه مهندس، اسم فاعل از هندسه است. اقلیدس یک کتاب هندسی نوشت، سائر مهندسین کتاب نوشتند و یک ابزار ریاضی به دست مهندسین دادند. حالا آن چیست؟ یک خط‌کش دست می‌گرفتند؛ خط‌کش و پرگار کهکشان پیما؛ اقیانوس پیما. مهندس همین است. یعنی ریاضیات و یکی از شعب ریاضی که هندسه است، برای مهندس یک ابزاری را فراهم می‌کند که با این ابزار ریاضی کارش را جلو می‌برد. فلاسفه چه می‌گویند، نقطه چیست، خط چیست، تعریفش چیست، هست یا نیست، اصلاً کاری با این‌ها ندارد. نه هندسه در بند آن بحث‌های فلسفی است و نه مهندس وقتی می‌خواهد با ابزار هندسه طول را اندازه بگیرد یا فاصله زمین تا خورشید را اندازه بگیرد در بند آن‌ها است. تشابه مهم‌ترین ابزار کهکشان پیما و اقیانوس پیمای مهندسین است. آن هم در فضای هندسی؛ فضای سه بُعدی.

خب ببینید الآن هم همین‌طور است. واقعاً به این صورت است. هر چه هم فکرش را می‌کنم این جور به ذهنم می‌آید. یعنی در زمان ما و این صد سالی که گذشت، یک ایده فلسفی نیامد به این‌ها بگوید بروید به‌دنبال هوش مصنوعی، به‌عنوان یک تکنیک، تکنولوژی و صنعت. ابزار ریاضی فراهم شد و این تکنیک پیش رفت. الآن هم مهندسین نرم‌افزار کاری با فلسفه ذهن و … ندارند. آن‌ها دارند کار خودشان را می‌کنند. یک فضایی برای خودشان است.

شروع نسل اول هوش مصنوعی با جبر صفر و یکی

خب ابزار این فضا از کجا می‌آید؟ عدد باینری، یک ابزار ریاضیاتی بسیار قوی به دست مهندسین داد. این کاری به فلسفه ندارد. عدد باینری را فلاسفه باید به آن‌ها بدهند؟ نه. بعدش کلود شانون آمد جبر صفر و یکی را آورد و محاسبات نمادین را شروع کرد. نسل اول هوش مصنوعی -هوش مصنوعی نمادین- با کار او شروع شد. جبر صفر و یکی وارد فضا شد. از آن استفاده کردند. جبر است، جبر که فلسفه نیست. جبر سرآمد شعب ریاضیات است. می‌توانید فلسفه جبر داشته باشید اما خود جبر، پیشرفت جبر و کار جبری کردن ربطی به تفلسف ندارد و جای خودش است. این، ابزار تهیه می‌کند و به دست مهندس می‌دهد.

نسل دوم هوش مصنوعی با جبر خطی

الآن زمان ما، به‌خصوص یه سه-چهار سال اخیر که پیشرفت عجیبی شد، دوباره این جبر خطی را وارد فضا کرد. جبر خطی آمد و الآن شما مدام از آن سؤال می‌پرسید و جواب می‌دهد. همین چند سال آمد، خیلی عمر طولانی ای ندارد. شروعش شاید پانزده-شانزده سال بشود اما پیشرفت‌های بزرگ بزرگش برای همین چند سال اخیر است. جبر خطی به فضای همین هوش مصنوعی آمد. با آمدن جبر خطی دوباره یک هنگامه ای شد. مهندس نرم‌افزار کاری ندارد که فلسفه ذهن و نماد و … چیست. او می‌بیند که الآن جبر خطی یک ابزار خوبی به دستش می‌دهد و با این ابزار ریاضی کارش را جلو می‌برد. ابزار نیاز است. خود دکارت وقتی مختصات دکارتی را طراحی کرد -محور x و y؛ مختصات دو بعدی کارتزین- یک کار ریاضیاتی کرد. دکارت در اینجا فیلسوف نبود. بگویید دکارت فیلسوف بود، حرف زد، چه ایده هایی داشت و …، هر چه بگویید، کاری که دکارت در ابداع محور مختصات و هندسه تحلیلی با آن عظمت که بعداً مدام پیشرفت کرد، این ابزار ریاضیاتی بود. تفلسف نکرد. این چیزی است که من می‌فهمم.

الآن هم همین‌طور است. الآن هم در بخش دوم مباحثه، تمام همّ ما این است که این ابزار را شناسایی کنیم. ببینیم در علوم پایه چه ابزاری فراهم کردند؛ شما هم به‌عنوان طلبه هر چه روی این‌ها مطالعه کنید خوب است. البته نه به‌صورت حجیم، ولی برنامه‌ریزی کنید و مدیریت زمان کنید تا هر هفته ببینید یک مقداری پیش رفته‌اید. اگر من یک کلمه از جبر خطی بلد نیستم، اما با هفته ای نیم ساعت وقت گذاشتن، بعد از پنج-شش ماه می‌بینم دیگر یاد گرفته‌ام. علی ای حال این زمان بسیار اهمیت دارد. جبر بردارها است، جبر تنسورها است، جبر ماتریس ها است.

شاگرد: این‌که به فلسفه کاری ندارند، آیا به‌صورت خودآگاه و اختیاری کاری ندارند یا در ناخودآگاهشان از مبانی فلسفی استفاده می‌کنند؟

استاد: ببینید اصلاً ممکن نیست کسی کاری را بدون تفلسف شروع کند. قبلاً هم این را عرض کردم. من که منکر این نیستم. هر چه هم می‌خواهید کار فیلسوف را انجام بدهید، من مشکلی ندارم. من می‌خواهم قاطی نشود. یعنی آن جایی که یک ابزار ریاضی برای مهندس فراهم شده و دارد جلو می‌رود، شما بگویید اینجا یک ایده فلسفی فعال است. نه، این‌طور نیست. بله، ناخودآگاه ایده های فلسفی دارد کار می‌کند. اما آن چه که موتور کار است، تفلسف نیست. آن چه که موتور کار است فراهم شدن یک ابزار ریاضی است. الآن این‌ها دارد جلو می‌رود.

اتفاقا شاهد عرض من هم همین نسل دوم هوش مصنوعی است. اگر مدام می‌گفتند هوش مصنوعی تجسم یک ایده فلسفی است، نسل دوم هوش مصنوعی که آمد، به گمانم آشکارا دارد می‌گوید که این حرف درست نیست. نسل دوم چه بود؟ جلوتر هم صحبتش شد. نسل اول همان نمادگرائی بود. طبق ضوابط و قانون هایی که بود؛ قانون‌مند جلو می‌رفت. اشکالاتی هم از درایفوس بود. یکی از اشکالاتی که می‌خواستند مطلب را سر برسانند، مشکل چهارچوب بود. یعنی وقتی صحنه عوض می‌شود و یک انتقال می‌خواهد صورت بگیرد، چه چیزهایی باقی می‌ماند و چه چیزهایی متغیر می‌شود. خب این یکی بود. نسل دوم هوش مصنوعی که آمد، با یک فاصله کوتاهی نسل سوم آمد. خود نسل دوم یک مرحله ابتدائی داشت؛ بهار هوش مصنوعی داشت و زمستان داشت. بهارش که شروع شد یک مرتبه اول داشت؛ یادگیری ساده بود. گام بعدی آن با یک پیشرفتی آن را یادگیری عمیق کردند (Deep learning). وقتی این پیش آمد، با مشکل جدیدی روبه‌رو شدند.

شاگرد: نسل اول و دوم چه شد؟

استاد: یادگیری ساده بود. نسل دوم آن وقتی است که دیگر نمادگرای کنار رفت و اتصال گرائی آمد. یعنی فضای شبکه عصبی انسان را درآوردند. این ابتدای نسل دوم است. یعنی کلاً نمادگرائی و قاعده محور بودن کنار رفت، دقیقاً شبکه‌های عصبی را پیاده کردند. ببینند که خدای متعال شبکه‌های عصبی را در دماغ انسان چجور قرار داده است و چجور دارد کار می‌کند، کار آن را پیاده کنند. چرا؟ چون قبلی شکست خورد. برای نسل اول خیلی پول داده بودند. مدام به نتیجه نرسید، کارها هم ماند. بودجه ها را قطع کردند. تعبیر می‌کنند به زمستان. این خودش آتش زیر خاکستر بود؛ خودشان مشغول بودند تا کم‌کم در رده بعدی نسل دوم آمد. نسل دوم همان شبکه‌های عصبی بود. ساده‌ترین شبکه عصبی بود.

یادگیری عمیق و مشکل جعبه سیاه در هوش مصنوعی

مرحله دوم یادگیری عمیق بود. یک مشکلی هم که الآن هست، مشکل جعبه سیاه است. الآن خیلی مهم است و دارند خیلی روی آن کار می‌کنند؛ «Black box problem». این جعبه سیاه شاهد عرض من است. این مشکل، شاهد عرض من است که تفلسف و ایده فلسفی پشت کار پیشرفت این‌ها نیست.

الآن می‌خواهند کار شبکه عصبی را و نورون های عصبی را شبیه‌سازی کنند و پیاده کنند، این فلسفه است؟! من به گمانم اصلاً فلسفه نیست. در مهندسی نرم‌افزار می‌بیند که شبکه‌های عصبی رفتارشان به چه صورت است تا همان را پیاده کنند. اینجا اصلاً فلسفه نیست. او اصلاً کاری با فلسفه ندارد. آن جا یک رفتاری را می‌خواهد از نورون ها ببیند و آن را پیاده کند. مرحله اولش ساده بود؛ نورون های ساده‌ای که تنها یک لایه دارد. ورودی و لایه پردازش و خروجی. به این ساده‌ترین پردازش شبکه سلول عصبی می‌گویند. ورودی و یک لایه پردازش و خروجی.

شاگرد: این متوقف بر این است که معرفت را یک امر مجرد بدانیم.

استاد: اصلاً متوقف بر این‌ها نیست. مثال بزنم؛ مثلاً نانوتکنولوژی که الآن کار می‌کنند. چقدر مبتنی‌بر تفلسف است؟! ذهنمان را دور نبریم. فیزیک خیلی نزدیک به تفلسف است. از علومی که خیلی دور از تفلسف است -نمی‌گویم نیست- شیمی است. کارهای شیمی و تحقیقاتی که دارند، تفلسف ندارد. می‌خواهم غلبه را بگویم. الآن نانوتکنولوژی مرتب دارد کار می‌کند. ذرات را مهندسی می‌کنند و مواد با خواص مختلف پدید می‌آید، فلسفه این چیست؟ شما بگویید.

شاگرد: بله، ممکن است از فلسفه دور باشد اما باید ببینیم معرفت چطور است. چون می‌خواهد بشناسد.

استاد: ما کاری به معرفت نداریم. ما می‌خواهیم بگوییم یک شبکه نورونی با پیام های شیمیایی الکتروکی چه کار می‌کند. یک نورون عصبی ورودی دارد و خروجی دارد. چه کار می‌کند؟ شما می‌گویید معرفت چیست، درحالی‌که کاری به معرفت ندارد. دارد می‌گوید این عملکرد یک نورون است. بعداً عرض می‌کنم که مشکل جعبه سیاه چیست.

شاگرد2: آگاهی از همین نورون ها به وجود می‌آید.

استاد: نه، شما به قدم های آخر نروید. اگر من توضیح آن را عرض کنم می‌بینید که چه آخر کار وحشتناکی است. آن برای خودش یک چیزی است. ابتدا همین است: او می‌خواهد کار یک نورون را شبیه‌سازی کند. نسل دوم این است.

شاگرد: این قدم اولش بود.

استاد: این قدم ساده اول بود. «Deep Learning» یا یادگیری عمیق است. آموزش مرتبه بعدی است که عرض می‌کنم. یادگیری عمیق چیست؟ لایه‌ها متعدد می‌شود. یعنی وقتی ورودی وارد می‌شود، مثلاً در ده لایه پردازش می‌آید تا خروجی در بیاید. اینجا وقتی یادگیری عمیق پیش آمد، یعنی الآن مهندسین با ابزار شبیه‌سازی شبکه عصبی و نورون های مغزی پردازشی عمیق درست کرده‌اند. یعنی ورودی ای که به آن می‌دادند چند لایه پردازش می‌شد بعد خروجی می‌داد. اینجا بود که مشکل جعبه سیاه پیش آمد. یعنی مکانیسم این‌که چرا جواب داد، برای آن‌ها مخفی است. جعبه سیاه یعنی نمی‌دانند که چه گذشت. جعبه شیشه‌ای و سفید هم هست. الآن این را جلو برویم تا بعد به آگاهی برسیم. این الآن برایشان خیلی ناخوشایند است. آقا هم می‌گفت یک جواب های با اطمینانی می‌دهد، دیدم خودشان نمی‌توانند برگردند و ببینند چرا این کارها را می‌کند. مهندس آمده در نسل سوم و بعد نسل چهارم «Deep Learning» کرده، کار خودش را انجام می‌دهد و شروع می‌کند به او داده می‌دهد. آن هم حسابی جواب می‌دهد؛ یک جاهایی جواب های خوبی می‌دهد و یک جاهایی هم با اطمینان جواب های غلط می‌دهد. خودش در آورده است. می‌گویند توهم زده است. خود مهندسین می‌گویند ماشین توهم زده است، چرا؟ نمی‌دانند.

شاگرد: جهتش را نمی‌دانند.

استاد: اصلاً نمی‌توانند برگردند و ببینند چه کار کرده‌اند. یعنی در آن درخت تصمیم‌گیری که یکی را انتخاب می‌کند، نمی‌دانند چرا این را انتخاب کرد.

شاگرد: این در گام دوم بود.

استاد: بله، در یادگیری عمیق مشکل جعبه سیاه پیش آمد.

شاگرد: این الآن همانی است که در هوش مصنوعی ها سر و کار داریم؟

استاد: بله.

شاگرد: این‌که جواب غلط می‌دهد همین است؟

استاد: بله، با اطمینان هم جواب غلط می‌دهد و خود مهندسین هم نمی‌توانند آن را تصحیح کنند. در هوش مصنوعی نمادین بر می‌گردد و درست می‌کند. می‌گوید اینجا اشتباه شد. اما اینجا چون طبق اتصالات شبکه عصبی است، آن هم عمیق، یعنی لایه‌های مخفی پردازش است، ما نمی‌دانیم چه کار کرده که این خروجی را داده، لذا نمی‌توانیم برگردیم آن را درست کنیم. اینجا خیلی زحمت کشیده‌اند که چه کار کنیم. به این هوش مصنوعی توضیح ناپذیر می‌گویند. یعنی نمی‌توان توضیح داد که چه کار کرده است.

الآن دارند کار بسیار مهمی انجام می‌دهند؛ «XAI» می‌گویند. یعنی توضیح پذیر؛ می‌خواهند هوش مصنوعی توضیح ناپذیر را توضیح پذیر کنند.

شاگرد: نسل سوم چه می‌شود؟

استاد: نسل سوم همین آموزش عمیق است.

شاگرد: منظورتان از نسل سوم همین لایه دوم است؟

استاد: نسل‌ها را که به کار می‌برند اصطلاحات مختلفی دارد. فقط باید محتوا را دید. البته اندازه‌ای که من مطالعه کرده‌ام.

شاگرد: این‌که با فاصله کوتاهی بعد از نسل دوم، نسل سوم آمد… .

استاد: نسل سوم نه، گفتم مرتبه دوم نسل دوم. مبنای نسل دوم اتصال گرائی و شبکه‌های عصبی است. وقتی در فضای شبکه‌های عصبی می‌روید، دیگر سر و کار شما با معنا نیست. این‌ها را عرض می‌کنم چون قبلاً گفتیم که با یک شبکه معنا درست می‌کنند. شبکه معنایی که من عرض کردم دو جور است. الآن یک شبکه معنایی هست که روی همان مبنای قاعده محور است. آن یک جور شبکه درست می‌کند. قبلاً توضیح آن را عرض کردم. طبق حرف‌هایی که الآن هست، شبکه معنایی طور دیگری به پا می‌شود.

شاگرد: الآن این گام دوم را پیش رفته‌اند؟ متوجه شده‌اند که چرا جواب غلط می‌دهد؟

استاد: نمی‌شوند. اصلاً نخواهند شد. یعنی مشکلی است که نمی‌توانند کاری کنند. او خودش پردازش انجام می‌دهد و آن‌ها نمی‌توانند بفهمند چه کار کرده است. فقط می‌توانند مرحله به مرحله تفکیک کنند و آن را توضیح پذیر کنند؛ «xai» کنند.

شاگرد: این مرحله سوم است؟

استاد: مرحله سوم جور دیگری است که الآن می‌خواهم عرض کنم.

شاگرد: قبل از مرحله سوم چه کار می‌کنند؟ یعنی نمی‌توانند بفهمند چه کار می‌کند اما آن را بخش بخش می‌کنند.

نسل سوم هوش مصنوعی و روش داده محوری

استاد: نسل سوم که خیلی مهم است، این است که اصلاً ریخت درک منطقی…؛ یادتان هست که عرض کردم دو تا «LLM» داریم؟ یکی ماشین یادگیری منطقی بود. اما دیگری مدل زبان بزرگ بود. اولی که یادگیری ماشین منطقی باشد، نسل اول است که الآن صحبت شد. نسل سوم که آمد داده محور شد.

شاگرد: نسل سوم چه کار کرد؟

استاد: عوض کرد. به جای این‌که منطقی فکر بکند، آماری جلو می‌رود. خیلی تفاوت می‌کند که در یک فضایی مبنای کار شما بر آمار باشد تا مبنای کار شما بر منطق و استنتاج باشد. این جهت الآن خیلی اهمیت دارد. این‌ها را که دیدم مثال‌های قدیمی طلبگی به ذهنم آمد؛ اگر زیج را با هیئت مقایسه کنید؛ مثلاً تشریح الافلاک، سی فصل قوشچی و مجسطی. بشر در رصدخانه چه کار کرده؟ یادتان هست که عرض می‌کردم استاد فرمودند من به رصدخانه مراغه رفتم، آقا جان یک حال خوشی به من دست داد که این بنده‌های خدا در دل کوه چه کارها کرده‌اند! رصدخانه مراغه بالای کوه است. خب رصدخانه هایی که بوده امروز هم هست. کار رصدخانه چیست؟ کاررصدخانه نه فلسفه است و حتی نه مستقیماً کار ریاضیاتی است، نه منطقی است. رصدخانه فقط جمع‌آوری اطلاعات است. با ابزاری که دارد می‌گوید این لحظه طلوع و غروب کرد، این اندازه رفت. زیج همین است. زیج آن دیتاهای نجومی را پیاده می‌کند. بعد بشر چه کار می‌کند؟ این اندازه‌ای که نگاهش به آسمان است و زیجاتی را آورده، مبنای زیج بر آمار بوده است. او بعد شروع به الگو سازی کردن می‌کند. الگو سازی قدیم بطلمیوسی چه بود؟ می‌گفت زمین وسط است. از چیزهایی که از دیتاهای زیج کشف کردیم، این بود که نزدیک ترین کره به ما ماه است. بعد تیر است. بعد ناهید و بعد خورشید و بعد مریخ و بعد مشتری است و بعد زحل است. تا زحل هم که تمام می‌شد. اورانوس و نپتون هم که نداشتیم. بعد هم ثوابت است و بعد فلک اطلس. در تشریح الافلاک بود.

شاگرد: پردازش اطلاعات را می‌فرمودید.

استاد: بله، کشف الگو. یعنی می‌گوید این داده‌های آماری زیج به این صورت است. مبتنی‌بر چنین الگو و مدلی است.

نکته مهم در نسل سوم این است: الآن وقتی نسل سوم آمد دیگر از راه اطلاعات وسیع شروع کرد به کشف الگو کردن. ولذا مدل زبان بزرگ چرا بزرگ است؟ چون پارامترهای بسیار زیادی در آن دخالت می‌کند. اما نکته ی مهم در بزرگ بودنش این است که چون شما طبق یک ضابطه منطقی و قواعدی که از پیش تعیین کرده‌اید اصلاً جلو نمی‌روید. شما با یک اطلاعات خام مواجه هستید که مثل یک خزینه در آن می‌ریزید. فقط بر پایه لارج (Big Data)، یک اطلاعات وسیع می‌دهید. او شروع می‌کند، اما طبق یک معنا جلو نمی‌رود، طبق یک قاعده و ضابطه جلو نمی‌رود. صرفاً شروع می‌کند با ضوابط آمار کار می‌کند. هر چه هم جلوتر رفت بعداً با بردار پیش می‌رود. مبنای توکن بر آمار است. هر متنی را به آن بدهید به توکن ها تجزیه می‌کند و آمارگیری می‌کند. اصلاً کاری با معنا ندارد. بعد هم شورع می‌کند به حدس زدن. بخشی از کار ذهن ما هم همین‌طور است. حالا مدام پیشرفت کرده که بعداً عرض می‌کنم. من جمله‌ای را عرض می‌کنم، ذهن شما فوری محور همنشین و جانشین آن را حدس می‌زنید. مثلاً تا ماشین می‌گویم، شما فوری راننده را حدس می‌زنید. چون می‌بینید راننده به ماشین مربوط است.

شاگرد: این به معنایی نزدیک تر است تا آماری.

استاد: جالب این است که وقتی آماری کار می‌کند در ذهن شما نمی‌آید…؛ زبان شناس می‌گوید شما که به بچه زیاد گوگل یاد نمی‌دهید! این‌طور ایراد گرفته است. ولی این را الآن انجام داده‌اند. آن‌ها با مختصر یادگیری و پیش یادگیری اطلاعات را به او داده‌اند و بعد او با آمار کار می‌کند. در کل زبان بشر، هر چه به او داده‌اند، نگاه می‌کند تا ببیند در این سندها و جاهایی که ماشین آمده، چند چیز دیگر با آن آمده است. در این همه دیتای وسیع آمارگیری می‌کند و کلماتی که بیشتر با هم از نظر درصد کاربرد با هم هستند را پیدا می‌کند. خب در اینجا بعداً از صرف آمار متوجه می‌شود. اصلاً او اصلاً نمی‌داند ماشین به چه معنا است. او فقط می‌بیند ماشین با راننده در مجموع این همه داده‌ای که به آن داده، خیلی زیاد در سندها آمده است. بدون این‌که بفهمد معنای آن چیست. اینجا از طریق آمار جلو رفته است؛ «llm». مدل زبان است. صوریت زبان را هم به آن ضمیمه کنید؛ الآن خیلی وقت نیست که «LCM» را هم اعلام کرده‌اند. یعنی مدل مفهومی. الآن شروع شده است.

شاگرد: وقتی فهمید در کنار ماشین چه کلماتی زیاد استعمال شده، بعد چه کار می‌کند؟

استاد: مهم‌ترین چیزی که در اینجا اساس مطلب است تا فهم آن برایتان واضح بشود، این است که از مفهوم بردار شروع کنید. بردار یک مفهوم ریاضی است، همه در کلاس‌ها شنیده‌اید، ولی برای درک این فضا که این زبان‌ها چه کار می‌کنند، شما باید جبر خطی را بدانید. جبر صفر و یکی را آن آقا آورد و شروع شد. الآن این جبر تنسورها است. به جای جبر صفر و یک جبر تنسورها آمده است. جبری است که سر و کارش با تنسورها است. وقتی به‌دنبال این بروید می‌فهمید که دارد چه کار می‌کند. بردار به چه صورت است؟ شما الآن جدول مختصات در ذهنتان هست؛ محور x و محور y. برای این‌که یک نقطه را در یک صفحه معین کنید به چند چیز نیاز بود؟ دو چیز نیاز داشتید تا بگویید در محور x، چهارتا جلو برو و در محور y شش تا برو، بعد آن نقطه می‌شود. با دو شناسه و دو چیزی که معرفی می‌کرد، در صفحه یک نقطه‌ای را تعیین می‌کرد. خب یک نقطه بود، می‌گویند تنسور رتبه صفر. یک عدد است که نقطه تعیین می‌شود.

اما بردار چیست؟ خیلی مفهوم مهمی است. شروعش هم ساده بوده است. در علم فیزیک فرمول‌هایی که در جاذبیت و نیرو و مکانیک کلاسیک و حرف‌هایی که نیوتون آورده بود را می‌خواستند جلو ببرند، این بردار آمد و بعد هم خیلی ریاضیاتی و قوی شد. آن وقت یک بردار یک بُعدی و دو بُعدی بود، الآن دیگر در این زبان با بردارهایی با ابعاد بسیار بالا کار می‌کنند. یعنی شما اول باید تصور ساده بردار را بکنید و بعد با ابعاد بالاتر تصور کنید که اصلاً به شکل ریاضی نمی‌توانید در بیاورید، فقط باید تصور عقلانی کنید. بعد از این‌که بردار معلوم شد، بعد هم ماتریس و بعد از ماتریس هم تنسور آمد. تا هفته دیگر اگر زنده بودیم مبادی این‌ها را مطالعه کنید. من هم اندازه‌ای که مطالعه کردم عرض کردم. بینی و بین الله دیگر سن من اقتضاء این حرف‌ها را ندارد. ولی می‌توانم بهانه بشوم و هندل بزنم. طبق اقتضای سن شما ان شاءالله به دنبالش می‌روید و ملاحظه می‌کنید.

ببینید خصوصیت بردار این است که نقطه نیست. نقطه فقط پایه بردار است. وقتی گفتید در طول محور x شش تا جلو برو و شش تا بالا برو، وقتی به آن نقطه رسیدیم، تازه یک پایه‌ای با عرض از مبداء و طول از مبداء پیدا کرده‌اید. هر بردار دو چیز مقوم دارد؛ جهت و عدد. یعنی مقدار یک بردار و جهت بردار. پایه هم که شروع کارش است. بعد می‌گویید از این پایه با فاصله عدد پنج در جهت خاصی. هر چه شما تعیین کنید؛ مختصات سه بعدی، دو بعدی، یا اگر زمان را در کارش بیاورید چهاربعدی می‌شود، با انواع و اقسام آن. مثال‌های آن را چندین جور یادداشت کرده‌ام.

بنابراین مهم‌ترین کاری که در این نسل جدید انجام شده و لذا مشکل جعبه سیاه پیش آمده؛ مشکل جعبه سیاه این است که او در پردازش های خودش و در این‌که شما به آن ورودی می‌دهید و بعد هم می‌بینید جواب های خوبی می‌دهد، اما توهم هم دارد. هوش مصنوعی می‌تواند تخیل کند؟ تخیل می‌تواند قاعده مند باشد. مهندسین نرم‌افزار برای تخیل هوش مصنوعی مشکلی ندارند. اصلاً به آن برنامه می‌دهند. اما وقتی به اصطلاح خودشان توهم می‌زند، در توهم دست مهندس بسته است. هیچ کاری نمی‌تواند بکند. به محکمی می‌گوید مطلب این است. اما از کجا در آورده است؟ نمی‌دانند. بعداً وقتی خیلی کار کنید، قدم به قدم نه این‌که مکانیسم کار آن را بفهمید، قدم به قدم کار آن را کنترل می‌کنید. توضیح پذیرش می‌کنید. با زحماتی که کشیده‌اند.

شاگرد: در این نسل جدید کاری که شده توضیح پذیر بودن است؟

استاد: در نسل جدید بر مبنای آمار الگوهایی کشف می‌شود که چه بسا اصلاً بشر هم کشف نکرده‌اند. ولذا من برای لغت و اشتقاق گفتم که خیلی پر فایده است. یعنی شما الف و ب و کابرد و آمارش را به این مدل زبانی می‌دهید، همه اطلاعات اشتقاق کبیر را به آن می‌دهید، خودش فقط با آمار شروع می‌کند و کشف الگو می‌کند. الگوهایی که چه بسا بعداً می‌بینید درست هم هست. الگوهای زبانی خیلی عالی. این نسل سوم است. یعنی «base statistical»؛ بر پایه و محور آمار جلو برود. کاری به معانی ندارد. فقط با عدد آمارگیری می‌کند. تعداد آمارها و بعد با بردار، «embedding» می‌کند. مهم‌ترین فنی که الآن خیلی کارساز بوده، این است که کلمات را توکن بندی می‌کنند و در بردارهایی با بُعد زیاد، جهت‌دهی معنایی می‌کنند؛ جهت‌دهی معنایی اما بر مبنای آمار. این نسل سوم است. یعنی بردارهایی است که تعیین می‌کند این کلمات نزدیک هم هستند-درست هم می‌گوید- اما نه این‌که معنا را درک کند. صرفاً با آمار جلو می‌رود.

شاگرد: دلیل خطای ما که هوش واقعی هستیم چیست؟ ما هم این خطاها را می‌کنیم؛ گاهی ورودی‌ها درست است ولی خطا می‌کنیم.

تنظیر توضیح ناپذیری هوش مصنوعی به پرنده هدهد

استاد: اتفاقا چون ریخت شبکه‌های عصبی را پیاده سازی کرده‌اند، اگر این‌ها در آینده پیشرفت بکند و پردازش های عمیق را بتوانند به رده بالای توضیح پذیری در بیاورند، چه بسا خیلی از جاهایی که در ذهنمان اشتباه می‌کنیم را بگویند. همانی که مرحوم آسیدعلی نجف آبادی می‌گفتند؛ وقتی به نجف رفته بودند گفته بودند نوشته جات علماء نجف را برایم بیاورید؛ مبیضه آن را نیاورید، مسوده ها را بیاورید. این دلالت بر علو علمی آسید علی نجف آبادی دارد. عالم بزرگی بودند. استاد اسفار مرحومه بانو مجتهده امین بودند. می‌گفتند دست‌نوشته‌های علماء را بیاورید تا وقتی در نجف مشرف هستم استفاده کنم. ولی پاک نویس را نیاورید. چرک نویس را بیاورید که خط زده‌اند. بعد این را می‌گفتند؛ جمله بزرگ بزرگ آسید علی است؛ می‌گفتند استفاده‌هایی که از خط زده‌ها می‌کنم بیش از جاهای دیگرش است. این خیلی حرف بزرگی است. یعنی ایشان به نحوه پیشرفت ذهن نویسنده نگاه می‌کند. چطور شد که آن را نوشت و بعد برگشت و خط زد؟! چرا خط زد؟! فهمید اشتباه کرده‌اند. چرا اول اشتباه کرده بود؟! چطور شد اشتباه کرده بود؟! درک چطور شدن اشتباه و رفت‌وبرگشت او یک ذهن لطیف دقیقی می‌خواهد تا بفهمد. کسی که این‌ها را بفهمد در فکر خودت قوی‌تر و سلیم تر و از خطا دورتر است. چرا می‌گویند منطق بخوانید؟ «آلة تعصم مراعاتها الذهن عن الخطا فی الفکر»؛ منظم می‌شود.

شاگرد: فرمودید اشتباه را در همان گامی که پیش آمده کشف می‌کنند اما نمی‌دانند که چرا اشتباه شده؟

استاد: نه، اول آموزش عمیق پیش آمد و با آن صحبت می‌کردند. می‌دیدند که چیزهایی را می‌گوید که توهم زده است. ولی نمی‌دانند چرا. نمی‌توانند برگردند و بگویند اینجا سبب شد که او توهم زد. نکته توهم زدن او مشخص نیست. او که داعیه ای ندارد که بخواهد دروغ بگوید. ولی حتی با اطمینان می‌آید و می‌گوید مطلب این است.

شاگرد: نقطه توهم را کشف می‌کنند ولی دلیل آن را نمی فهمند.

استاد: نقطه توهم کشف نمی‌شود. چون عمیق است. قوام عمیق به این است که لایه‌های پردازش مخفی است. جعبه سیاه همین است. یادم افتاد از کاری که هدهد برای حضرت سلیمان می‌کرد. حضرت سلیمان نشستند و گفتند «مَا لِيَ لَآ أَرَى ٱلۡهُدۡهُدَ»1؛ هدهد کجا است؟ چرا نمی بینمش؟ «مَا لِيَ لَا أَرَى ٱلۡهُدۡهُدَ أَمۡ كَانَ مِنَ ٱلۡغَآئِبِينَ، لَأُعَذِّبَنَّهُۥ عَذَابا شَدِيدًا أَوۡ لَأَاْذۡبَحَنَّهُۥ أَوۡ لَيَأۡتِيَنِّي بِسُلۡطَٰن مُّبِين». بعد هدهد آمد و چه گفت: «وَجِئۡتُكَ مِن سَبَإِۭ بِنَبَإ يَقِينٍ». خب حضرت سلیمان منطق الطیر را می‌دانستند؛ «عُلِّمۡنَا مَنطِقَ ٱلطَّيۡرِ»2. حضرت سلیمان منطق طیر را می‌دانستند. چطور شد که به‌دنبال هدهد گشتند؟ چه کارش داشتند؟ در روایت هست. به نظرم در تفسیر برهان باشد؛ او آب را پیدا می‌کرد. یکی از چیزهای جالب است؛ حضرت، هدهد را با خود می‌بردند به این خاطر که زمین و خاک مانع دیدن چشم هدهد نیست. مثلاً با فاصله صد متر و دویست متر، آب زیر خاک را می‌بیند. در روایت هست. حضرت او را با خودشان می‌بردند. چون لشگر ایشان بیابان‌ها طی می‌کرد. هدهد می‌گفت اینجا را بکنید و با فاصله پنج متر به آب برسید. نشان‌دادن نقطه مهم است. جا را بداند کجا است.

مرحوم سید بحر العلوم رضوان‌الله‌علیه! حاج آقا می‌فرمودند می‌خواستند مسجد کوفه را تعمیر کنند، ایشان به وادی السلام نزدیک قبر حضرت هود و صالح آمد. گفت اینجا را بکنید. کندند و پایین رفتند؛ سنگ‌های خیلی عال العال و خوبی از زیر خاک درآمد. گفتند این‌ها را برای تعمیر مسجد کوفه ببرید. حالا سید چطور می‌گفت اینجا را بکنید. هدهد هم این‌طور بود. بعد هم رفت و گفت «عُلِّمۡنَا مَنطِقَ ٱلطَّيۡرِ…». آن چه که به ذهنم آمد، این بود: هدهد نگاه می‌کند، در روایت دارد حضرت سلیمان با این‌که پیامبر بودند…؛ خب خداوند به هر کسی یک چیزی داده است. آن علوم غیبیه یک چیز است اما آن عملکرد ظاهری بدن یک نبی این نیست که زیر خاک یک چیزی را ببیند. بدن او هم « إِنَّمَا أَنَا۠ بَشَر مِّثۡلُكُمۡ»3، و لذا هدهد را به کار می‌گرفتند. ولو ممکن است از حیث مقام نبوت بالاترش را هم داشتند. مثل خود آصف بن برخیا؛ با این‌که او وصی حضرت بود اما او را در آوردن تخت بلقیس به کار گرفتند. الآن حضرت هدهد را به کار گرفتند، او می‌گوید اینجا آب است. بدن هدهد که خداوند به این ظرافت آفریده، خدا یک جعبه سیاه آفریده است. یعنی نه خود هدهد خبر دارد که چرا آن جا را می‌بیند و می‌گوید آب است، و نه ما می‌توانیم بفهمیم -یا حضرت سلیمان به اندازه علمشان- که چه مکانیسمی رخ داده که دارد آب را می‌بیند. ولی می‌گوید اینجا آب است و می‌رویم و می‌بینیم درست است. نکته این است. مدل زبان بزرگ چه کار می‌کند؟ شما چیزی به آن می‌دهید و درست جواب می‌دهد. یعنی در صد مورد یکی توهم می‌زند. و الا صدتا جواب خوب دارد. چطور دارد؟ یعنی چطور شد به این نتیجه رسید و توضیح داد. ما نمی‌دانیم چطور به این مسیر آمد. «Rollbase» نیست که طبق قاعده رفته باشیم و مسیر را برویم و برگردیم. این خبرها نیست. اما می‌بینیم که درست جواب می‌دهد. مثل هدهدی که می‌گوید و می‌کنیم و می‌بینیم آب بود. چجور؟ نمی‌دانیم.

راجع به همین هدهد دارد؛ ابوحنیفه از حضرت سؤال کرد، چه شد؟ شما می‌گویید آب را در زیر زمین می‌بیند؟! حضرت فرمودند چه مشکلی دارد؟ می‌خواست ایراد بگیرد. گفت چطور آب را صد متر زیر زمین می‌بیند اما توری که یک بند انگشت زیر خاک مخفی کردند را نمی‌بیند؟! ما مکرر دیده‌ایم که هدهد در تور می‌افتد و صیاد پای آن را می‌گیرد. ابوحنیفه گفت «ظفرت بك»؛ یعنی گویا مچ شما را گرفتم. چطور آب را زیر زمین می‌بیند ولی تور صیاد را زیرخاک نمی‌بیند. حاج آقا می‌فرمایند چون این جور حرف زد، حضرت کنیه او را نگفتند و اسم او را گفتند. حضرت فرمودند: «يا نعمان ، أما علمت أنّه إذا نزل القدر أغشي البصر»4. حضرت به اشکال او این جواب را دادند.

لذا می‌بینید جایی توهم می‌زند ولی نمی‌دانیم چه شده است. علی ای حال خیلی مهم است. هوشی هم که اخیراً آمد، این‌که مهمه شد و در سخت‌افزار نیاز کمی داشت، همین « Deepseek» بود. گفتنش آسان است؛ ششصد و هفتاد و یک بیلیارد پارامتر دخیل است که به شما جواب بدهد. زبان بزرگ است. اما چرا سخت‌افزار کم‌تری نسبت به هوش های شرکت‌های آمریکایی با بودجه های بالا استفاده کردند؟ چون وقتی شما درخواست را به آن می‌دهید همه را فعال نمی‌کند. با الگوهایی که ریاضی دان ها به آن داده‌اند، فقط شصت و هفت میلیاردش را فعال می‌کنند. هر درخواستی که می‌دهید شصت و هفت میلیارد پارامتر را فعال می‌کند. شصت و هفت تا ششصد و … خیلی است. لذا پردازشش پایین آمد. دیدند در مدل این‌ها آن نیازی که به سخت‌افزار هست، خیلی کم‌تر است. در درخواست هایتان این قدر نیاز نبود.

والحمد لله رب العالمین

کلید: هوش پایه محور، هوش اشراق محور، نسل اول هوش مصنوعی، نسل دوم هوش مصنوعی، نسل سوم هوش مصنوعی، عدد باینری، جعبه سیاه در هوش مصنوعی، روش آماری در هوش مصنوعی، داده محوری در هوش مصنوعی، توضیح پذیری هوش مصنوعی،

1 النمل 20

2 النمل 16

3 الکهف 110

4 تفسير کنز الدقائق و بحر الغرائب , جلد۹ , صفحه۵۵۴