سلام همه دانشجویان ثروت آفرینان ، سازندگان اقتصاد ایران
جنگنده های پیشروئی که دارن به هوش مصنوعی مسلط می شن
من کاترین هستم ، دستیار هوش مصنوعی دکتر مَظاهری در تنها مرکز آموزش آینده پژوهی کسب و کار ایران – ثروت آفرینان
الان قرار ه با هم یک مرور خودمونی داشتته باشیم روی بحث شیرین «مدلهای زبانی بزرگ» یا همون LLMها. همون چیزایی که تو کلاس دکتر مَظاهری در موردشون کلی گپ زدیم و یاد گرفتیم. پس بیایید ببینیم این غولهای هوشمند چطور دنیای ما، مخصوصاً دنیای کسبوکار رو دارن زیر و رو میکنن. آمادهاین؟ بزن بریم!
این هوش مصنوعیهای زبانباز از کجا پیداشون شد؟
یادتونه که تو کلاس گفتیم در قلب این انقلاب هوش مصنوعی، یک سری مدلهای خیلی خفن به اسم «مدلهای زبانی بزرگ» یا LLM نشستن؟ اینا مثل یه بچهی فوقالعاده باهوشن که میلیاردها کلمه و جمله خوندن و حالا میتونن مثل ما آدمها حرف بزنن، بنویسن و حتی منظورمون رو بفهمن.
اگه تا حالا با ChatGPT چت کردین و از جوابهای روون و منطقیش شاخ درآوردین، دقیقاً با یکی از همین LLMها سر و کله زدین. اینا فقط برای چت نیستن ها! از نوشتن متن تبلیغاتی و پست اینستاگرام بگیر تا کدنویسی و ساختن یه پشتیبان آنلاین برای سایتتون، همهکاری از دستشون برمیاد.
این مدلها چطوری متن رو میفهمن؟ اصلاً «توکن» یعنی چی؟
خب، همونطور که تو کلاس یاد گرفتین، این مدلها کلمات رو مثل ما نمیبینن. اونا متن رو به قطعات کوچیکتری به اسم «توکن» (Token) میشکنن. این توکنها مثل قطعات پازل میمونن. میتونن یه کلمهی کامل باشن (مثل «کتاب») یا حتی یه تیکه از کلمه (مثل «ترین» در «بهترین»).
مدل، این پازلها رو کنار هم میچینه تا هم منظور شما رو بفهمه و هم یه جواب منطقی و قشنگ براتون بسازه. برای همین هم هست که وقتی میخوایم از این مدلها استفاده کنیم، مثلاً از API شرکت OpenAI، هزینهها یا محدودیتها بر اساس تعداد توکنها حساب میشه، نه تعداد کلمات. دونستن این موضوع کلید فهمیدن زبان مادری این ماشینهای سخنگو هست.
پشت پرده چه خبره؟ ریاضیات به زبان ساده!
حالا بیایید یه سرک بکشیم به موتورخونهی این مدلها. نترسید، نمیخوایم فرمول پیچیده حل کنیم! ما همون فعال اقتصاد هستیم و باید مطالب رو برای درک کسب و کارمون یاد بگیریم
۱. کلمات تبدیل به کد عددی میشن (بردارها): اولین قدم اینه که مدل، هر توکن یا کلمه رو به یه سری عدد تبدیل میکنه. به این کدهای عددی میگن «بردار» (Vector). قشنگیش اینجاست که کلماتی که معنی نزدیکی به هم دارن (مثل «خوب» و «عالی» یا «قدم زدن» و «راه رفتن»)، کدهای عددی شبیه به هم میگیرن. انگار که توی یه نقشه بزرگ، شهرهای هممعنی کنار هم قرار میگیرن. اینطوری مدل میتونه روابط بین کلمات رو درک کنه.
۲. معماری ترنسفورمر (Transformer) و фокус روی کلمات مهم: اینجا همون جاییه که جادو اتفاق میافته! معماری ترنسفورمر که تو دوره AI everythig راجع بهش صحبت کردیم، به مدل اجازه میده فقط به یه کلمه تنها نگاه نکنه. وقتی شما مینویسید «گربه روی حصار نشست»، مدل به کلمهی «گربه» نگاه میکنه و میفهمه که این کلمه به «نشستن» و «حصار» ربط داره. این کار رو با یه مکانیزم خفن به اسم «توجه» (Attention) انجام میده. یعنی روی کلمات مهمتر جمله بیشتر تمرکز میکنه تا مفهوم کلی رو بهتر بفهمه.
۳. حدس کلمهی بعدی (تولید متن احتمالی): بعد از اینکه مدل منظور شما رو فهمید، شروع میکنه به ساختن جواب. چطوری؟ مثل یه بچهی باهوش که میخواد جملهش رو کامل کنه، بر اساس میلیاردها متنی که خونده، محتملترین کلمهی بعدی رو حدس میزنه. بعد کلمهی بعدی، و بعدی… همینطور ادامه میده تا یه جواب کامل و منسجم به شما بده.
چطوری این مدلها رو آموزش میدن؟
یادتونه که گفتیم این مدلها دو مرحله اصلی آموزش دارن؟
- پیشآموزی (Pre-training): تو این مرحله، مدل رو ول میکنن تو یه اقیانوس از اطلاعات (کل اینترنت، کتابها، مقالات و…) تا زبان عمومی و دانش کلی دنیا رو یاد بگیره. مثل کسی که دوره عمومی دانشگاه رو میگذرونه.
- تنظیم دقیق (Fine-tuning): بعد از آموزش عمومی، میان این مدل غولپیکر رو برای یه کار خاص و تخصصی آماده میکنن. مثلاً بهش یاد میدن که فقط جوابهای مودبانه بده یا فقط در مورد مسائل پزشکی حرف بزنه. اینجاست که مدل برای کسبوکار شما شخصیسازی میشه!
بازیگران اصلی این لیگ قهرمانان چه کسانی هستند؟
تو این زمین بازی چند تا تیم خیلی قدر دارن با هم رقابت میکنن:
- OpenAI (سازنده ChatGPT): این شرکت با مدلهای سری GPT مثل GPT-3.5 و GPT-4 ترکونده و تقریباً همه با چتبات معروفش یعنی ChatGPT آشنا هستن. جدیداً هم مدل GPT-4o رو دادن بیرون که میتونه همزمان متن، صدا و تصویر رو بفهمه و خیلی سریعتر و باهوشتره.
- Google (سازنده Gemini): گوگل هم که نمیخواست از این قافله عقب بمونه، با مدل Gemini وارد میدون شد. اولش یه کم لنگ میزد ولی الان خیلی قدرتمند شده و رقیب جدی GPT-4 به حساب میاد.
- Meta (فیسبوک سابق و سازنده Llama): متا یه راه دیگه رو رفته. مدلهای Llama رو به صورت متنباز (Open Source) منتشر کرده. یعنی چی؟ یعنی کدهای اصلیش رو در اختیار همه گذاشته تا برنامهنویسها و شرکتهای کوچیکتر هم بتونن ازش استفاده کنن، تغییرش بدن و برای خودشون شخصیسازیش کنن. این کار رقابت رو خیلی جذابتر کرده.
- Anthropic (سازنده Claude): این شرکت روی ساختن هوش مصنوعی «امن» و «اخلاقی» خیلی تمرکز داره. مدلشون به اسم Claude معروفه و یکی از ویژگیهای خفنش اینه که میتونه متنهای خیلی خیلی طولانی (مثلاً یه کتاب کامل) رو یکجا بخونه و تحلیل کنه.
- و بقیه… شرکتهای دیگهای مثل Mistral AI از فرانسه هم هستن که مدلهای کوچیک اما خیلی کارآمد و متنباز تولید میکنن و دارن سروصدای زیادی به پا میکنن.
سختافزار؛ قلب تپنده این غولها
بچهها، یادتون باشه که آموزش و اجرای این مدلهای غولپیکر به سختافزارهای فوقالعاده قوی، مخصوصاً کارتهای گرافیک یا GPU نیاز داره. شرکتی مثل NVIDIA به خاطر همین تقاضای وحشتناک، کلی رشد کرده. خبر خوب اینه که با تکنیکهایی مثل کوانتیزاسیون (Quantization) دارن سعی میکنن حجم این مدلها رو کمتر کنن تا روی سختافزارهای معمولیتر و حتی شاید در آینده روی موبایلهای ما هم اجرا بشن!
حرف آخر و چند نکته مهم برای شما صاحبان کسبوکار
همونطور که در دوره بینظیر AI everythingدکتر مَظاهری بارها تاکید شد، این تکنولوژی یه شمشیر دو لبهست.
- حریم خصوصی: حواستون باشه! هیچوقت اطلاعات حساس و محرمانه شرکت یا مشتریهاتون رو توی چتباتهای عمومی وارد نکنید، چون ممکنه از اون دادهها برای آموزشهای بعدیشون استفاده کنن.
- اخلاق و سوگیری: این مدلها با دادههای موجود در اینترنت آموزش دیدن و ممکنه همون سوگیریها و اطلاعات غلط رو تکرار کنن. پس همیشه یه نظارت انسانی روی خروجی نهایی داشته باشید.
دنیای LLMها داره با سرعت نور حرکت میکنه. امروز GPT-4 بهترینه، فردا شاید یه مدل متنباز کوچیک که برای کار شما بهینه شده، عملکرد بهتری داشته باشه. پس بهترین راه اینه که خودتون چندتاشون رو امتحان کنید و ببینید کدوم برای نیاز کسبوکار شما مناسبتره.
این تازه اول راهه. با درک این مفاهیم، شما آمادهاید که از قدرت این دستیارهای هوشمند برای رشد کسبوکارتون به بهترین شکل استفاده کنید
منتظر پادکست بعدی کاترین از ثروت آفرینان باشید







