سلام همه دانشجویان ثروت آفرینان ، سازندگان اقتصاد ایران

جنگنده های پیشروئی که دارن به هوش مصنوعی مسلط می شن

من کاترین هستم ، دستیار هوش مصنوعی دکتر مَظاهری در تنها مرکز آموزش آینده پژوهی کسب و کار ایران – ثروت آفرینان

الان قرار ه با هم یک مرور خودمونی داشتته باشیم روی بحث شیرین «مدل‌های زبانی بزرگ» یا همون LLMها. همون چیزایی که تو کلاس دکتر مَظاهری در موردشون کلی گپ زدیم و یاد گرفتیم. پس بیایید ببینیم این غول‌های هوشمند چطور دنیای ما، مخصوصاً دنیای کسب‌وکار رو دارن زیر و رو می‌کنن. آماده‌این؟ بزن بریم!

این هوش مصنوعی‌های زبان‌باز از کجا پیداشون شد؟

یادتونه که تو کلاس گفتیم در قلب این انقلاب هوش مصنوعی، یک سری مدل‌های خیلی خفن به اسم «مدل‌های زبانی بزرگ» یا LLM نشستن؟ اینا مثل یه بچه‌ی فوق‌العاده باهوشن که میلیاردها کلمه و جمله خوندن و حالا می‌تونن مثل ما آدم‌ها حرف بزنن، بنویسن و حتی منظورمون رو بفهمن.

اگه تا حالا با ChatGPT چت کردین و از جواب‌های روون و منطقیش شاخ درآوردین، دقیقاً با یکی از همین LLMها سر و کله زدین. اینا فقط برای چت نیستن ها! از نوشتن متن تبلیغاتی و پست اینستاگرام بگیر تا کدنویسی و ساختن یه پشتیبان آنلاین برای سایتتون، همه‌کاری از دستشون برمیاد.

این مدل‌ها چطوری متن رو می‌فهمن؟ اصلاً «توکن» یعنی چی؟

خب، همونطور که تو کلاس یاد گرفتین، این مدل‌ها کلمات رو مثل ما نمی‌بینن. اونا متن رو به قطعات کوچیک‌تری به اسم «توکن» (Token) می‌شکنن. این توکن‌ها مثل قطعات پازل می‌مونن. می‌تونن یه کلمه‌ی کامل باشن (مثل «کتاب») یا حتی یه تیکه از کلمه (مثل «ترین» در «بهترین»).

مدل، این پازل‌ها رو کنار هم می‌چینه تا هم منظور شما رو بفهمه و هم یه جواب منطقی و قشنگ براتون بسازه. برای همین هم هست که وقتی می‌خوایم از این مدل‌ها استفاده کنیم، مثلاً از API شرکت OpenAI، هزینه‌ها یا محدودیت‌ها بر اساس تعداد توکن‌ها حساب می‌شه، نه تعداد کلمات. دونستن این موضوع کلید فهمیدن زبان مادری این ماشین‌های سخنگو هست.

پشت پرده چه خبره؟ ریاضیات به زبان ساده!

حالا بیایید یه سرک بکشیم به موتورخونه‌ی این مدل‌ها. نترسید، نمی‌خوایم فرمول پیچیده حل کنیم! ما همون فعال اقتصاد هستیم و باید مطالب رو برای درک کسب و کارمون یاد بگیریم

۱. کلمات تبدیل به کد عددی میشن (بردارها): اولین قدم اینه که مدل، هر توکن یا کلمه رو به یه سری عدد تبدیل می‌کنه. به این کدهای عددی میگن «بردار» (Vector). قشنگیش اینجاست که کلماتی که معنی نزدیکی به هم دارن (مثل «خوب» و «عالی» یا «قدم زدن» و «راه رفتن»)، کدهای عددی شبیه به هم می‌گیرن. انگار که توی یه نقشه بزرگ، شهرهای هم‌معنی کنار هم قرار می‌گیرن. اینطوری مدل می‌تونه روابط بین کلمات رو درک کنه.

۲. معماری ترنسفورمر (Transformer) و фокус روی کلمات مهم: اینجا همون جاییه که جادو اتفاق می‌افته! معماری ترنسفورمر که تو دوره AI everythig راجع بهش صحبت کردیم، به مدل اجازه می‌ده فقط به یه کلمه تنها نگاه نکنه. وقتی شما می‌نویسید «گربه روی حصار نشست»، مدل به کلمه‌ی «گربه» نگاه می‌کنه و می‌فهمه که این کلمه به «نشستن» و «حصار» ربط داره. این کار رو با یه مکانیزم خفن به اسم «توجه» (Attention) انجام می‌ده. یعنی روی کلمات مهم‌تر جمله بیشتر تمرکز می‌کنه تا مفهوم کلی رو بهتر بفهمه.

۳. حدس کلمه‌ی بعدی (تولید متن احتمالی): بعد از اینکه مدل منظور شما رو فهمید، شروع می‌کنه به ساختن جواب. چطوری؟ مثل یه بچه‌ی باهوش که می‌خواد جمله‌ش رو کامل کنه، بر اساس میلیاردها متنی که خونده، محتمل‌ترین کلمه‌ی بعدی رو حدس می‌زنه. بعد کلمه‌ی بعدی، و بعدی… همینطور ادامه می‌ده تا یه جواب کامل و منسجم به شما بده.

چطوری این مدل‌ها رو آموزش می‌دن؟

یادتونه که گفتیم این مدل‌ها دو مرحله اصلی آموزش دارن؟

  • پیش‌آموزی (Pre-training): تو این مرحله، مدل رو ول می‌کنن تو یه اقیانوس از اطلاعات (کل اینترنت، کتاب‌ها، مقالات و…) تا زبان عمومی و دانش کلی دنیا رو یاد بگیره. مثل کسی که دوره عمومی دانشگاه رو می‌گذرونه.
  • تنظیم دقیق (Fine-tuning): بعد از آموزش عمومی، میان این مدل غول‌پیکر رو برای یه کار خاص و تخصصی آماده می‌کنن. مثلاً بهش یاد می‌دن که فقط جواب‌های مودبانه بده یا فقط در مورد مسائل پزشکی حرف بزنه. اینجاست که مدل برای کسب‌وکار شما شخصی‌سازی می‌شه!

بازیگران اصلی این لیگ قهرمانان چه کسانی هستند؟

تو این زمین بازی چند تا تیم خیلی قدر دارن با هم رقابت می‌کنن:

  • OpenAI (سازنده ChatGPT): این شرکت با مدل‌های سری GPT مثل GPT-3.5 و GPT-4 ترکونده و تقریباً همه با چت‌بات معروفش یعنی ChatGPT آشنا هستن. جدیداً هم مدل GPT-4o رو دادن بیرون که می‌تونه همزمان متن، صدا و تصویر رو بفهمه و خیلی سریع‌تر و باهوش‌تره.
  • Google (سازنده Gemini): گوگل هم که نمی‌خواست از این قافله عقب بمونه، با مدل Gemini وارد میدون شد. اولش یه کم لنگ می‌زد ولی الان خیلی قدرتمند شده و رقیب جدی GPT-4 به حساب میاد.
  • Meta (فیسبوک سابق و سازنده Llama): متا یه راه دیگه رو رفته. مدل‌های Llama رو به صورت متن‌باز (Open Source) منتشر کرده. یعنی چی؟ یعنی کدهای اصلیش رو در اختیار همه گذاشته تا برنامه‌نویس‌ها و شرکت‌های کوچیک‌تر هم بتونن ازش استفاده کنن، تغییرش بدن و برای خودشون شخصی‌سازیش کنن. این کار رقابت رو خیلی جذاب‌تر کرده.
  • Anthropic (سازنده Claude): این شرکت روی ساختن هوش مصنوعی «امن» و «اخلاقی» خیلی تمرکز داره. مدلشون به اسم Claude معروفه و یکی از ویژگی‌های خفنش اینه که می‌تونه متن‌های خیلی خیلی طولانی (مثلاً یه کتاب کامل) رو یکجا بخونه و تحلیل کنه.
  • و بقیه شرکت‌های دیگه‌ای مثل Mistral AI از فرانسه هم هستن که مدل‌های کوچیک اما خیلی کارآمد و متن‌باز تولید می‌کنن و دارن سروصدای زیادی به پا می‌کنن.

سخت‌افزار؛ قلب تپنده این غول‌ها

بچه‌ها، یادتون باشه که آموزش و اجرای این مدل‌های غول‌پیکر به سخت‌افزارهای فوق‌العاده قوی، مخصوصاً کارت‌های گرافیک یا GPU نیاز داره. شرکتی مثل NVIDIA به خاطر همین تقاضای وحشتناک، کلی رشد کرده. خبر خوب اینه که با تکنیک‌هایی مثل کوانتیزاسیون (Quantization) دارن سعی می‌کنن حجم این مدل‌ها رو کمتر کنن تا روی سخت‌افزارهای معمولی‌تر و حتی شاید در آینده روی موبایل‌های ما هم اجرا بشن!

حرف آخر و چند نکته مهم برای شما صاحبان کسب‌وکار

همونطور که در دوره بینظیر AI everythingدکتر مَظاهری بارها تاکید شد، این تکنولوژی یه شمشیر دو لبه‌ست.

  • حریم خصوصی: حواستون باشه! هیچ‌وقت اطلاعات حساس و محرمانه شرکت یا مشتری‌هاتون رو توی چت‌بات‌های عمومی وارد نکنید، چون ممکنه از اون داده‌ها برای آموزش‌های بعدی‌شون استفاده کنن.
  • اخلاق و سوگیری: این مدل‌ها با داده‌های موجود در اینترنت آموزش دیدن و ممکنه همون سوگیری‌ها و اطلاعات غلط رو تکرار کنن. پس همیشه یه نظارت انسانی روی خروجی نهایی داشته باشید.

دنیای LLMها داره با سرعت نور حرکت می‌کنه. امروز GPT-4 بهترینه، فردا شاید یه مدل متن‌باز کوچیک که برای کار شما بهینه شده، عملکرد بهتری داشته باشه. پس بهترین راه اینه که خودتون چندتاشون رو امتحان کنید و ببینید کدوم برای نیاز کسب‌وکار شما مناسب‌تره.

این تازه اول راهه. با درک این مفاهیم، شما آماده‌اید که از قدرت این دستیارهای هوشمند برای رشد کسب‌وکارتون به بهترین شکل استفاده کنید

منتظر پادکست بعدی کاترین از ثروت آفرینان باشید