LLM
DeepSeek
با این آموزش میتونید هوش مصنوعی DeepSeek رو به شکل لوکال و آفلاین روی لپ تاپتون اجرا کنید. اینطوری سانسور هم ندارید. کلا به غیر از مرحله دانلود دیتا, ۲ دقیقه هم وقت نمیگیره.
خلاصش اینکه: ۱- از اینجا ollama رو دانلود کنید تا در نهایت cli رو نصب کنه واستون https://ollama.com/download
۲- بعد که خط فرمان نصب شد, از هر ترمینالی که دارید یکی از این مدل هارو نصب کنید. بهترینش همون 70b هست ولی سخت افزار خیلی قوی میخواید. جهت تست میتونید اولی رو بگیرید که حدود ۱ گیگ دانلود داره. منم اولی رو فقط گرفتم بعد دونه دونه برم جلو ببینم چی برام جوابه😁
ستورات نصب مدل های مختلف: 1.5B version (smallest): ollama run deepseek-r1:1.5b
8B version: ollama run deepseek-r1:8b
14B version: ollama run deepseek-r1:14b
32B version: ollama run deepseek-r1:32b
70B version (biggest/smartest): ollama run deepseek-r1:70b
۳- بعد این برنامه که رابط گرافیکی هست رو نصب کنید https://chatboxai.app مدل رو بذارید روی OLLAMA از اون پایین هم, چیزی که دانلود کردید رو انتخاب کنید. خودکار هرچی باشه رو نشون میده. بعد سیو کنید و تماااامم
MehdiAllahyari
خیلی راحت میتونید مدلهای جدید deepseek را دانلود و امتحان کنید. و خودتون ببینید که چقدر به کارتون میاد. توی ویدیوی زیر نشون دادم.
من ۳ تا از مدلهای deepseek از جمله دوتا ورژن ۱.۵ میلیارد پارامتری و مدل ۷میلیاردی را امتحان کردم. چند تا سوال که بیشتر coding بودن پرسیدم و همگی خیلی بد جواب دادند. البته مدل ۷b خیلی بهتر بود ولی کد بازهم غلط بود. بعد همین سوالها را از Qwen ۱.۵ میلیاردی پرسیدم و عالی جواب داد. البته که چندتا سوال خیلی ارزیابی کاملی نیست ولی بازهم انتظارم خیلی بیشتر از اینها بود.
میخام بگم که درسته که این مدلهای deepseek خیلی سروصدا کرده ولی مدلهای کوچک که ازش distill شدن خیلی خوب کار نمیکنن بخصوص تو coding. اون مدلهای بزرگترش البته خیلی خوبند.
نتیجه اخلاقی: خیلی به hype توجه نکنید. هر مدلی هم برای همه جور کاری خوب نیست. این مدلهای reasoning بدرد سوالهای ریاضی و اینجور مباحث میخورن. مثلا برای کدینگ خیلی مدلهای کوچکتر ولی به مراتب بهتر هست. پس خودتون را وابسته به یک مدل خاص نکنید.
https://x.com/MehdiAllahyari/status/1884087472939803011
Qwen 2.5-Max
چتبات هوشمصنوعی Qwen 2.5-Max با پشتیبانی از زبان فارسی در دسترس عموم (نیاز به ثبت نام با ایمیل) قرار گرفت.
شرکت چینی علیبابا ادعا داره که این هوشمصنوعی حتی از DeepSeek هم قویتر و پیشرفتهتر هست!
🌐لینک ورود به این چتبات: https://chat.qwenlm.ai
GPT Crawler
Crawl a site to generate knowledge files to create your own custom GPT from one or multiple URLs
https://github.com/BuilderIO/gpt-crawler
گوگل روزانه ۱ میلیون توکن رایگان برای استفاده از API های Gemini بهتون میده، توی مدل جدید 2.5 ولی به ۲۵ درخواست در روز محدود هست، میتونید واسه کارهای سنگینتر ازش استفاده کنید. من نمیگم ولی بعضیها با اکانتهای مختلف چند تا کلید API باهاش میسازن.