پرش به محتویات

LLM

DeepSeek

با این آموزش میتونید هوش مصنوعی DeepSeek رو به شکل لوکال و آفلاین روی لپ تاپتون اجرا کنید. اینطوری سانسور هم ندارید. کلا به غیر از مرحله دانلود دیتا, ۲ دقیقه هم وقت نمیگیره.

خلاصش اینکه: ۱- از اینجا ollama رو دانلود کنید تا در نهایت cli رو نصب کنه واستون https://ollama.com/download

۲- بعد که خط فرمان نصب شد, از هر ترمینالی که دارید یکی از این مدل هارو نصب کنید. بهترینش همون 70b هست ولی سخت افزار خیلی قوی میخواید. جهت تست میتونید اولی رو بگیرید که حدود ۱ گیگ دانلود داره. منم اولی رو فقط گرفتم بعد دونه دونه برم جلو ببینم چی برام جوابه😁

pic

ستورات نصب مدل های مختلف: 1.5B version (smallest): ollama run deepseek-r1:1.5b

8B version: ollama run deepseek-r1:8b

14B version: ollama run deepseek-r1:14b

32B version: ollama run deepseek-r1:32b

70B version (biggest/smartest): ollama run deepseek-r1:70b

۳- بعد این برنامه که رابط گرافیکی هست رو نصب کنید https://chatboxai.app مدل رو بذارید روی OLLAMA از اون پایین هم, چیزی که دانلود کردید رو انتخاب کنید. خودکار هرچی باشه رو نشون میده. بعد سیو کنید و تماااامم

pic

MehdiAllahyari

خیلی راحت میتونید مدلهای جدید deepseek را دانلود و امتحان کنید. و خودتون ببینید که چقدر به کارتون میاد. توی ویدیوی زیر نشون دادم.

من ۳ تا از مدلهای deepseek از جمله دوتا ورژن ۱.۵ میلیارد پارامتری و مدل ۷میلیاردی را امتحان کردم. چند تا سوال که بیشتر coding بودن پرسیدم و همگی خیلی بد جواب دادند. البته مدل ۷b خیلی بهتر بود ولی کد بازهم غلط بود. بعد همین سوالها را از Qwen ۱.۵ میلیاردی پرسیدم و عالی جواب داد. البته که چندتا سوال خیلی ارزیابی کاملی نیست ولی بازهم انتظارم خیلی بیشتر از اینها بود. میخام بگم که درسته که این مدلهای deepseek خیلی سروصدا کرده ولی مدلهای کوچک که ازش distill شدن خیلی خوب کار نمیکنن بخصوص تو coding. اون مدلهای بزرگترش البته خیلی خوبند.
نتیجه اخلاقی: خیلی به hype توجه نکنید. هر مدلی هم برای همه جور کاری خوب نیست. این مدلهای reasoning بدرد سوالهای ریاضی و اینجور مباحث میخورن. مثلا برای کدینگ خیلی مدلهای کوچکتر ولی به مراتب بهتر هست. پس خودتون را وابسته به یک مدل خاص نکنید.

https://x.com/MehdiAllahyari/status/1884087472939803011

Qwen 2.5-Max

چت‌بات هوش‌مصنوعی Qwen 2.5-Max با پشتیبانی از زبان فارسی در دسترس عموم (نیاز به ثبت نام با ایمیل) قرار گرفت.

شرکت چینی علی‌بابا ادعا داره که این هوش‌مصنوعی حتی از DeepSeek هم قویتر و پیشرفته‌تر هست!

🌐لینک ورود به این چت‌بات: https://chat.qwenlm.ai

pic

GPT Crawler

Crawl a site to generate knowledge files to create your own custom GPT from one or multiple URLs

https://github.com/BuilderIO/gpt-crawler

google

گوگل روزانه ۱ میلیون توکن رایگان برای استفاده از API های Gemini بهتون میده، توی مدل جدید 2.5 ولی به ۲۵ درخواست در روز محدود هست، میتونید واسه کارهای سنگین‌تر ازش استفاده کنید. من نمیگم ولی بعضی‌ها با اکانت‌های مختلف چند تا کلید API باهاش میسازن.

pic

https://x.com/MrSoroushAhmadi/status/1908448978997223915