خبر و ترفند روز

خبر و ترفند های روز را اینجا بخوانید!

من نمی توانم از طریق اپراتور چتپپ بپردازم ، بنابراین به جای آن از این گزینه جایگزین منبع آزاد استفاده می کنم

عوامل هوش مصنوعی که می توانند یک مرورگر وب را کنترل کنند و وظایف خود را انجام دهند ، دقیقاً مانند انسان ، دیگر محدود به مفهوم نیستند. ابزارهایی مانند اپراتور ChatGPT قدرتمند هستند اما با قیمت همراه هستند. به جای پرداخت هزینه ، من به دنبال یک گزینه جایگزین رایگان رفتم – و یکی از مواردی را پیدا کردم که به طرز شگفت انگیزی کار می کند.

عوامل هوش مصنوعی که می توانند یک مرورگر وب را کنترل کنند و وظایف خود را انجام دهند ، دقیقاً مانند انسان ، دیگر محدود به مفهوم نیستند. ابزارهایی مانند اپراتور ChatGPT قدرتمند هستند اما با قیمت همراه هستند. به جای پرداخت هزینه ، من به دنبال یک گزینه جایگزین رایگان رفتم – و یکی از مواردی را پیدا کردم که به طرز شگفت انگیزی کار می کند.

استفاده از مرورگر: بهترین جایگزین منبع باز که پیدا کردم

اپراتور ChatGPT می تواند یک مرورگر وب را کنترل کرده و اقداماتی مانند کلیک و پیمایش همه را به خودی خود انجام دهد. شما فقط باید به Chatgpt بگویید که چه کاری باید انجام شود ، مانند رزرو بلیط یا نوشتن متن در Google Docs ، و این کار را انجام می دهد. اما برای دستیابی به دسترسی ، باید به عنوان بخشی از Pro Pro Chatgpt ، 200 دلار در هر ماه پرداخت کند. من نتوانستم این اشتراک را خریداری کنم ، و به دنبال یک گزینه جایگزین رفتم و در مورد استفاده از مرورگر پیدا کردم.

ربات عامل AI خودمختار که در مرکز تماس نشسته است.

عوامل هوش مصنوعی می توانند به شما در حل مشکلات پیچیده کمک کنند ، اما چگونه آنها واقعاً کار می کنند؟

استفاده مرورگر یک عامل هوش مصنوعی منبع باز شبیه به اپراتور ChatGPT است. این می تواند با یک مرورگر وب تعامل داشته باشد ، از طریق وب سایت ها حرکت کند و اقدامات را انجام دهد. با این حال ، فقط بخشی از پیشنهاد چتپپ هزینه دارد. علاوه بر این ، دو گزینه برای انتخاب وجود دارد.

مطلب مرتبط:   چرا آیفون ها نسبت به دستگاه های اندرویدی از رم کمتری استفاده می کنند؟

گزینه اول پرداخت اشتراک 30 دلاری است که عامل AI را در سرویس ابری آنها اجرا می کند. گزینه دیگر این است که خود را به صورت محلی تنظیم کنید و کمترین هزینه آن را دارد (شما فقط برای استفاده API شارژ می شوید). من با مقرون به صرفه ترین گزینه رفتم.

وب سایت استفاده از مرورگر با نمایش برنامه های مختلف قیمت گذاری افتتاح شد

تنظیم استفاده از مرورگر به اندازه اپراتور Chatgpt ساده نیست ، اما با چند خط کد ، من آن را بالا و در حال اجرا کردم. اگر می توانستم این کار را انجام دهم ، شما هم می توانید!

نحوه تنظیم استفاده مرورگر در رایانه شخصی

برای شروع ، به دو چیز نیاز خواهید داشت: Python 3.11 که بر روی رایانه خود نصب شده و API از OpenAI (یا در صورت تمایل یک LLM میزبان محلی) نصب شده است.

از آنجا که استفاده از مرورگر یک عامل هوش مصنوعی است ، برای عملکرد به یک مدل بزرگ زبان (LLM) نیاز دارد. برای این کار ، می توانید دسترسی API را از وب سایت OpenAi یا هر API دیگری که با استفاده از مرورگر کار می کند ، دریافت کنید. فواید استفاده از API این است که شما می توانید انعطاف پذیری بین مدلهای مختلف (مانند GPT-5.5 و GPT-4) را انتخاب کنید ، و فقط باید هزینه آنچه را که استفاده می کنید بپردازید-به طور مشترک از هزینه اشتراک مقدماتی.

در آزمایش من از مدل Chatgpt 4-O استفاده کردم. من برای هر هفت کار که از مرورگر خواسته ام که انجام دهم ، کمتر از 1 دلار هزینه کردم. با این حال ، اگر آن را با API Deepseek جفت کنید ، چندین برابر ارزان تر خواهد بود.

همچنین می توانید از LLM محلی در رایانه خود استفاده کنید. با این حال ، اجرای یک LLM محلی قابل مقایسه با ChatGPT 4-O به قدرت محاسباتی قابل توجهی نیاز دارد ، که احتمالاً بیشتر افراد از آن برخوردار نیستند. من مدل 7B LLM Deepseek را روی رایانه خود آزمایش کردم و عملکرد به طرز شگفت آور بد بود. بنابراین ، من توصیه می کنم فعلاً با یک API بچسبید.

مطلب مرتبط:   نحوه دانلود و نصب Auto-GPT گام به گام

پس از دستیابی به API ، می توانید با مراجعه به> پالت فرمان و تایپ ایجاد محیط ، یک محیط مجازی را در کد vs ایجاد کنید. سپس ، یک ترمینال جدید را باز کرده و با استفاده از PIP مرورگر را نصب کنید.

pip install browser-use

یک فایل .env را در داخل پوشه ایجاد کرده و کلید API خود را اضافه کنید.

OPENAI_API_KEY="Your API Here"

یک فایل جدید Python با نام App.py ایجاد کنید و کد زیر را بچسبانید.

pip install browser-use
OPENAI_API_KEY="Your API Here"
from langchain_openai import ChatOpenAI

from browser_use import Agent

import asyncio

from dotenv import load_dotenv

load_dotenv()



async def main():

    agent = Agent(

        task="Go to Reddit, search for 'browser-use', click on the first post and return the first comment.",

        llm=ChatOpenAI(model="gpt-4o"),

    )

    result = await agent.run()

    print(result)



asyncio.run(main())

سریع را با خود جایگزین کنید ، مانند “جستجوی آلبرت انیشتین و صفحه ویکی پدیا خود را باز کنید.” در آخر ، پرونده App.py Python را با استفاده از ترمینال اجرا کنید.

python app.py

قرار دادن آن در آزمون: آیا مطابق انتظارات است؟

من آزمایش خود را با کارهای ساده ، مانند Googling “آلبرت انیشتین” و باز کردن صفحه ویکی پدیا خود شروع کردم. وقتی فیلمنامه را اجرا کردم ، نماینده AI یک پنجره مرورگر جدید باز کرد و کار را بی عیب و نقص اجرا کرد.

در مرحله بعد ، من از آن خواستم تا لپ تاپ های بازی را در آمازون جستجو کند و نتیجه اول را باز کند. باز هم ، نماینده هوش مصنوعی کار را با موفقیت انجام داد.

در این مرحله ، من متقاعد شدم كه استفاده از مرورگر می تواند با هوشمندی در وب حرکت کند. برای فشار بیشتر ، من به آن دستور دادم که از یاهو نیوز بازدید کند و پنج مقاله برتر را خلاصه کند. در کمال تعجب ، استفاده از مرورگر می تواند طی چند دقیقه کار را انجام دهد. خلاصه ها کوتاه و تا حدودی بود. نتایج زیر را می توانید مشاهده کنید.

مطلب مرتبط:   توهم هوش مصنوعی چیست و چگونه آن را تشخیص می دهید؟

با این حال ، هنگامی که من از آن خواستم پرواز را از لندن به پاریس در Skyscanner.com جستجو کند ، برای استفاده از مرورگر مشکل شد. در ابتدا ، این وب سایت به دلیل تشخیص ربات ، دسترسی را مسدود کرد ، بنابراین مجبور شدم از تشخیص ربات مداخله و دور بزنم. با این حال ، استفاده از مرورگر تلاش می کند – بدون وارد کردن صحیح وارد “لندن” و “پاریس” در قسمت های مربوطه ، روی دکمه جستجو کلیک کرد.

شما می توانید استفاده از مرورگر را با مرورگر اصلی خود ، جایی که تمام حساب های شما وارد سیستم شده است ، جفت کنید. این به نماینده هوش مصنوعی اجازه می دهد تا داده ها را به یک برگه Google وارد کند یا خلاصه اخبار Yahoo را در یک Doc Google قرار دهد. با این حال ، من با مرورگر فعال خود به موضوعاتی رسیدم ، بنابراین فعلاً آن را به حالت تعلیق درآوردم.

در کل ، این یک آزمایش سرگرم کننده بود. تماشای یک عامل هوش مصنوعی در وب و انجام وظایف بسیار جذاب بود. در حالی که استفاده از مرورگر کامل نیست ، اما از یک عامل هوش مصنوعی جامد دور نیست که می تواند وب را مرور کند.

با این حال ، این فناوری در مراحل ابتدایی خود است ، بنابراین می توانیم انتظار پیشرفت در آینده را داشته باشیم.

در حال حاضر ، اگر شما مایل به راه اندازی آن هستید و به سکسکه های گاه به گاه توجه نکنید ، رایانه خود را بوت کنید و استفاده از مرورگر را نصب کنید. اگر گیر کرده اید و به یک دست کمک نیاز دارید ، می توانید آن را در موضوعات ذکر کنید.